V
主页
清华ChatGLM2-6b新模型升级,支持32K上下文的强性能模型!
发布人
清华ChatGLM2-6b新模型升级,支持32K上下文的强性能模型!#小工蚁 #chatglm2
打开封面
下载高清视频
观看高清视频
视频下载器
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
LangGraph Autogen CrewAI 哪个Agent框架更好?#小工蚁
训练LLM通过强化学习进行自我纠正 #小工蚁
清华ChatGLM2中英文LLM 2代模型发布,性能大幅提升
表格式out!大模型最爱JSON,你了解吗?
Qwen2-72B大模型推理性能对比 4张RTX4090对比2张L20
Jina Embedding v3开源多语言嵌入大模型
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
Qwen2-7B-Instruct不同量化方法准确度和性能比较
TGI让Huggingface Transformer推理速度提升10倍,本地演示 #小工蚁 #huggingface
M3E中文文本嵌入模型:替代OpenAI text-embedding-ada-002的最佳选择
如何让清华ChatGLM2-6b模型推理性能提升20倍? #小工蚁 #chatglm2
清华开源ChatGLM2-6B安装使用 手把手教程,轻松掌握
A16z风投对企业软件最新预测 替代劳动力,前景巨大 #小工蚁
重磅!ChatGLM2-6B可免费商用,免费中英文大模型有多一种选择 #小工蚁 #chatglm2
国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁
LongCite让大模型精准找到引用,智能回答更准确 #小工蚁
多跳智能问答EfficientRAG更胜一筹 #小工蚁
阿里发布Text2SQL最新实践开源模型准确度超GPT4
ChatGLM2如何进行微调?SSF RLHF QLora #小工蚁
LLM如何接入到个人微信? 演示群聊中AI自动回复
MemLong:提高大模型上下文的“外挂” #小工蚁
清华智谱开源生成视频大模型CogVideo
清华发布CodeGeeX2生成代码大模型,它性能究竟如何? #小工蚁 #清华 #codegeex
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
Embedding模型8bit量化推理 成本下降4倍,准确度下降0.7%
百川2大语言模型推理加速 对比实验测试,性能提升100倍
为什么说AI芯片的最大问题不是算力,而是内存带宽? #小工蚁 #英伟达
ChatGLM2如何进行模型微调演示 #小工蚁 #chatglm2
使用长上下文嵌入模型实现 延迟划块,提高RAG准确率
BCE Embedding开源大模型 RAG应用准确度提升关键
清华校长和罗斯柴尔德家族
上海人工智能实验室InternLM-7B模型升级,增强Tools使用能力 #小工蚁
多模态RAG检索增强生成2种实现方式 #小工蚁
让Mixtral-8*7B模型运行在16GB显存GPU上 #小工蚁
突破极限:Yi-VL多模态模型惊艳亮相,推理加速性能压测演示 #小工蚁
超越GPT3.5开源模型Mixtral 真来了,可免费商用
大模型微调训练实践 准确度10%提升至90%
VLM多模态开源大模型发展迅速 下半年将成为主流