V
主页
京东 11.11 红包
AWQ和GPTQ大模型4bit量化 哪种算法更优?#小工蚁
发布人
AWQ和GPTQ大模型4bit量化 哪种算法更优?#小工蚁
打开封面
下载高清视频
观看高清视频
视频下载器
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
用GPTQ算法量化大型模型 大幅减少GPU使用并提高准确率
Transformers支持3种量化算法性能对比 #小工蚁
多模态Embedding开源模型 Visualized BGE #小工蚁
AutoLabel:自动标注,比人快100倍,准确度和人一样!#小工蚁 #大语言模型
大模型量化技术概述
Qwen2-7B-Instruct不同量化方法准确度和性能比较
清华发布SmartMoE一种高效训练专家模型网络算法 #小工蚁 #清华 #MoE
哪种模型偏好微调最优?DPO、IPO、KTO算法 #小工蚁
M3E中文文本嵌入模型:替代OpenAI text-embedding-ada-002的最佳选择
HippoRAG中仿人脑海马体PPR算法实现 #小工蚁
人类反馈强化学习最新替代方法SimPO #小工蚁
传统推荐算法遇强敌:LLM微调后的表现如何?中科大和谷歌为你解答!#小工蚁 #llm #推荐系统
将新鲜知识注入大型语言模型:只需一个命令!#小工蚁 #rome
多跳智能问答EfficientRAG更胜一筹 #小工蚁
合并同源模型权重获得新能力,阿里开源DARE算法 #小工蚁
具备反思能力智能体算法当前哪种最强?#小工蚁
仿人脑海马体HippoRAG智能问答准确度提升 20% #小工蚁
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
开源最强VLM Molmo #小工蚁
训练写万字长文大语言模型实践 #小工蚁
IRCoT多次推理检索RAG算法 #小工蚁
FinGPT: 轻量级适应在金融领域高效LLM解决方案 #小工蚁 #chatglm #chatgpt
开源AI生成声音和音乐大模型AudioLDM2 #小工蚁
大语言模型快速JSON解码算法 Jump Forward Decoding #小工蚁
阿里发布Text2SQL最新实践开源模型准确度超GPT4
谷歌开源时间序列大模型 直接使用不需要训练 #小工蚁
多模态模型应用:设计图生成网页,哪个模型最强? #小工蚁
商汤开源Piccolo2大模型有啥亮点?#小工蚁
如何提高垂直领域RAG准确率? #小工蚁
构建多模态RAG应用实践 #小工蚁
llama.cpp大神实现投机采样,让大模型推理性能直接翻倍 #小工蚁
如何测试大模型推理加速?通义千问和百川2模型测试对比 #小工蚁
统一Embedding模型增强 大语言模型能力 #小工蚁
LightRAG一种简单高效的RAG新方法 #小工蚁
RankRAG英伟达检索增强生成算法 #小工蚁 多个测试数据集准确率SoTA
如何让大语言模型Qwen-7b使用Langchain中的工具? #小工蚁 #qwen7b
UC伯克利大模型调用函数排行榜,准确率高吗?#小工蚁
LangGraph Autogen CrewAI 哪个Agent框架更好?#小工蚁
OCR-2.0开源小模型实现OCR端到端应用 #小工蚁 #pdf转markdown