V
主页
京东 11.11 红包
大模型量化技术概述
发布人
大模型量化技术概述
打开封面
下载高清视频
观看高清视频
视频下载器
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
了解大语言模型技术细节(1/3)
Qwen2-7B-Instruct不同量化方法准确度和性能比较
Embedding模型8bit量化推理 成本下降4倍,准确度下降0.7%
阿里发布Text2SQL最新实践开源模型准确度超GPT4
用GPTQ算法量化大型模型 大幅减少GPU使用并提高准确率
M3E中文文本嵌入模型:替代OpenAI text-embedding-ada-002的最佳选择
清华智谱开源视觉大模型 CogVLM,可免费商用
人工智能在制造行业应用场景(1/2)
NL2SQL大模型生成SQL调研报告
DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache?
多模态Embedding开源模型 Visualized BGE #小工蚁
Reflection开源,让大模型学习“反思”
中文ChatGLM-6B预训练模型 5.2万提示指令微调演示
近期开源VLM大模型介绍 #小工蚁
大模型微调训练实践 准确度10%提升至90%
LangGraph Autogen CrewAI 哪个Agent框架更好?#小工蚁
LLM部署在生产环境优化(1/3)模型量化
从 SAM 到 FastSAM:中科院团队成功实现通用视觉模型速度革命
开源最强生成代码大模型WizardCoder开箱评测,性能究竟如何?
智源公开大模型SFT训练数据集微调后性能达到和超过GPT4
矢量数据库对比和选择指南
大模型提示工程技术 调研报告(上)
人工智能在企业数字化转型 二大应用场景
MOSHI实时对话大模型 有啥技术亮点?
表格式out!大模型最爱JSON,你了解吗?
使用长上下文嵌入模型实现 延迟划块,提高RAG准确率
大语言模型的技术细节 分布式训练和推理(3/3)
AIGC生成代码大模型如何选择?
FinGPT: 轻量级适应在金融领域高效LLM解决方案 #小工蚁 #chatglm #chatgpt
抱抱脸开源小模型SmolLM和训练数据集 #小工蚁
算子优化MoE模型推理加速4倍
清华发布VisualGLM-6B多模态模型 ChatGLM-6B升级版
自适应RAG算法和实现
Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁
ElasticSearch 8.x矢量数据库 向量搜索新功能全面介绍
大模型自我改善对齐,无需人类反馈
如何提高垂直领域RAG准确率? #小工蚁
将新鲜知识注入大型语言模型:只需一个命令!#小工蚁 #rome
几百次大模型LoRA和QLoRA 微调实践的经验分享