大模型量化技术概述 - 视频下载 Video Downloader

京东 11.11 红包

大模型量化技术概述

发布人

大模型量化技术概述

打开封面下载高清视频观看高清视频视频下载器

AWQ大模型量化INT4比FP16 推理快2倍，GPU内存1/3

了解大语言模型技术细节（1/3）

Qwen2-7B-Instruct不同量化方法准确度和性能比较

Embedding模型8bit量化推理成本下降4倍，准确度下降0.7%

阿里发布Text2SQL最新实践开源模型准确度超GPT4

用GPTQ算法量化大型模型大幅减少GPU使用并提高准确率

M3E中文文本嵌入模型：替代OpenAI text-embedding-ada-002的最佳选择

清华智谱开源视觉大模型 CogVLM，可免费商用

人工智能在制造行业应用场景（1/2）

NL2SQL大模型生成SQL调研报告

DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache？

多模态Embedding开源模型 Visualized BGE #小工蚁

Reflection开源，让大模型学习“反思”

中文ChatGLM-6B预训练模型 5.2万提示指令微调演示

近期开源VLM大模型介绍 #小工蚁

大模型微调训练实践准确度10%提升至90%

LangGraph Autogen CrewAI 哪个Agent框架更好？#小工蚁

LLM部署在生产环境优化（1/3）模型量化

从 SAM 到 FastSAM：中科院团队成功实现通用视觉模型速度革命

开源最强生成代码大模型WizardCoder开箱评测，性能究竟如何？

智源公开大模型SFT训练数据集微调后性能达到和超过GPT4

矢量数据库对比和选择指南

大模型提示工程技术调研报告（上）

人工智能在企业数字化转型二大应用场景

MOSHI实时对话大模型有啥技术亮点？

表格式out！大模型最爱JSON，你了解吗？

使用长上下文嵌入模型实现延迟划块，提高RAG准确率

大语言模型的技术细节分布式训练和推理（3/3）

AIGC生成代码大模型如何选择？

FinGPT: 轻量级适应在金融领域高效LLM解决方案 #小工蚁 #chatglm #chatgpt

抱抱脸开源小模型SmolLM和训练数据集 #小工蚁

算子优化MoE模型推理加速4倍

清华发布VisualGLM-6B多模态模型 ChatGLM-6B升级版

自适应RAG算法和实现

Qwen1.5系列6个模型如何选择？ AWQ还是GPTQ？#小工蚁

ElasticSearch 8.x矢量数据库向量搜索新功能全面介绍

大模型自我改善对齐，无需人类反馈

如何提高垂直领域RAG准确率？ #小工蚁

将新鲜知识注入大型语言模型：只需一个命令！#小工蚁 #rome

几百次大模型LoRA和QLoRA 微调实践的经验分享