V
主页
京东 11.11 红包
Docker容器中运行大语言模型 推理加速,使用更简便
发布人
Docker容器中运行大语言模型 推理加速,使用更简便
打开封面
下载高清视频
观看高清视频
视频下载器
AutoLabel:自动标注,比人快100倍,准确度和人一样!#小工蚁 #大语言模型
了解大语言模型技术细节(1/3)
多模态Embedding开源模型 Visualized BGE #小工蚁
如何消除大模型幻觉? 提高准确率 LoRA+MoE
清华智谱开源视觉大模型 CogVLM,可免费商用
Ollama在Mac上运行大语言模型 #小工蚁
统一Embedding模型增强 大语言模型能力 #小工蚁
大语言模型的技术细节 分布式训练和推理(3/3)
算子优化MoE模型推理加速4倍
不用训练让大模型上下文超过1M Dual Chunk Attention
开源最强大语言模型Mixtral 推理和训练如何使用?#小工蚁
DPanel - Docker 管理面板,管理部署Compose任务,支持远程地址,挂载文件等方式,支持新增覆盖配置及多docker环境
阿里发布Text2SQL最新实践开源模型准确度超GPT4
新零售+人工智能有哪些应用场景?
中文ChatGLM-6B预训练模型 5.2万提示指令微调演示
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
微调大语言模型如何自动生成 训练数据以及优化技巧
Meta开源Toolformer 语言模型可以教会自己使用工具
百川2大语言模型推理加速 对比实验测试,性能提升100倍
使用Triton内核加速Llama3-70B FP8推理 #小工蚁
AquilaChat2 天鹰中英文340亿大语言模型开源
近期开源VLM大模型介绍 #小工蚁
NL2SQL大模型生成SQL调研报告
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
大语言模型构建新工具MergeKit 集百家之长融于一身 #小工蚁
llama.cpp大神实现投机采样,让大模型推理性能直接翻倍 #小工蚁
如何让大语言模型Qwen-7b使用Langchain中的工具? #小工蚁 #qwen7b
打造智能客服:LLM和本地 知识库的完美协同原理
斯坦福开源RadixAttention算法 和SGLang语言,性能再翻5倍
NAS实用Docker容器推荐指南-Vaultwarden自建开源密码管理器(bitwarden)
几百次大模型LoRA和QLoRA 微调实践的经验分享
港大开源RWKV模型LLM如何使用
多GPU推理加速Qwen-72B开源大模型 #小工蚁
使用长上下文嵌入模型实现 延迟划块,提高RAG准确率
Jamba开源模型性能超越 Mixtral8*7B 采用最先进混合架构
mBART开源多语言翻译模型支持全球最常用50种语言 #小工蚁
通义千问模型运行FastChat 发现兼容性问题
让Mixtral-8*7B模型运行在16GB显存GPU上 #小工蚁
最强长上下文Text Embedding 开源模型M2-BERT
将新鲜知识注入大型语言模型:只需一个命令!#小工蚁 #rome