V
主页
伯克利大学开源vLLM项目 让LLM推理效率提升24倍
发布人
伯克利大学开源vLLM项目 让LLM推理效率提升24倍
打开封面
下载高清视频
观看高清视频
视频下载器
LightLLM轻量级高性能推理框架 和vLLM哪个更强?
LLM如何接入到个人微信? 演示群聊中AI自动回复
ggml开源大模型推理轻量框架 支持手机推理大模型
上海人工智能实验室开源LLM书生·浦语,可免费商用
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
Jamba1.5开源大模型同等性能降低10倍KV Cache
智源公开大模型SFT训练数据集微调后性能达到和超过GPT4
阿里发布Text2SQL最新实践开源模型准确度超GPT4
开源最强生成代码大模型WizardCoder开箱评测,性能究竟如何?
RAGChecker开源RAG诊断框架
Qwen2-7B-Instruct不同量化方法准确度和性能比较
S-LORA为数千个LoRA同时提供推理,性能提升30倍 #小工蚁
用LLM从文本中自动提取数据 生成表格的新算法效率提升110倍
Bark将文本转成声音TTS开源项目 支持多语言,可商用
多模态Embedding开源模型 Visualized BGE #小工蚁
UC伯克利LLM排位赛重磅更新!28个模型加入排行榜 #小工蚁 #uc伯克利
Reflection开源,让大模型学习“反思”
给您的数字图片增加版权信息 开源盲水印项目演示
腾讯开源LlaMA Pro增强LLM性能 新方法,打造行业模型 #小工蚁
类似ChatGPT开源项目Open Assistant介绍
PDF转Markdown 6个开源项目如何选择? #小工蚁
国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁
港大开源RWKV模型LLM如何使用
ClickHouse和Elastisearch 深度对比
Vanna开源Text to SQL项目
LLaMA3.1-8B性能评测 如何运行性能最优?#小工蚁
LLMSurvey大语言模型概述 开源项目介绍
使用Triton内核加速Llama3-70B FP8推理 #小工蚁
DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache?
开源数字人SadTalker项目源代码解读 #小工蚁 #sadtalker
大模型微调训练实践 准确度10%提升至90%
StreamingLLM算法让推理速度 提升22倍,支持400万Token输出
开源Text Embedding加速推理 比HF性能提升3~4倍
BCE Embedding开源大模型 RAG应用准确度提升关键
探索开源FastChat 平台,揭秘基于LLM大型语言模型的智能化应用框架!
开源FastLLM加速推理性能究竟如何?#小工蚁
清华ChatGLM2中英文LLM 2代模型发布,性能大幅提升
如何让阿里通义千问模型推理性能提升10倍?
开源数字人项目SadTalker升级 v0.0.2版本功能介绍和演示
LMSYS新发布Vicuna V1.5 最强开源模型诞生