V
主页
书生200亿开源大模型压力测试 算法优化后性能飙升几十倍 #小工蚁 #开源大模型
发布人
书生200亿开源大模型压力测试 算法优化后性能飙升几十倍 #小工蚁 #开源大模型
打开封面
下载高清视频
观看高清视频
视频下载器
书生200亿开源大模型开箱测试 如何在2块GPU上运行? #小工蚁 #开源大模型
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
探索Mistral 7B英文开源最强大模型滑动窗口注意力算法
谷歌开源视觉大模型PaliGemma
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
上海人工智能实验室开源200亿大语言模型
算子优化MoE模型推理加速4倍
开源InternLM2大模型测评 #小工蚁
通义千问千亿模型比720亿模型更省算力 #小工蚁
20秒带你玩转本地大模型工具ARGO
商汤开源Piccolo2大模型有啥亮点?#小工蚁
智源公开大模型SFT训练数据集微调后性能达到和超过GPT4
Jamba1.5开源大模型同等性能降低10倍KV Cache
多模态Embedding开源模型 Visualized BGE #小工蚁
号称目前最强开源大模型, 使用了 Reflection-Tuning技术,能够自我纠错。
谷歌更新Transformer架构MoD 节省计算资源,提高模型性能 #小工蚁
Qwen2-Audio语音多模态大模型使用实践 #小工蚁
阿里开源Qwen1.5-MoE模型 评测性能究竟如何?
Reflection开源,让大模型学习“反思”
PDF文档文字、表格混排自动识别,增强RAG应用准确度 #小工蚁
LLM如何接入到个人微信? 演示群聊中AI自动回复
谷歌开源gemma2大语言模型用了啥新技术?
最强7B模型Zephyr,打败LlaMA2-70B #小工蚁
Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁
mBART开源多语言翻译模型支持全球最常用50种语言 #小工蚁
Mixtral-8*7B开源模型生产环境部署优化 2块RTX4090 #小工蚁
Sora大模型结合机器人如何 彻底改变我们世界?#小工蚁
开源Mistral 7B开箱测试 性能炸裂,推理比Qwen-7B快4倍 #小工蚁
RankRAG英伟达检索增强生成算法 #小工蚁 多个测试数据集准确率SoTA
SQLEval Text2SQL能力评估实践 #小工蚁
构建多模态RAG应用实践 #小工蚁
S-LORA为数千个LoRA同时提供推理,性能提升30倍 #小工蚁
DSPy提示工程自动优化框架 #小工蚁
LLaMA3.1-8B性能评测 如何运行性能最优?#小工蚁
合并同源模型权重获得新能力,阿里开源DARE算法 #小工蚁
让Mixtral-8*7B模型运行在16GB显存GPU上 #小工蚁
MiniCPM-2B和MoE-8x2B模型 开源最强“小模型” #小工蚁
小工蚁开源大模型解决方案 快速部署,轻松满足定制需求
腾讯开源LlaMA Pro增强LLM性能 新方法,打造行业模型 #小工蚁
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3