V
主页
英伟达开源Nemotran4-340B大模型,性能直逼GPT4 #小工蚁
发布人
英伟达开源Nemotran4-340B大模型,性能直逼GPT4 #小工蚁
打开封面
下载高清视频
观看高清视频
视频下载器
Jamba开源模型性能超越 Mixtral8*7B 采用最先进混合架构
通义千问千亿模型比720亿模型更省算力 #小工蚁
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
近期开源VLM大模型介绍 #小工蚁
国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
Qwen2-VL通义千问多模态大模型能做什么?性能如何? #小工蚁
智源公开大模型SFT训练数据集微调后性能达到和超过GPT4
Qwen2-7B-Instruct不同量化方法准确度和性能比较
RankRAG英伟达检索增强生成算法 #小工蚁 多个测试数据集准确率SoTA
MiniCPM-2B和MoE-8x2B模型 开源最强“小模型” #小工蚁
华为盘古Pangu-Code2:如何微调出接近GPT4水平的性能?
阿里开源Qwen1.5-MoE模型 评测性能究竟如何?
开源数字人SadTalker项目源代码解读 #小工蚁 #sadtalker
多模态RAG检索增强生成2种实现方式 #小工蚁
TableBench全面基于表格问答复杂任务评测框架 #小工蚁
RAGChecker开源RAG诊断框架
ggml开源大模型推理轻量框架 支持手机推理大模型
DSPy提示工程自动优化框架 #小工蚁
微调开源模型具备Function Call讲解和演示 #小工蚁
零一万物发布Yi-9B大模型,代码数学推理能力全面提升 #小工蚁
NL2SQL大模型生成SQL调研报告
如何快速下载Huggingface大模型权重?#小工蚁
Docker容器中运行大语言模型 推理加速,使用更简便
Prefix Caching原理和对大模型推理加速影响 #小工蚁
盘点英伟达H100和4090的十点区别
多模态模型应用:设计图生成网页,哪个模型最强? #小工蚁
StarCoder2-Instruct自我对齐训练数据合成新方法 #小工蚁
比较3种开源大模型Roberta Llama2,Mistrial微调性能
大模型量化技术概述
AquliaChat2-7B AWQ量化实践 34B和7B模型推理速度和显存对比测试 #小工蚁
互联网大厂在AI CodeReview代码检查成功实践 #小工蚁
人工智能在制造行业应用场景(2/2)
让Mixtral-8*7B模型运行在16GB显存GPU上 #小工蚁
LightLLM轻量级高性能推理框架 和vLLM哪个更强?
ElasticSearch和OpenSearch向量检索性能差异?#小工蚁
SWIFT阿里开源大模型微调轻量级框架,有啥优缺点? #小工蚁
大语言模型快速JSON解码算法 Jump Forward Decoding #小工蚁
VLM多模态开源大模型发展迅速 下半年将成为主流
开源最强大语言模型Mixtral 推理和训练如何使用?#小工蚁