V
主页
AMD最强人工智能芯片发布性能超英伟达H100 #小工蚁
发布人
AMD最强人工智能芯片发布性能超英伟达H100
打开封面
下载高清视频
观看高清视频
视频下载器
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
Tesseract开源文字识别OCR引擎 支持100多种语言
AutoLabel:自动标注,比人快100倍,准确度和人一样!#小工蚁 #大语言模型
英伟达发布最新AI芯片H200 谈谈AI芯片趋势 #小工蚁
谷歌更新Transformer架构MoD 节省计算资源,提高模型性能 #小工蚁
【显卡日报】AMD悄悄上架新显卡,性能强于RTX4070
Qwen2-Audio语音多模态大模型使用实践 #小工蚁
芯片和人工智能发展趋势(2/2)#小工蚁
国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁
企业大语言模型用什么GPU H100/A100还是4090? #小工蚁
芯片和人工智能发展趋势(1/2)#小工蚁
S-LORA为数千个LoRA同时提供推理,性能提升30倍 #小工蚁
英伟达H100和A100训练大模型 性能对比
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁
多模态RAG检索增强生成2种实现方式 #小工蚁
智源公开大模型SFT训练数据集微调后性能达到和超过GPT4
开源InternLM2大模型测评 #小工蚁
SQLEval Text2SQL能力评估实践 #小工蚁
传统推荐算法遇强敌:LLM微调后的表现如何?中科大和谷歌为你解答!#小工蚁 #llm #推荐系统
Text2SQL Llama 7B模型微调DuckDB-NSQL-7B #小工蚁
LLM解码参数Temperature Top K & Top P有啥作用?#小工蚁
RankRAG英伟达检索增强生成算法 #小工蚁 多个测试数据集准确率SoTA
mBART开源多语言翻译模型支持全球最常用50种语言 #小工蚁
LangChain v0.2新版即将发布 #小工蚁
使用LangChain实现Tool Calling #小工蚁
多模态模型应用:设计图生成网页,哪个模型最强? #小工蚁
百川2大语言模型推理加速 对比实验测试,性能提升100倍
解决内容冲突RAG算法 FILCO #小工蚁
阿里发布Text2SQL最新实践开源模型准确度超GPT4
将训练数据打包减少一半大模型训练时间 #小工蚁
LightLLM轻量级高性能推理框架 和vLLM哪个更强?
多模态Embedding开源模型 Visualized BGE #小工蚁
MiniCPM-2B和MoE-8x2B模型 开源最强“小模型” #小工蚁
开源最强生成代码大模型WizardCoder开箱评测,性能究竟如何?
谷歌开源视觉大模型PaliGemma
TableBench全面基于表格问答复杂任务评测框架 #小工蚁
Sora大模型结合机器人如何 彻底改变我们世界?#小工蚁
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
Qwen2-7B-Instruct不同量化方法准确度和性能比较