V
主页
清华发布SmartMoE一种高效训练专家模型网络算法 #小工蚁 #清华 #MoE
发布人
清华发布SmartMoE一种高效训练专家模型网络算法 #小工蚁 #清华 #MoE
打开封面
下载高清视频
观看高清视频
视频下载器
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
为什么说AI芯片的最大问题不是算力,而是内存带宽? #小工蚁 #英伟达
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
MiniCPM-2B和MoE-8x2B模型 开源最强“小模型” #小工蚁
使用Triton内核加速Llama3-70B FP8推理 #小工蚁
LLaMA-Omni开源语言对话大模型,超低延时 #小工蚁
Liger Kernel开源加速大模型训练 算子,降低60%GPU显存
清华发布CodeGeeX2生成代码大模型,它性能究竟如何? #小工蚁 #清华 #codegeex
训练LLM通过强化学习进行自我纠正 #小工蚁
多模态Embedding开源模型 Visualized BGE #小工蚁
重磅!ChatGLM2-6B可免费商用,免费中英文大模型有多一种选择 #小工蚁 #chatglm2
开源项目moffee 将markdown格式转为PPT #小工蚁
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
Qwen2-Audio语音多模态大模型使用实践 #小工蚁
国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁
华为AI昇腾芯片当前重点场景是什么?#小工蚁
微软开源DeepSpeed-MoE训练更大更复杂混合专家模型 #小工蚁 #deepspeed
零一万物发布Yi-9B大模型,代码数学推理能力全面提升 #小工蚁
Jina Embedding v3开源多语言嵌入大模型
LLM解码参数Temperature Top K & Top P有啥作用?#小工蚁
RAG for LLM A Survery论文导读 #小工蚁
使用LangChain实现Tool Calling #小工蚁
微调开源模型具备Function Call讲解和演示 #小工蚁
HippoRAG中仿人脑海马体PPR算法实现 #小工蚁
开源AI生成声音和音乐大模型AudioLDM2 #小工蚁
RankRAG英伟达检索增强生成算法 #小工蚁 多个测试数据集准确率SoTA
MemLong:提高大模型上下文的“外挂” #小工蚁
多模态模型应用:设计图生成网页,哪个模型最强? #小工蚁
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
大语言模型快速JSON解码算法 Jump Forward Decoding #小工蚁
哪种模型偏好微调最优?DPO、IPO、KTO算法 #小工蚁
Yi-VL开源最强多模态大模型 #小工蚁
阿里开源Qwen1.5-MOE-A2.7B CEval评测 #小工蚁
上海人工智能实验室InternLM-7B模型升级,增强Tools使用能力 #小工蚁
Fish Speech开源TTS支持中英日3种语言 #小工蚁
Qwen2-72B大模型推理性能对比 4张RTX4090对比2张L20
Jamba开源模型性能超越 Mixtral8*7B 采用最先进混合架构
Flash-Decoding长上下文LLM推理速度提8倍 #小工蚁
如何消除大模型幻觉? 提高准确率 LoRA+MoE
PDF转Markdown 6个开源项目如何选择? #小工蚁