V
主页
利用OpenAI的GPT-4训练的微软小模型,是如何成为最强开源模型的?
发布人
利用OpenAI的GPT-4训练的微软小模型,是如何成为最强开源模型的? #小工蚁 #微软开源 #Orca
打开封面
下载高清视频
观看高清视频
视频下载器
Liger Kernel开源加速大模型训练 算子,降低60%GPU显存
表格式out!大模型最爱JSON,你了解吗?
DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache?
训练LLM通过强化学习进行自我纠正 #小工蚁
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
性能媲美CUDA 开源方案助力大模型推理优化 #小工蚁
让大模型运行在任何设备上TouchChat开源项目 #小工蚁
开源最强生成代码大模型WizardCoder开箱评测,性能究竟如何?
谷歌开源gemma2大语言模型用了啥新技术?
超越GPT3.5开源模型Mixtral 真来了,可免费商用
阿里发布Text2SQL最新实践开源模型准确度超GPT4
LLaMA-Omni开源语言对话大模型,超低延时 #小工蚁
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
M3E中文文本嵌入模型:替代OpenAI text-embedding-ada-002的最佳选择
Qwen2-72B性能对比 英伟达RTX4090和L20各4卡
微软开源DeepSpeed-MoE训练更大更复杂混合专家模型 #小工蚁 #deepspeed
比较3种开源大模型Roberta Llama2,Mistrial微调性能
Jina Embedding v3开源多语言嵌入大模型
2023, 开源大模型之年
LongCite让大模型精准找到引用,智能回答更准确 #小工蚁
开源最强大语言模型Mixtral 推理和训练如何使用?#小工蚁
探索开源FastChat 平台,揭秘基于LLM大型语言模型的智能化应用框架!
MEMORAG受记忆启发知识发现的下一代RAG #小工蚁 #rag
MOSHI实时对话大模型 有啥技术亮点?
LMSYS新发布Vicuna V1.5 最强开源模型诞生
GPT-4 提升 1750%,全新「思维树」框架诞生!
OpenAI GPTo1发布告诉我们提升模型性能新途径 强化学习RLAIF #小工蚁
复旦开源MOSS预训练模型 130亿参数,可商用
开源AI生成声音和音乐大模型AudioLDM2 #小工蚁
Jamba1.5开源大模型同等性能降低10倍KV Cache
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
BAdam大模型全参训练方法更省显存,速度更快,性能更优
Meta开源CodeLlama代码大模型性能超越GPT3.5 #小工蚁
用世界最大GPU训练性能出众btlm-3B-8k开源小模型 #小工蚁
LangGraph Autogen CrewAI 哪个Agent框架更好?#小工蚁
DeepSpeedChat一键式RLHF训练 让LLM训练提速15倍,更省钱
开源项目moffee 将markdown格式转为PPT #小工蚁
微调大语言模型如何自动生成 训练数据以及优化技巧
最强长上下文Text Embedding 开源模型M2-BERT
Yi-VL开源最强多模态大模型 #小工蚁