V
主页
探索Mistral 7B英文开源最强大模型滑动窗口注意力算法
发布人
探索Mistral 7B英文开源最强大模型滑动窗口注意力算法 #小工蚁 #mistral
打开封面
下载高清视频
观看高清视频
视频下载器
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
LLaMA-Omni开源语言对话大模型,超低延时 #小工蚁
DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache?
LangGraph Autogen CrewAI 哪个Agent框架更好?#小工蚁
LLM如何接入到个人微信? 演示群聊中AI自动回复
开源最强生成代码大模型WizardCoder开箱评测,性能究竟如何?
MEMORAG受记忆启发知识发现的下一代RAG #小工蚁 #rag
谷歌开源gemma2大语言模型用了啥新技术?
小工蚁开源大模型解决方案 快速部署,轻松满足定制需求
号称目前最强开源大模型, 使用了 Reflection-Tuning技术,能够自我纠错。
Vicuna模型实验和演示 英文LLM最强开源模型之一
开源Mistral 7B开箱测试 性能炸裂,推理比Qwen-7B快4倍 #小工蚁
表格式out!大模型最爱JSON,你了解吗?
MOSHI实时对话大模型 有啥技术亮点?
用GPTQ算法量化大型模型 大幅减少GPU使用并提高准确率
开源Mistral-7B LORA微调 增强中文能力演示
书生200亿开源大模型压力测试 算法优化后性能飙升几十倍 #小工蚁 #开源大模型
开源最强Mixtral模型是通过 什么算法和工具训练出来的?
2023, 开源大模型之年
Qwen2-72B性能对比 英伟达RTX4090和L20各4卡
MiniCPM-2B和MoE-8x2B模型 开源最强“小模型” #小工蚁
清华智谱开源生成视频大模型CogVideo
斯坦福开源RadixAttention算法 和SGLang语言,性能再翻5倍
哪种模型偏好微调最优?DPO、IPO、KTO算法 #小工蚁
超越GPT3.5开源模型Mixtral 真来了,可免费商用
性能媲美CUDA 开源方案助力大模型推理优化 #小工蚁
比较3种开源大模型Roberta Llama2,Mistrial微调性能
LongCite让大模型精准找到引用,智能回答更准确 #小工蚁
阿里发布Text2SQL最新实践开源模型准确度超GPT4
上海人工智能实验室开源200亿大语言模型
Triton优化GPTQ算法GPU内核 效率提升3~6倍
最强多变量时间序列预测PatchTSMixer算法实践演示
让大模型运行在任何设备上TouchChat开源项目 #小工蚁
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
Liger Kernel开源加速大模型训练 算子,降低60%GPU显存
Stable Diffusion 3开源发布 文生图大模型媲美闭源商业模型
BCE Embedding开源大模型 RAG应用准确度提升关键
多跳智能问答EfficientRAG更胜一筹 #小工蚁
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
多模态Embedding开源模型 Visualized BGE #小工蚁