V
主页
京东 11.11 红包
PyTorch原生优化Llama2推理加速,性能提升近10倍 #小工蚁
发布人
PyTorch原生优化Llama2推理加速,性能提升近10倍 #小工蚁
打开封面
下载高清视频
观看高清视频
视频下载器
算子优化MoE模型推理加速4倍
深度学习环境配置一套搞定:anaconda+pytorch+pycharm+cuda全详解,带你从0配置环境到跑通代码!
偏好学习提升LLM的通用推理能力 #小工蚁
DSPy提示工程自动优化框架 #小工蚁
如何让阿里通义千问模型推理性能提升10倍?
LangGraph Autogen CrewAI 哪个Agent框架更好?#小工蚁
Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁
多GPU推理加速Qwen-72B开源大模型 #小工蚁
大模型推理指令缓存功能 推理性能提升30% #小工蚁
FinGPT: 轻量级适应在金融领域高效LLM解决方案 #小工蚁 #chatglm #chatgpt
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
mBART开源多语言翻译模型支持全球最常用50种语言 #小工蚁
使用Triton内核加速Llama3-70B FP8推理 #小工蚁
超强动画演示!B站终于有人把Transformer讲明白了,一步一步深入浅出解释原理,真的通俗易懂!
谷歌开源时间序列大模型 直接使用不需要训练 #小工蚁
人类反馈强化学习最新替代方法SimPO #小工蚁
百川2大语言模型推理加速 对比实验测试,性能提升100倍
Meta开源Llama2模型申请 下载和使用演示 #小工蚁 #llama2
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
近期开源VLM大模型介绍 #小工蚁
PDF转Markdown 6个开源项目如何选择? #小工蚁
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
Triton优化GPTQ算法GPU内核 效率提升3~6倍
投机采样创新:多头美杜莎让推理速度提升2倍 #小工蚁
开源项目moffee 将markdown格式转为PPT #小工蚁
Text2SQL Llama 7B模型微调DuckDB-NSQL-7B #小工蚁
用LLM从文本中自动提取数据 生成表格的新算法效率提升110倍
零基础入门GNN图神经网络入门到精通!全网公认讲的最好的【图神经网络全套教程】同济大佬53集带你吃透GNN(神经网络/图神经网络/深度学习/机器学习/人工智能)
书生200亿开源大模型压力测试 算法优化后性能飙升几十倍 #小工蚁 #开源大模型
被导师夸了3年的文献阅读+笔记整理方法!研0不会看论文的真心建议你来学三分钟!研究生/毕业论文/文献综述
EMU3大统一的多模态大模型 #小工蚁
智源公开大模型SFT训练数据集微调后性能达到和超过GPT4
大模型微调训练实践 准确度10%提升至90%
【Pytorch官方教程书】代码详解!大神带你直接把这本Pytorch的首选书籍啃透!!——人工智能|机器学习|深度学习
财务报告RAG智能问答,RAG应用中表格数据优化 #小工蚁
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
为什么有人说弄懂了《从零开始大模型开发与微调》的90%,就超越了90%的大模型初学者?
HippoRAG中仿人脑海马体PPR算法实现 #小工蚁
论文代码复现杀手!直接抄她的代码,就是最好的学习方法!!
IRCoT多次推理检索RAG算法 #小工蚁