V
主页
京东 11.11 红包
自制大模型推理框架-怎么载入权重到显存以及多后端的选择
发布人
带你从0写一个支持llama2/3推理支持cuda加速和int8量化的大模型框架,讲师发起的项目,repo目前2.3k star,帮助很多人获得了大厂岗位。 欢迎关注手写AI-你的AI求职、科研指南 (vx: shouxie_ai) 秋招、转行、名企实习、硬核项目、跳槽、转赛道就选【手写AI扶摇计划】(让top厂高级算法工程师帮你叠企业级工程项目buff) 项目方向:https://uy1hocr6gj.feishu.cn/docx/Q8kKdQIqLoayCTxnMW7csv4Cnbg
打开封面
下载高清视频
观看高清视频
视频下载器
2.3k star的GitHub 大模型 HPC 项目课程上线啦!(作者亲授)
英伟达GPU高阶教程-ldmatrix指令行为分析
自制Cuda大模型推理框架-讲解一个从零手写的Qwen2.5推理
玩转VPS必备的5个开源项目,5分钟带你变高手
大模型为什么跌到了白菜价
秋招必备,自制大模型推理框架,征服面试官,cuda写sgemv算子
详解TensorRT的C++/Python高性能部署,实战应用到项目
如何高效使用TensorRT~
YoloV8的高效推理-分割检测
14-1 从零手写模型量化框架 量化卷积原理
一文讲清楚CUDA
英伟达自动驾驶BEVFusion从算法到落地-1.初见
Qt+Ollama开源大模型随意部署,免安装解压即用
Kiwi内测体验Infer
6_CUDA流和并发
isaac sim具身智能仿真系列:【1】管他37 21,装好了仿真就算是具身大佬了(佛系胡乱更新中)
自制大模型现已支持在浏览器上推理
B站最全!概率论基础、线性代数基础、高等数学基础、微积分、泰勒公式、贝叶斯算法、回归分析等十大人工智能数学基础一口气学完!
大模型面经--微调篇
【项目】基于DeepStream的工业边缘端部署项目
14-3 从零手写模型量化框架 ABS_MAX算法
【喂饭教程】20分钟学会微调大模型Qwen2,环境配置+模型微调+模型部署+效果展示详细教程!草履虫都能学会~
英伟达GPU高阶教程-onnx模型节点少时反而大怎么办?
isaac sim具身智能仿真系列:【5】动手吧,从操控一个方块开始(佛系胡乱更新中)
【isaac sim-13】具身仿真-你的第一个小车程序
斯坦福公开课!不愧是计算机大佬李飞飞亲授:计算机视觉实战居然如此通俗易懂!建议收藏!(人工智能、深度学习、机器学习、神经网络、AI)
【isaac sim-14】具身仿真-添加自定义的controller
【具身抓取课程-2】深度学习基础
Bert源码复现!逐行手写代码!看完即看懂!
35岁高龄程序员被裁之后,没背景、没人脉、没资源,如何去寻找新的出路?
具身智能多模态基础:1. 视觉大模型技术概述
这才是研究生该看的代码复现神仙网站!GitHub标星超过50k,左边注释,右边代码,手把手带你逐行解读代码,科研人严选 !
如何自动配置CUDA
AI手机,干掉App?
手写扩散模型-带有时间依赖的UNet逐行复现
清华教授刘嘉谈中美AI差距:可怕的是我们落后速度在加快
你的第一个cuda程序(3)-warpaffine思路
英伟达GPU高阶教程-cuda核函数编译与启动流程分析(1)
2024最火的两个模型:Informer+LSTM两大时间序列预测模型,论文精读+代码复现,通俗易懂!——人工智能|AI|机器学习|深度学习
Qwen-2.5中文写作LoRA,指令微调,绅士小说续写,提供guff文件