V
主页
自制大模型推理框架-KVCache动手实现-秋招快人一步
发布人
带你从0写一个支持llama2/3推理支持cuda加速和int8量化的大模型框架,讲师发起的项目,repo目前2.3k star,帮助很多人获得了大厂岗位。 欢迎关注手写AI-你的AI求职、科研指南 (vx: shouxie_ai) 秋招、转行、名企实习、硬核项目、跳槽、转赛道就选【手写AI扶摇计划】(让top厂高级算法工程师帮你叠企业级工程项目buff) 项目方向:https://uy1hocr6gj.feishu.cn/docx/Q8kKdQIqLoayCTxnMW7csv4Cnbg
打开封面
下载高清视频
观看高清视频
视频下载器
自制大模型推理框架-怎么载入权重到显存以及多后端的选择
【具身抓取课程-2】深度学习基础
如何高效使用TensorRT~
isaac sim具身智能仿真系列:【7】仿真基本环境搭建(佛系胡乱更新中)
英伟达正式宣布:停止接受中国新订单!中国AI产业迎来巨大危机!
videopipe项目节选:多框架兼容性探讨与最佳实践
Kiwi内测体验Infer
英伟达GPU高阶教程-onnx模型节点少时反而大怎么办?
英伟达自动驾驶BEVFusion从算法到落地-4.MIT BEVFusion论文实用角度出发讲解
【isaac sim-14】具身仿真-添加自定义的controller
2.4自定义层量化
isaac sim具身仿真:【12】创建你自己的example和将它转成standalone app(佛系胡乱更新中)
你的第一个cuda程序(2)-warpaffine-main函数
第二节,模型的编译和运行压测
你的第一个cuda程序(6):双线性差值理论
YoloV8的动态静态batch如何理解和使用
手写扩散模型-UNet引入
你的第一个cuda程序(3)-warpaffine思路
你的第一个cuda程序(1):什么是warpaffine?
2_GPU硬件架构
GPT大模型剪枝-4.1OBS(最优脑外科手术)科普
英伟达自动驾驶BEVFusion从算法到落地-1.雷达及其数据结构
isaac sim具身智能仿真系列:【6】用extension还是standalone app(佛系胡乱更新中)
AI生成美女,太逆天了
isaac sim具身智能仿真系列:【10】让你的自制小车动起来(佛系胡乱更新中)
使用jenkins实现项目自动化部署
2.1PTQ-QAT原理介绍
2.【图解】概览diffusion模型的算法
14-1 从零手写模型量化框架 量化卷积原理
14-5 从零手写模型量化框架(公开部分) 实现Histogram统计activation
优化小技巧-softmax
每年消耗1.5万亿度电:AI是否是一场大骗局?深入解析背后的能源争夺战
第二十八节:权重的理论分析,初始化的逻辑
【isaac sim-13】具身仿真-你的第一个小车程序
第二十六节:逻辑回归多分类mnist模型
第十四节:装饰器
手写DiffusionPolicy【1】:最简单的机器人操作
GPT-o2推理超神,GPT-o1为何被 “冷落”? 大模型训练
你的第一个cuda程序(7):双线性插值cuda代码
0.剪枝引言