V
主页
使用PPO算法训练大模型(动画讲解,简单易懂)
发布人
转载自Youtube(https://www.youtube.com/watch?v=TjHH_--7l8g&list=PLs8w1Cdi-zvYviYYw_V3qe6SINReGF5M-&index=2) 动画讲解PPO算法,以及在大模型中的应用 转载自Youtube(https://www.youtube.com/watch?v=TjHH_--7l8g&list=PLs8w1Cdi-zvYviYYw_V3qe6SINReGF5M-&index=2) 宝子们记得开启中文弹幕哦~
打开封面
下载高清视频
观看高清视频
视频下载器
动画讲解深度强化学习(RL、Q-网络、策略优化、大模型算法入门教程)
动画讲解Transformer,揭开大模型的神秘面纱(简单易懂)
动画讲解 Mamba 状态空间模型
从零动画讲解Transformer
动画讲解离散傅里叶变换
真的超容易“搞深度学习神经网络到底怎么改代码的啊?”复旦博士教我用一本书搞定!
动画讲解去噪和变分自动编码器 Denoising and Variational Autoencoders
动画讲解受限玻尔兹曼机RBM生成模型(2024诺贝尔物理奖模型)
RLHF基于人类反馈的强化学习动画讲解(LLM)
动画讲解SVD:压缩图像背后的数学魔法
动画讲解StableDiffusion图像生成的内部原理
LLM Agent:Multi-Agent研究进展(清华与斯坦福最新研究解读)
LLM Agent 的核心原理与代码讲解
LLM Agent 图解码:利用知识图谱赋能大语言模型 (麻省理工学院)
LDA实战:用吉布斯采样实现高效文档主题分类
为什么神经网络可以学习任何东西?首次使用动画讲解,带你吃透神经网络!(CNN卷积神经网络、RNN循环神经网络、GAN生成式对抗网络、人工智能、AI)
DPO直接偏好优化算法 (动画讲解)
从零动画讲解卷积神经网络CNN
对神经网络某一层做了小改进,效果却提升显著,可以发论文吗? -人工智能/机器学习/深度学习
LLM for Robotics前沿- 系统性讲解 大行为模型(VLA Model)(重置版)
【全126集】目前B站最系统的Transformer教程!入门到进阶,全程干货讲解!拿走不谢!(神经网络/NLP/注意力机制/大模型/GPT/RNN)
从零开始!动画讲解MAMBA
LLM Agent:2025 人工智能发展预测(Multi-Agent 系统、苹果AI计划、解锁利润策略)
LLM Agent: 蒙特卡罗方法与 Multi-Agent 系统的思考与探索
嵌套专家混合模型:视觉令牌的自适应处理
什么是深度学习?深度学习VS机器学习
动画讲解 K-means 层级聚类
突破传统:端到端的实时语音对话模型
图像分割、目标检测、特征提取、边缘检测、图像滤波、人脸识别...终于有人把OpenCV那些必备的知识点讲透彻了!从入门到图像处理实战!
你 P 过 吗?
传统机器学习算法还值不值得学?迪哥带你分析各大机器学习算法的重要性,精讲机器学习树模型系列(重中之重)
梓,不吉利的文字。
Keras 中的迁移学习 | 微调与特征提取
清华大四情侣平凡的一天
尤瓦尔·赫拉利对谈张静初:AI正在制造慢不下来的人
喂饭教程!25分钟本地部署Qwen2大模型:配置、微调、部署+效果展示,带你训练自己的行业大模型!
注意力机制背后的数学原理(Query,Key,Value)
LLM Agent:哈佛大学推出全新知识图谱代理 (MedAI)
强推!草履虫都能一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM、DBN等八大深度学习神经网络算法!真的比刷剧还爽!
什么是感知器? | 感知器与神经元的区别与几何直觉解析