V
主页
动画讲解深度强化学习(RL、Q-网络、策略优化、大模型算法入门教程)
发布人
转载自Youtube(https://www.youtube.com/watch?v=SgC6AZss478&list=PLs8w1Cdi-zvYviYYw_V3qe6SINReGF5M-&index=1) 动画讲解深度强化学习(RL、Q-网络、策略优化算法入门教程) 转载自Youtube(https://www.youtube.com/watch?v=SgC6AZss478&list=PLs8w1Cdi-zvYviYYw_V3qe6SINReGF5M-&index=1) 宝子们观看记得开启中文字幕哦~
打开封面
下载高清视频
观看高清视频
视频下载器
这才是小白该学的AI入门教程!上交大教授系统解读【机器学习】+【深度学习】+【强化学习】入门及实战,绝对通俗易懂!
RLHF基于人类反馈的强化学习动画讲解(LLM)
太完整了!我居然3天时间就掌握了【机器学习+深度学习+强化学习+PyTorch】理论到实战,多亏了这个课程,绝对通俗易懂纯干货分享!
不愧是李宏毅老师讲的【强化学习】简直太详细了!全程干货,通俗易懂,看完就跑通!(人工智能|机器学习|深度学习|强化学习)
真的超容易“搞深度学习神经网络到底怎么改代码的啊?”复旦博士教我用一本书搞定!
DPO直接偏好优化算法 (动画讲解)
手把手带你走遍每个流程!深度学习环境配置好了,有什么用呢?要怎么用呢?
强强联合!GNN+强化学习!刷爆SOTA,霸榜顶会的28个方案
从零动画讲解Transformer
强推!草履虫都能一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM、DBN等八大深度学习神经网络算法!真的比刷剧还爽!
强推!这可能是B站最系统的(Python+机器学习+深度学习)系列课程了,上海交大和腾讯联合出品!人工智能|神经网络|AI
【共享LLM前沿】直观理解大模型预训练和微调!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习微调,代码讲解
通俗理解大模型从预训练到微调实战!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习
深度学习中的优化器
神经网络必看!如何从零入门CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等!清华大佬一天就教会了我如何入门神经网络算法,绝对通俗易懂
使用PPO算法训练大模型(动画讲解,简单易懂)
15分钟教会你怎么跑通官方模型数据集,怎么替换成自己的数据集,怎么跑通自己的数据集!--人工智能/深度学习/神经网络/计算机视觉
【2024最新完整版】不愧是李宏毅教授!一口气学完机器学习、深度学习、强化学习、生成式AI等课程!一套全解决!
大模型时代下的端到端自动驾驶(上篇)
动画讲解高斯混合模型 Gaussian Mixture Models
RLChina 2024 | 3小时强化学习入门课程-下
Stanford CS234 2024 Spring | 强化学习 | Reinforcement Learning
LLM Agent:探索 AI Agent 的自我设计与策略优化、包含Multi-Agent协作与复杂性管理(麻省理工、斯坦福最新研究成果)
直观理解大模型预训练和微调!四大LLM微调方法,RLHF基于人类反馈的强化学习微调
动画讲解LDA模型:从理论到实践
LLM Agent:Multi-Agent研究进展(清华与斯坦福最新研究解读)
动画讲解StableDiffusion图像生成的内部原理
深度学习环境配置一套搞定:anaconda+pytorch+pycharm+cuda全详解,带你从0配置环境到跑通代码!
动画讲解生成对抗网络GANs
强推!这绝对是B站最全的(python+机器学习+深度学习)系列教程,草履虫都能学会,学不会你来锤爆我!人工智能/机器学习/深度学习/python/神经网络
LLM Agent:2025 人工智能发展预测(Multi-Agent 系统、苹果AI计划、解锁利润策略)
动画讲解 Mamba 状态空间模型
(2024深度学习小白必看)手把手教你怎么将模块缝合到模型中
深度学习中的激活函数
LLM Agent:哈佛大学推出全新知识图谱代理 (MedAI)
【200集付费】一口气学完回归算法、聚类算法、决策树、随机森林、神经网络、贝叶斯算法、支持向量机、神经网络等十二大机器学习算法一次性学完!
动画讲解Transformer,揭开大模型的神秘面纱(简单易懂)
两小时入门PyTorch深度学习神经网络(绝对快速!绝对通俗!绝对易懂!)
简单粗暴!1小时理解大模型预训练和微调!了解四大LLM微调方法,大模型所需NLP基础知识,基于人类反馈的强化学习、P-Tuning微调、Lora-QLora
LLM Agent 图解码:利用知识图谱赋能大语言模型 (麻省理工学院)