V
主页
研讨会录像 - Policy gradient
发布人
个人主讲的会议录像,讲解了Policy gradient、推导了REINFORCE算法、讨论了这个算法的问题,并给出了一些后续阅读材料。以后应该会有更多上传,内容以Up主的科研领域为主,包括机器人抓取、强化学习等。 没有英语字幕,实在没时间搞字幕。 知乎:https://www.zhihu.com/people/xiao-yang-69-78-27/posts PPT:https://pan.baidu.com/s/1cHKkHPyibWSoMY17ypYaPg 提取码:0gz9
打开封面
下载高清视频
观看高清视频
视频下载器
闲来无事,推翻一下数学大厦
研讨会录像 - Uncertainties in RL
AI 挑战错觉图 42
拿神话当地契,那可是你说的喔!
Diffusion Policy 结合 PPO 模仿+强化 (中)
AI生成的真人版《名侦探柯南》,东宝你就照着抄作业吧
Diffusion Policy 结合 PPO 模仿+强化 (下)
强化学习四足机器人一
二白深夜顺拐机器人
强化学习四足机器人二
能飞会跑的机器人 #IROS2024
强推!北京大学王树森半天就教会了我深度强化学习,原理详解+项目实战,学不会来打我!
当万物都需要辨别真假,AI带来的还是便利吗?!
我问 AI 埃及金字塔咋建的,它:
强推!这绝对是B站最全的(python+机器学习+深度学习)系列教程,草履虫都能学会,学不会你来锤爆我!人工智能/机器学习/深度学习/python/神经网络
斯坦福大学《强化学习|Stanford CS234 Reinforcement Learning 2024》deepseek翻译
issacgym sim2sim
大模型如何增强强化学习?简单粗暴理解大模型训练中的人类反馈强化学习RLHF!PPO算法、ChatGPT背后的数学原理
强化小伙终于起立了
我在B站上大学!【完整版-麻省理工-微积分重点】全18讲!学数学不看的微积分课程,看完顺滑一整年。_人工智能数学基础/机器学习/微积分/麻省理工/高等数学
不愧是李宏毅老师讲的【强化学习】简直太详细了!全程干货,通俗易懂,看完就跑通!(人工智能|机器学习|深度学习|强化学习)
【持久战】修仙模拟器之法修大姐单挑3.8w实力合欢派
动画讲解深度强化学习(RL、Q-网络、策略优化、大模型算法入门教程)
【2024最新完整版】不愧是李宏毅教授!一口气学完机器学习、深度学习、强化学习、生成式AI等课程!一套全解决!
终于可以站起来了,就是lstm训练的慢了好多…
【ChatGPT4.0手机版】国内无需魔法,无限次数使用教程来了!
【强化学习实战】计算机博士花半天带你学会强化学习PPO算法/DQN算法/A3C算法原理及实战!_AI/人工智能/深度学习/强化学习
这才是小白该学的AI入门教程!上交大教授系统解读【机器学习】+【深度学习】+【强化学习】入门及实战,绝对通俗易懂!
直观理解大模型预训练和微调!四大LLM微调方法,RLHF基于人类反馈的强化学习微调
基于安全区域强化学习的狭窄空间阿克曼机器人自探索
一机多用“三合一”足端设计机器人
1050ti的显卡勉强能跑跑,sim2sim
复现human2humanoid
【有点快】修仙模拟器 真凰羽剑阵打3.8w紫霄宗
右边两足走路也是双足行走
【基于深度强化学习的冠军级别无人机竞速】强化学习和模型预测控制MPC中英字幕18讲!
使用ROS2-Control + RL来控制四足机器人
双热点强强联合的发文方向:Transformer+强化学习!
6个智能体的编队导航与避障_补充实验
通俗理解大模型从预训练到微调实战!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习