研讨会录像 - Policy gradient - 视频下载 Video Downloader

研讨会录像 - Policy gradient

发布人

个人主讲的会议录像，讲解了Policy gradient、推导了REINFORCE算法、讨论了这个算法的问题，并给出了一些后续阅读材料。以后应该会有更多上传，内容以Up主的科研领域为主，包括机器人抓取、强化学习等。
没有英语字幕，实在没时间搞字幕。
知乎：https://www.zhihu.com/people/xiao-yang-69-78-27/posts
PPT：https://pan.baidu.com/s/1cHKkHPyibWSoMY17ypYaPg 提取码：0gz9

打开封面下载高清视频观看高清视频视频下载器

闲来无事，推翻一下数学大厦

研讨会录像 - Uncertainties in RL

AI 挑战错觉图 42

拿神话当地契，那可是你说的喔！

Diffusion Policy 结合 PPO 模仿+强化（中）

AI生成的真人版《名侦探柯南》，东宝你就照着抄作业吧

Diffusion Policy 结合 PPO 模仿+强化（下）

强化学习四足机器人一

二白深夜顺拐机器人

强化学习四足机器人二

能飞会跑的机器人 #IROS2024

强推！北京大学王树森半天就教会了我深度强化学习，原理详解+项目实战，学不会来打我！

当万物都需要辨别真假，AI带来的还是便利吗？！

我问 AI 埃及金字塔咋建的，它：

强推！这绝对是B站最全的（python＋机器学习＋深度学习）系列教程，草履虫都能学会，学不会你来锤爆我！人工智能/机器学习/深度学习/python/神经网络

斯坦福大学《强化学习|Stanford CS234 Reinforcement Learning 2024》deepseek翻译

issacgym sim2sim

大模型如何增强强化学习？简单粗暴理解大模型训练中的人类反馈强化学习RLHF！PPO算法、ChatGPT背后的数学原理

强化小伙终于起立了

我在B站上大学!【完整版-麻省理工-微积分重点】全18讲！学数学不看的微积分课程，看完顺滑一整年。_人工智能数学基础/机器学习/微积分/麻省理工/高等数学

不愧是李宏毅老师讲的【强化学习】简直太详细了！全程干货，通俗易懂，看完就跑通！（人工智能|机器学习|深度学习|强化学习）

【持久战】修仙模拟器之法修大姐单挑3.8w实力合欢派

动画讲解深度强化学习（RL、Q-网络、策略优化、大模型算法入门教程）

【2024最新完整版】不愧是李宏毅教授！一口气学完机器学习、深度学习、强化学习、生成式AI等课程！一套全解决！

终于可以站起来了，就是lstm训练的慢了好多…

【ChatGPT4.0手机版】国内无需魔法，无限次数使用教程来了！

【强化学习实战】计算机博士花半天带你学会强化学习PPO算法/DQN算法/A3C算法原理及实战！_AI/人工智能/深度学习/强化学习

这才是小白该学的AI入门教程！上交大教授系统解读【机器学习】+【深度学习】+【强化学习】入门及实战，绝对通俗易懂！

直观理解大模型预训练和微调！四大LLM微调方法，RLHF基于人类反馈的强化学习微调

基于安全区域强化学习的狭窄空间阿克曼机器人自探索

一机多用“三合一”足端设计机器人

1050ti的显卡勉强能跑跑，sim2sim

复现human2humanoid

【有点快】修仙模拟器真凰羽剑阵打3.8w紫霄宗

右边两足走路也是双足行走

【基于深度强化学习的冠军级别无人机竞速】强化学习和模型预测控制MPC中英字幕18讲！

使用ROS2-Control + RL来控制四足机器人

双热点强强联合的发文方向：Transformer+强化学习！

6个智能体的编队导航与避障_补充实验

通俗理解大模型从预训练到微调实战！P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习