V
主页
京东 11.11 红包
【RLChina 2021】创业日 投资人专场
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
【RLChina 2022】前沿进展五:应用多智能体强化学习解决现实问题——机遇和挑战 方飞
【RLChina 2021】创业日 创始人专场
【RLChina 2021】第18课 专题报告 —— 多智能体通信与协同中的博弈论与强化学习 方飞
【RLChina 2022】理论课一:机器学习和深度学习基础 陈旭
【RLChina 2021】第0课 课程及相关活动介绍 汪军
【RLChina 2021】第3课 博弈论入门 张海峰
【RLChina论文研讨会】第34期 马一宁 解决车辆路径问题的深度强化学习方法:近期发展及挑战
【RLChina论文研讨会】第84期 刘明桓 Visual Whole-Body Control for Legged Loco-Manipulation
【RLChina 2021】第15课 多智能体前沿(一) 吴翼
【RLChina 2022】理论课三:强化学习基础 张伟楠
【RLChina 2022】实践课五:离线强化学习算法 秦熔均
【RLChina 2021】第10课 强化学习前沿(二)俞扬
【RLChina论文研讨会】第72期 马纬彧 大模型玩转星际 新的基准和总结链的尝试
【RLChina论文研讨会】第88期 张谷 Learning Dexterous Robot Manipulation Skills Based On 3D V
【RLChina 2021】第1课 机器学习入门 陈旭
【RLChina 论文研讨会】第2期 刘明桓 Curriculum Offline Imitation Learning
【RLChina 2020】第0讲 Introduction and Opening
【RLChina 2021】第9课 强化学习前沿(一) 卢宗青
【RLChina论文研讨会】第52期 吴吉洲 多智能体强化学习自动课程学习
【RLChina 2021】第4课 博弈论进阶 刘正阳
【RLChina论文研讨会】第77期 王鹏远 Language Model Self-improvement by Reinforcement Learnin
【RLChina论文研讨会】第68期 赵有朋 策略空间中的多智能体一阶约束优化方法
【RLChina论文研讨会】第83期 曾勇程 Token-level Direct Preference Optimization
【RLChina论文研讨会】第91期 史紫荆 在阿瓦隆桌游中评估LLM agent在临时团队中的协作能力
【RLChina论文研讨会】第93期 张宗萌 Trustworthy Alignment of Retrieval-Augmented Large Langua
【RLChina论文研讨会】第82期 梁志烜 SkillDiffuser: Interpretable Hierarchical Planning via
【RLChina论文研讨会】第95期 庄子文 人型机器人的高动态运动-Humanoid Parkour Learning
【RLChina 2023】 专题报告六:基于大语言模型的开放世界智能决策 杨耀东
【RLChina论文研讨会】第74期 程旭欣 Extreme Parkour with Legged Robots
【RLChina论文研讨会】第85期 葛振兴 Safe and Robust Subgame Exploitation in Imperfect Informa
【RLChina 2021】第5课 强化学习入门(一) 张伟楠
【RLChina论文研讨会】第71期 李立和 Learning to Coordinate with Anyone
【RLChina论文研讨会】第74期 凌逸飏 GenSim:Generating Robotic Simulation Tasks via Large Lang
【RLChina 2022】前沿进展四:Decision Structure in Decentralized Multi-Agent Learning 杜雅丽
【RLChina论文研讨会】第76期 董炜隽 观测模仿学习中的自动折扣因子调节
【RLChina论文研讨会】第86期 毛怡欢 风格化强化学习:从异质数据集中抽取多样性、高质量的行为
【RLChina论文研讨会】第93期 耿子介 Reinforcement Learning with Tree Search for Fast Macro Pl
【RLChina 2022】理论课四:强化学习的直接法与间接法 李升波
【RLChina论文研讨会】第69期 黄红蓝 Active Client Selection for Clustered Federated Learning
【RLChina论文研讨会】第70期 吴梓帆 优化基于模型多智能体强化学习中的多步局部模型交互