V
主页
京东 11.11 红包
【RLChina 2020】第3讲 Non-Convex Optimisation: Survey & ADAM's Proof
发布人
本讲导师:Haitham Bou Ammar(华为伦敦) RLChina官网:www.rlchina.org
打开封面
下载高清视频
观看高清视频
视频下载器
【RLChina 2023】Tutorial 杨梦月 Causality For Decision Making
【RLChina论文研讨会】第82期 胡梦康 Tree-Planner:Efficient Close-loop Task Planning with
【RLChina论文研讨会】第83期 曾勇程 Token-level Direct Preference Optimization
【RLChina 2023】Tutorial 张伟楠 强化学习入门
【RLChina 2023】主旨报告 刘群 大语言模型的自我改进和自我进化
【RLChina论文研讨会】第53期 张子谦 Fast Teammate Adaptation in the Presence of Sudden Policy
【RLChina 2020】第4讲 Model-based Reinforcement Learning
【RLChina论文研讨会】第74期 程旭欣 Extreme Parkour with Legged Robots
【RLChina 论文研讨会】第2期 刘明桓 Curriculum Offline Imitation Learning
【RLChina 2020】第9讲 Multi-agent Systems
【RLChina论文研讨会】第89期 贾乘兴 Offline Transition Modeling via Contrastive Energy Learni
【RLChina 2023】主旨报告 邓小铁 On Provable Bound of Nash Equilibrium Approximtor
【RLChina 2023】Tutorial 杜雅丽 Cooperation in Multi-Agent Learning:A Review
【RLChina 2023】Workshop8 陈立 基于RL的足式机器人控制技术
【RLChina 2020】第7讲 Learning with Sparse Rewards
【RLChina 2023】特别论坛 王磊 When Large Language Model based Agent Meets User Behavior
【RLChina论文研讨会】第90期 徐圣 Robust Inverse Constrained Reinforcement Learning under Mo
【RLChina论文研讨会】第74期 凌逸飏 GenSim:Generating Robotic Simulation Tasks via Large Lang
【RLChina 2023】主旨报告 安波 Towards Foundation Agents:Autonomous Agents, AI Agents
【RLChina论文研讨会】第77期 张蒲石 Distributional Pareto-Optimal Multi-Objective Reinforcem
【RLChina论文研讨会】第85期 葛振兴 Safe and Robust Subgame Exploitation in Imperfect Informa
【RLChina论文研讨会】第69期 黄红蓝 Active Client Selection for Clustered Federated Learning
【RLChina 2021】第18课 专题报告 —— 多智能体通信与协同中的博弈论与强化学习 方飞
【RLChina 2023】Workshop7 杨耀东 从偏好对齐到价值对齐与超对齐
【RLChina 2023】Workshop3 林衍凯 大模型工具学习
【RLChina 2022】前沿进展十:Fully Decentralized Multi-Agent RL 卢宗青
【RLChina论文研讨会】第71期 丁枢桐 Reduced Policy Optimization for Continuous Control with
【RLChina论文研讨会】第88期 张谷 Learning Dexterous Robot Manipulation Skills Based On 3D V
【RLChina 2023】Workshop3 梁一韬 在开放环境下对于通用代理(智能体)的尝试
【RLChina论文研讨会】第58期 王锡淮 Order Matters:Agent-by-agent Policy Optimization
【RLChina论文研讨会】第61期 何浩然 Diffusion:Model is an Effective Planner and Data Synthesi
【RLChina 2023】Workshop5 方蒙 Language Agents for Text-based Games
【RLChina 2023】Workshop5 宋研 Evaluation of Agents
【RLChina论文研讨会】第75期 辜鹏杰 Offline RL with discrete proxy representations for genera
【RLChina论文研讨会】第82期 梁志烜 SkillDiffuser: Interpretable Hierarchical Planning via
【RLChina论文研讨会】第93期 耿子介 Reinforcement Learning with Tree Search for Fast Macro Pl
【RLChina论文研讨会】第85期 朱毅文 vMFER:Von Mises-Fisher Experience Resampling Based on Unc
【RLChina论文研讨会】第89期 邱文杰 Debiased Offline Representation Learning for Fast Online
【RLChina 2023】Workshop8 许华哲 基础大模型一机器人操作的先验知识库
【RLChina论文研讨会】第84期 王俊 CyberDemo Augmenting Simulated Human Demonstration for Rea