V
主页
京东 11.11 红包
【RLChina论文研讨会】第26期 王丽 个体奖励辅助的多智能体强化学习方法
发布人
课件下载:http://rlchina.org/topic/480
打开封面
下载高清视频
观看高清视频
视频下载器
【RLChina论文研讨会】第34期 马一宁 解决车辆路径问题的深度强化学习方法:近期发展及挑战
【RLChina 2022】前沿进展五:应用多智能体强化学习解决现实问题——机遇和挑战 方飞
【RLChina 2022】前沿进展二:强化学习在金融决策里的应用 徐任远
【RLChina论文研讨会】第43期 王治海 面向资源受限强化学习的高效探索
【RLChina论文研讨会】第30期 徐志伟 基于模型的合作多智能体强化学习方法
【RLChina论文研讨会】第35期 袁雷 基于演化生成及辅助对抗攻击训练的鲁棒性多智能体强化学习
【RLChina论文研讨会】第61期 何浩然 Diffusion:Model is an Effective Planner and Data Synthesi
【RLChina论文研讨会】第51期 杨以钦 离线强化学习中的无监督数据共享
【RLChina 2021】第18课 专题报告 —— 多智能体通信与协同中的博弈论与强化学习 方飞
【RLChina论文研讨会】第50期 杨如帅 基于行为对比的强化学习技能挖掘方法
【RLChina 论文研讨会】第28期 刘宗凯 基于策略多样性的多智能体强化学习
【RLChina论文研讨会】第35期 薛轲 多智能体动态算法配置
【RLChina论文研讨会】第58期 王锡淮 Order Matters:Agent-by-agent Policy Optimization
【RLChina 2021】第11课 多智能体入门(一) 杨耀东
【RLChina 2022】理论课三:强化学习基础 张伟楠
【RLChina 2021】第12课 多智能体入门(二) 杜雅丽
【RLChina论文研讨会】第80期 叶鸣轩 强化学习中基于状态序列频域预测的表征学习方法
【RLChina论文研讨会】第70期 吴梓帆 优化基于模型多智能体强化学习中的多步局部模型交互
【RLChina论文研讨会】第46期 宋研 强化学习中的系统设计
【RLChina 2022】前沿进展三:演化强化学习的研究与应用 郑岩
【RLChina 2022】实践课五:离线强化学习算法 秦熔均
【RLChina论文研讨会】第41期 杨林鑫 混合整数线性优化问题上基于图神经网络的“预测-搜索”算法框架
【RLChina 论文研讨会】第2期 刘明桓 Curriculum Offline Imitation Learning
【RLChina论文研讨会】第78期 袁昊琦 用预训练目标模型辅助强化学习中的样本高效利用
【RLChina论文研讨会】第38期 张福翔 Discovering Generalizable Multi-agent Coordination Skills
【RLChina论文研讨会】第24期 王远非 Multi-Agent Communication and Cooperation with Theory of
UCL 汪军教授《Multi-agent AI》课程(中文字幕)
【RLChina论文研讨会】第78期 胡紫灿 多智能体强化学习中基于注意力的对比角色表征
【RLChina 2021】第10课 强化学习前沿(二)俞扬
【RLChina论文研讨会】第19期 袁雷 Multi-Agent Incentive Communication via Decentralized Team
【RLChina论文研讨会】第97期 胡昊 基于贝叶斯原则的离线到在线强化学习
【RLChina论文研讨会】第86期 王圣杰 EfficientZero V2:一种通用且采样高效的基于模型强化学习方法
【RLChina论文研讨会】第72期 张知临 强化学习在阿里妈妈广告场景的大规模落地实践
【RLChina论文研讨会】第45期 赖行 Sim-to-Real Transfer for Quadrupedal Locomotion
【RLChina论文研讨会】第47期 张策尧 深度强化学习赋能光子晶体微腔激光器的自动反向设计和优化
【RLChina论文研讨会】第80期 冯加恒 离线到在线强化学习中的稳定化无约束微调
【RLChina论文研讨会】第15期 陈睿卿 Multi-Agent Trust Region Policy Optimization Algorithm
【RLChina论文研讨会】第59期 王翰竟 用于大型强化学习模型的以gpu为中心的经验回放系统
【RLChina论文研讨会】第45期 穆尧 AdaptDiffuser:Diffusion Models as Adaptive Self-evolving
【RLChina论文研讨会】第25期 温睦宁 MARL is a Sequence Modeling Problem