【RLChina 2022】前沿进展五：应用多智能体强化学习解决现实问题——机遇和挑战方飞 - 视频下载 Video Downloader

京东 11.11 红包

【RLChina 2022】前沿进展五：应用多智能体强化学习解决现实问题——机遇和挑战方飞

发布人

打开封面下载高清视频观看高清视频视频下载器

【RLChina 2021】第11课多智能体入门（一）杨耀东

【RLChina 2022】专题报告一：多智能体强化学习张崇洁

【RLChina 2022】前沿进展二：强化学习在金融决策里的应用徐任远

【RLChina 2022】前沿进展三：演化强化学习的研究与应用郑岩

【RLChina 2022】前沿进展九：多样性强化学习——不光要赢，还要赢得精彩吴翼

【RLChina论文研讨会】第97期胡昊基于贝叶斯原则的离线到在线强化学习

【RLChina 前沿讲习班】第2期游戏智能体专题第2场网易伏羲实验室胡裕靖

【RLChina 2021】第14课多智能体进阶（二）徐任远

【RLChina 2022】理论课五：深度强化学习张启超

【RLChina 2023】Tutorial 张伟楠强化学习入门

【RLChina 2021】第15课多智能体前沿（一）吴翼

《强化学习》第5章蒙特卡洛MC方法

【RLChina论文研讨会】第89期贾乘兴 Offline Transition Modeling via Contrastive Energy Learni

【RLChina 2021】第3课博弈论入门张海峰

【RLChina论文研讨会】第34期马一宁解决车辆路径问题的深度强化学习方法：近期发展及挑战

【RLChina 2022】前沿进展七：深度强化学习的若干前沿方向柯良军

【RLChina 2023】主旨报告安波 Towards Foundation Agents：Autonomous Agents, AI Agents

【RLChina 前沿讲习班】第2期游戏智能体专题第1场中科院自动化研究所朱圆恒

【RLChina论文研讨会】第87期盛俊杰语言智能体可以作为PPO的替代吗？一个在OpenAI Gym上的初步研究

【RLChina论文研讨会】第34期尤扬 POMDP与Dec-POMDP问题的精确与近似解法

【RLChina 2023】专题报告三：强化学习与语言大模型的一些共通点俞扬

【RLChina论文研讨会】第85期葛振兴 Safe and Robust Subgame Exploitation in Imperfect Informa

【RLChina论文研讨会】第86期毛怡欢风格化强化学习：从异质数据集中抽取多样性、高质量的行为

【强推】李宏毅深度强化学习完整版教程！简单易懂的PPO算法强化学习入门课程！近端策略优化、Transformer

【RLChina论文研讨会】第79期金宣法学会策略性发言：以《一夜终极狼人杀》为例

【RLChina 2022】理论课四：强化学习的直接法与间接法李升波

【RLChina 2023】Workshop1 王立威 A Theory of Chain of Thought

【具身论文阅读】Diffuser: 基于diffusion的强化学习规划器

【RLChina 2023】Workshop4 Panel Discussion 大语言模型辅助的智能体决策与推理

【RLChina 2023】Workshop6 杨成大语言模型智能体合作框架

【RLChina论文研讨会】第67期张钰荻强化学习中可解释的奖励重新分配：一种因果角度方法

【RLChina论文研讨会】第83期曾勇程 Token-level Direct Preference Optimization

【RLChina 2023】Workshop5 宋研 Evaluation of Agents

【RLChina论文研讨会】第25期温睦宁 MARL is a Sequence Modeling Problem

【RLChina论文研讨会】第80期冯加恒离线到在线强化学习中的稳定化无约束微调

【RLChina 2023】Workshop8 张新宇智能体精细灵巧操作关键问题研究

【共享LLM前沿】直观理解大模型预训练和微调！P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习微调，代码讲解

【RLChina论文研讨会】第72期米祈睿 TaxAI多智能体强化学习的动态经济模拟器和基准

【RLChina论文研讨会】第89期邱文杰 Debiased Offline Representation Learning for Fast Online

【RLChina 2023】Tutorial 杨梦月 Causality For Decision Making