【RLChina论文研讨会】第67期张钰荻强化学习中可解释的奖励重新分配：一种因果角度方法 - 视频下载 Video Downloader

京东 11.11 红包

【RLChina论文研讨会】第67期张钰荻强化学习中可解释的奖励重新分配：一种因果角度方法

发布人

打开封面下载高清视频观看高清视频视频下载器

【RLChina论文研讨会】第87期林越多智能体强化学习中的信息设计

【RLChina论文研讨会】第86期王圣杰 EfficientZero V2：一种通用且采样高效的基于模型强化学习方法

【RLChina论文研讨会】第70期朱文轩基于观察数据的深度因果强化学习

【RLChina 论文研讨会】第27期王琦基于模型的元强化学习：一种图结构代理模型和快速迁移的策略学习

【RLChina论文研讨会】第34期马一宁解决车辆路径问题的深度强化学习方法：近期发展及挑战

【RLChina论文研讨会】第72期张知临强化学习在阿里妈妈广告场景的大规模落地实践

【RLChina论文研讨会】第80期叶鸣轩强化学习中基于状态序列频域预测的表征学习方法

【RLChina论文研讨会】第52期郝晓田多智能体强化学习中的置换不变性和置换同变性

【RLChina论文研讨会】第80期冯加恒离线到在线强化学习中的稳定化无约束微调

【RLChina论文研讨会】第82期梁志烜 SkillDiffuser: Interpretable Hierarchical Planning via

【RLChina论文研讨会】第68期阳明宇分层多智能体技能发现

【RLChina论文研讨会】第92期张万鹏通过因果表示解决强化学习中的非平稳性问题

【RLChina论文研讨会】第88期徐国玮基于“神经元冬眠”效应的高样本效率视觉强化学习算法

【RLChina论文研讨会】第43期阳明宇多智能体强化学习中的动态子任务分配

【RLChina论文研讨会】第74期程旭欣 Extreme Parkour with Legged Robots

【RLChina论文研讨会】第51期杨以钦离线强化学习中的无监督数据共享

【RLChina论文研讨会】第86期毛怡欢风格化强化学习：从异质数据集中抽取多样性、高质量的行为

【RLChina论文研讨会】第78期陈炤桦重复二价拍卖中的动态预算节流方法

【RLChina 2023】专题报告三：强化学习与语言大模型的一些共通点俞扬

【RLChina论文研讨会】第90期徐圣 Robust Inverse Constrained Reinforcement Learning under Mo

【RLChina论文研讨会】第43期王治海面向资源受限强化学习的高效探索

【RLChina论文研讨会】第83期曾勇程 Token-level Direct Preference Optimization

【RLChina论文研讨会】第66期周伯涵通过离线预训练模型从视觉观测中学习策略

【RLChina论文研讨会】第80期庞竟成不懂就问：主动询问有助于提升大语言模型回答质量

【RLChina论文研讨会】第61期何浩然 Diffusion：Model is an Effective Planner and Data Synthesi

【RLChina论文研讨会】第88期胡开哲 Affordance Generalization Beyond Categories via Semantic

【RLChina论文研讨会】第86期黄浩栩基于基础大模型的通用机器人操作框架

【RLChina论文研讨会】第77期张蒲石 Distributional Pareto-Optimal Multi-Objective Reinforcem

【RLChina论文研讨会】第82期胡梦康 Tree-Planner：Efficient Close-loop Task Planning with

【RLChina论文研讨会】第26期王丽个体奖励辅助的多智能体强化学习方法

【RLChina 2021】第6课强化学习入门（二）杨林

【RLChina 2021】第5课强化学习入门（一）张伟楠

【RLChina论文研讨会】第76期董恒基于双曲表征的多细胞机器人设计

【RLChina论文研讨会】第69期吕怡琴 A Simple Yet Effective Strategy to Robustify the Meta Lea

【RLChina 论文研讨会】第29期白丰硕元奖励网络：一种隐式微分奖励学习的基于偏好的强化学习方法

【RLChina论文研讨会】第73期洪逸宁构建具身智能的3D基础大模型

【RLChina论文研讨会】第87期盛俊杰语言智能体可以作为PPO的替代吗？一个在OpenAI Gym上的初步研究

【RLChina 2021】第8课强化学习进阶（二）汪军

【RLChina论文研讨会】第52期吴吉洲多智能体强化学习自动课程学习

【RLChina 2021】第18课专题报告 —— 多智能体通信与协同中的博弈论与强化学习方飞