【RLChina 2023】Workshop2 蔡庆芃短视频推荐强化学习算法 - 视频下载 Video Downloader

京东 11.11 红包

【RLChina 2023】Workshop2 蔡庆芃短视频推荐强化学习算法

发布人

课件下载：http://rlchina.org/rlchina_2023/

打开封面下载高清视频观看高清视频视频下载器

【RLChina 2021】第11课多智能体入门（一）杨耀东

【RLChina 2023】Tutorial 杨梦月 Causality For Decision Making

【RLChina 2022】实践课五：离线强化学习算法秦熔均

具身智能新思路———Diffusion Policy 结合 PPO 模仿+强化（上）

【RLChina 2023】Tutorial 张伟楠强化学习入门

【RLChina 2023】Workshop7 杨耀东从偏好对齐到价值对齐与超对齐

【RLChina论文研讨会】第81期曲云基于反事实保守Q学习的离线多智能体强化学习算法

【RLChina 2023】Tutorial 杜雅丽 Cooperation in Multi-Agent Learning：A Review

【RLChina 2023】Workshop9 鲍凡多模态生成大模型

【RLChina 2023】Workshop2 吴翼 Diversity-Driven Reinforcment Learning

【RLChina 2022】理论课三：强化学习基础张伟楠

【RLChina 2022】前沿进展二：强化学习在金融决策里的应用徐任远

【RLChina 论文研讨会】第27期王琦基于模型的元强化学习：一种图结构代理模型和快速迁移的策略学习

【RLChina 2023】专题报告二：从生成式大模型到决策式大模型张伟楠

【RLChina论文研讨会】第78期胡紫灿多智能体强化学习中基于注意力的对比角色表征

【RLChina 2023】Workshop4 李林静动态存储增强的决策大模型

【RLChina 2023】Workshop3 张宁豫大模型智能体的自主规划学习

UCL 汪军教授《Multi-agent AI》课程（中文字幕）

【RLChina论文研讨会】第80期叶鸣轩强化学习中基于状态序列频域预测的表征学习方法

【RLChina 论文研讨会】第28期刘宗凯基于策略多样性的多智能体强化学习

【RLChina 2023】Workshop8 陈立基于RL的足式机器人控制技术

【RLChina 2021】第12课多智能体入门（二）杜雅丽

【RLChina 2023】Workshop8 张新宇智能体精细灵巧操作关键问题研究

【RLChina 2023】特别论坛王磊 When Large Language Model based Agent Meets User Behavior

【RLChina 2023】Workshop4 连德富大语言模型驱动的交互式推荐智能体

【RLChina论文研讨会】第37期梁贺斌基于深度强化学习求解MinMax多旅行商问题的序列切割算法

【RLChina 2023】专题报告三：强化学习与语言大模型的一些共通点俞扬

【RLChina论文研讨会】第30期徐志伟基于模型的合作多智能体强化学习方法

【RLChina论文研讨会】第81期曲云一种基于真实王者荣耀游戏的离线强化学习数据集

【RLChina 2022】理论课一：机器学习和深度学习基础陈旭

【RLChina论文研讨会】第41期杨林鑫混合整数线性优化问题上基于图神经网络的“预测-搜索”算法框架

【RLChina 2023】Workshop4 郑岩大模型时代下的AGI Agent

【RLChina论文研讨会】第72期张知临强化学习在阿里妈妈广告场景的大规模落地实践

【RLChina 2022】专题报告一：多智能体强化学习张崇洁

【RLChina论文研讨会】第72期米祈睿 TaxAI多智能体强化学习的动态经济模拟器和基准

【RLChina 2021】第5课强化学习入门（一）张伟楠

【RLChina 2023】Workshop6 杨成大语言模型智能体合作框架

【RLChina论文研讨会】第67期张钰荻强化学习中可解释的奖励重新分配：一种因果角度方法

【RLChina 2023】Workshop9 杨宁智能运筹创新应用

【RLChina论文研讨会】第63期赵一诺机械臂控制中的视觉强化学习策略泛化研究近况