V
主页
京东 11.11 红包
【RLChina 2023】Workshop2 蔡庆芃 短视频推荐强化学习算法
发布人
课件下载:http://rlchina.org/rlchina_2023/
打开封面
下载高清视频
观看高清视频
视频下载器
【RLChina 2021】第11课 多智能体入门(一) 杨耀东
【RLChina 2023】Tutorial 杨梦月 Causality For Decision Making
【RLChina 2022】实践课五:离线强化学习算法 秦熔均
具身智能新思路———Diffusion Policy 结合 PPO 模仿+强化 (上)
【RLChina 2023】Tutorial 张伟楠 强化学习入门
【RLChina 2023】Workshop7 杨耀东 从偏好对齐到价值对齐与超对齐
【RLChina论文研讨会】第81期 曲云 基于反事实保守Q学习的离线多智能体强化学习算法
【RLChina 2023】Tutorial 杜雅丽 Cooperation in Multi-Agent Learning:A Review
【RLChina 2023】Workshop9 鲍凡 多模态生成大模型
【RLChina 2023】Workshop2 吴翼 Diversity-Driven Reinforcment Learning
【RLChina 2022】理论课三:强化学习基础 张伟楠
【RLChina 2022】前沿进展二:强化学习在金融决策里的应用 徐任远
【RLChina 论文研讨会】第27期 王琦 基于模型的元强化学习:一种图结构代理模型和快速迁移的策略学习
【RLChina 2023】专题报告二:从生成式大模型到决策式大模型 张伟楠
【RLChina论文研讨会】第78期 胡紫灿 多智能体强化学习中基于注意力的对比角色表征
【RLChina 2023】Workshop4 李林静 动态存储增强的决策大模型
【RLChina 2023】Workshop3 张宁豫 大模型智能体的自主规划学习
UCL 汪军教授《Multi-agent AI》课程(中文字幕)
【RLChina论文研讨会】第80期 叶鸣轩 强化学习中基于状态序列频域预测的表征学习方法
【RLChina 论文研讨会】第28期 刘宗凯 基于策略多样性的多智能体强化学习
【RLChina 2023】Workshop8 陈立 基于RL的足式机器人控制技术
【RLChina 2021】第12课 多智能体入门(二) 杜雅丽
【RLChina 2023】Workshop8 张新宇 智能体精细灵巧操作关键问题研究
【RLChina 2023】特别论坛 王磊 When Large Language Model based Agent Meets User Behavior
【RLChina 2023】Workshop4 连德富 大语言模型驱动的交互式推荐智能体
【RLChina论文研讨会】第37期 梁贺斌 基于深度强化学习求解MinMax多旅行商问题的序列切割算法
【RLChina 2023】 专题报告三:强化学习与语言大模型的一些共通点 俞扬
【RLChina论文研讨会】第30期 徐志伟 基于模型的合作多智能体强化学习方法
【RLChina论文研讨会】第81期 曲云 一种基于真实王者荣耀游戏的离线强化学习数据集
【RLChina 2022】理论课一:机器学习和深度学习基础 陈旭
【RLChina论文研讨会】第41期 杨林鑫 混合整数线性优化问题上基于图神经网络的“预测-搜索”算法框架
【RLChina 2023】Workshop4 郑岩 大模型时代下的AGI Agent
【RLChina论文研讨会】第72期 张知临 强化学习在阿里妈妈广告场景的大规模落地实践
【RLChina 2022】专题报告一:多智能体强化学习 张崇洁
【RLChina论文研讨会】第72期 米祈睿 TaxAI多智能体强化学习的动态经济模拟器和基准
【RLChina 2021】第5课 强化学习入门(一) 张伟楠
【RLChina 2023】Workshop6 杨成 大语言模型智能体合作框架
【RLChina论文研讨会】第67期 张钰荻 强化学习中可解释的奖励重新分配:一种因果角度方法
【RLChina 2023】Workshop9 杨宁 智能运筹创新应用
【RLChina论文研讨会】第63期 赵一诺 机械臂控制中的视觉强化学习策略泛化研究近况