V
主页
京东 11.11 红包
【RLChina论文研讨会】第72期 米祈睿 TaxAI多智能体强化学习的动态经济模拟器和基准
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
【RLChina 2022】专题报告一:多智能体强化学习 张崇洁
强推!北京大学王树森半天就教会了我深度强化学习,原理详解+项目实战,学不会来打我!
【RLChina 论文研讨会】第27期 王琦 基于模型的元强化学习:一种图结构代理模型和快速迁移的策略学习
【RLChina论文研讨会】第67期 张钰荻 强化学习中可解释的奖励重新分配:一种因果角度方法
【RLChina 论文研讨会】第28期 刘宗凯 基于策略多样性的多智能体强化学习
【RLChina 2021】第11课 多智能体入门(一) 杨耀东
【RLChina论文研讨会】第43期 王治海 面向资源受限强化学习的高效探索
【RLChina论文研讨会】第97期 胡昊 基于贝叶斯原则的离线到在线强化学习
【RLChina论文研讨会】第70期 吴梓帆 优化基于模型多智能体强化学习中的多步局部模型交互
【RLChina 2022】前沿进展五:应用多智能体强化学习解决现实问题——机遇和挑战 方飞
【RLChina论文研讨会】第72期 张知临 强化学习在阿里妈妈广告场景的大规模落地实践
【RLChina论文研讨会】第63期 赵一诺 机械臂控制中的视觉强化学习策略泛化研究近况
【RLChina 2022】前沿进展二:强化学习在金融决策里的应用 徐任远
【RLChina论文研讨会】第88期 徐国玮 基于“神经元冬眠”效应的高样本效率视觉强化学习算法
【被导师放养】研究生SCI论文从写作到发表,SCI论文产出全过程精讲!手把手教你从写作到发表的全过程—论文写作_sci论文_sci论文写作
【RLChina 2022】理论课三:强化学习基础 张伟楠
Transformer+强化学习成为双热点强强联合的发文方向
【RLChina论文研讨会】第70期 朱文轩 基于观察数据的深度因果强化学习
【RLChina论文研讨会】第81期 曲云 一种基于真实王者荣耀游戏的离线强化学习数据集
【RLChina论文研讨会】第86期 毛怡欢 风格化强化学习:从异质数据集中抽取多样性、高质量的行为
【RLChina 2021】第12课 多智能体入门(二) 杜雅丽
【RLCHina 论文研讨会】第27期 刘世旋 增广POMDP:一种结合观测型数据和干预型数据的因果强化学习方法
【RLChina论文研讨会】第31期 姜力 一种模仿结合策略引导的离线强化学习算法
【RLChina 2021】第9课 强化学习前沿(一) 卢宗青
【RLChina论文研讨会】第24期 袁昊琦 离线元强化学习中基于对比学习的稳定任务表示
【RLChina论文研讨会】第68期 阳明宇 分层多智能体技能发现
【RLChina 2021】第7课 强化学习进阶(一) 杨卓然
不愧是李宏毅老师讲的【强化学习】简直太详细了!!小白也能信手拈来,建议收藏!(人工智能|机器学习|深度学习|强化学习)
【RLChina论文研讨会】第19期 袁雷 Multi-Agent Incentive Communication via Decentralized Team
【RLChina论文研讨会】第86期 王圣杰 EfficientZero V2:一种通用且采样高效的基于模型强化学习方法
【RLChina 2022】前沿进展七:深度强化学习的若干前沿方向 柯良军
【RLChina 2021】第14课 多智能体进阶(二) 徐任远
【RLChina 2023】专题报告二:从生成式大模型到决策式大模型 张伟楠
草履虫都能完成毕设!Opencv+YOLO实时目标检测,公认最适合毕业的计算机视觉实战教程!(深度学习丨计算机视觉丨YOLO丨OpenCV)
【RLChina 2023】 专题报告三:强化学习与语言大模型的一些共通点 俞扬
【RLChina论文研讨会】第67期 冯熙栋 类AlphaZero的树搜索可以引导语言模型解码与训练
【RLChina论文研讨会】第31期 牛浩懿 何时相信你的仿真器:考虑动力学偏差的混合离线在线强化学习
【RLChina论文研讨会】第75期 刘殊畅 KuaiSim:一个更全面的推荐系统用户模拟器
【RLChina论文研讨会】第18期 陈竞潇 王者荣耀中的人工智能方法
【RLChina论文研讨会】第48期 林谦 面向实时预算约束的离线安全强化学习