V
主页
京东 11.11 红包
【RLChina论文研讨会】第20期 张杨 基于离线强化学习框架的在线优惠券分配策略研究
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
【RLChina 2022】前沿进展二:强化学习在金融决策里的应用 徐任远
【RLChina 2022】前沿进展五:应用多智能体强化学习解决现实问题——机遇和挑战 方飞
对某个目标的焦虑感里,其实隐藏着你的能力和天赋。
【RLChina论文研讨会】第34期 马一宁 解决车辆路径问题的深度强化学习方法:近期发展及挑战
【RLChina论文研讨会】第24期 袁昊琦 离线元强化学习中基于对比学习的稳定任务表示
【RLChina论文研讨会】第31期 姜力 一种模仿结合策略引导的离线强化学习算法
【RLChina 2023】 专题报告三:强化学习与语言大模型的一些共通点 俞扬
【RLChina 论文研讨会】第29期 郭亨铨 强约束条件下在线凸优化算法研究
【具身论文阅读】Diffuser: 基于diffusion的强化学习规划器
【RLChina论文研讨会】第31期 牛浩懿 何时相信你的仿真器:考虑动力学偏差的混合离线在线强化学习
【RLChina 2021】第11课 多智能体入门(一) 杨耀东
这可能是我见过强化学习和模型预测控制最好的教程!四大名校教授精讲动态系统和仿真、最优控制、策略梯度方法、MPC
大模型如何增强强化学习?简单粗暴理解大模型训练中的人类反馈强化学习RLHF!PPO算法、ChatGPT背后的数学原理
【RLChina 论文研讨会】第29期 白丰硕 元奖励网络:一种隐式微分奖励学习的基于偏好的强化学习方法
双热点强强联合的发文方向:Transformer+强化学习!
【RLChina 论文研讨会】第27期 王琦 基于模型的元强化学习:一种图结构代理模型和快速迁移的策略学习
【RLChina 2021】第5课 强化学习入门(一) 张伟楠
UCL 汪军教授《Multi-agent AI》课程(中文字幕)
强化学习前沿算法与实践应用 RLChina X 飞桨北京领航团Meetup
【RLChina 论文研讨会】第28期 吴梓帆 规划模型预测:基于策略与模型角色反转的有模型强化学习算法
MPC+强化学习!Actor Critic模型预测控制,苏黎世大牛教授人类水平性能的自主视觉无人机演讲
一个很变态......但可以光速学会人工智能基础的神奇方法!B站强推,少走99%的弯路,资深大佬花费256小时整理的2024最全面人工智能教程!
Transformer+强化学习成为双热点强强联合的发文方向
【RLChina论文研讨会】第43期 庄梓峰 行为近端策略优化
【RLChina 2023】话题讨论:ChatGPT后的通用人工智能理论和应用
【RLChina论文研讨会】第78期 袁昊琦 用预训练目标模型辅助强化学习中的样本高效利用
【RLChina 前沿讲习班】第5期 流体力学专题 第1场 浙江大学 谢芳芳
【RLChina论文研讨会】第33期 万旭 AdapSafe面向低碳电力系统频率控制的自适应与安全保证深度强化学习算法
【RLChina论文研讨会】第70期 朱文轩 基于观察数据的深度因果强化学习
【唐宇迪 | 强化学习】大模型必备的强化学习教程来了!绝对是2024年讲的最好的强化学习零基础入门到精通完整版教程!!(含实战源码)
成为一个在历史上留下痕迹的人有多难?
一个能让你做成任何事的顶级心法:「准时出摊」
【RLChina论文研讨会】第97期 胡昊 基于贝叶斯原则的离线到在线强化学习
【RLChina 2022】理论课四:强化学习的直接法与间接法 李升波
【RLChina 论文研讨会】第29期 蒋铮尧 隐动作空间内的高效规划
【RLChina论文研讨会】第51期 杨以钦 离线强化学习中的无监督数据共享
强化学习四足机器人一
【RLChina 2023】专题报告二:从生成式大模型到决策式大模型 张伟楠
【RLChina论文研讨会】第48期 林谦 面向实时预算约束的离线安全强化学习
【RLChina论文研讨会】第42期 徐浩添 基于群体强化学习的质量相似多样性