V
主页
京东 11.11 红包
【RLChina 2023】Workshop7 杨耀东 从偏好对齐到价值对齐与超对齐
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
【RLChina 2023】Tutorial 杨梦月 Causality For Decision Making
【RLChina 2023】Workshop7 张崇洁 Offiline Reinforcement Learning with Reward-Free Dat
【RLChina 2023】Workshop8 陈立 基于RL的足式机器人控制技术
【RLChina 2023】Workshop2 章宗长 驾驭信息:智能决策Agent的设计及挑战
【RLChina 2023】Workshop1 王立威 A Theory of Chain of Thought
【RLChina 2023】主旨报告 邓小铁 On Provable Bound of Nash Equilibrium Approximtor
【RLChina 2023】 专题报告六:基于大语言模型的开放世界智能决策 杨耀东
【RLChina 2021】第3课 博弈论入门 张海峰
【RLChina 2023】Workshop2 吴翼 Diversity-Driven Reinforcment Learning
【RLChina论文研讨会】第91期 刘润泽 PEARL:机器人操作的零样本跨任务偏好对齐和鲁棒奖励学习
【RLChina 2023】Tutorial 张伟楠 强化学习入门
【RLChina 2023】Workshop8 许华哲 基础大模型一机器人操作的先验知识库
【RLChina 2023】Workshop4 李林静 动态存储增强的决策大模型
【RLChina 2023】Workshop3 卢暾 以人为中心的推荐系统模拟——大模型驱动的Agent建模方法
【RLChina 2023】Workshop3 梁一韬 在开放环境下对于通用代理(智能体)的尝试
【RLChina 2023】Workshop9 鲍凡 多模态生成大模型
【RLChina 2023】Workshop4 Panel Discussion 大语言模型辅助的智能体决策与推理
【RLChina 2023】Workshop5 宋研 Evaluation of Agents
【RLChina 2021】第12课 多智能体入门(二) 杜雅丽
【RLChina 2023】特别论坛 王磊 When Large Language Model based Agent Meets User Behavior
震撼!AI 像人一样操作手机,AutoGLM 一句话指令搞定一切
【RLChina 2023】主旨报告 刘群 大语言模型的自我改进和自我进化
【RLChina 2023】Workshop1 Jean-Claude Belfiore Reality and its representations:a m
【RLChina 2023】Tutorial 方蒙 Generative AI:NLP
【RLChina 2023】Workshop9 杨宁 智能运筹创新应用
【RLChina 2023】Workshop4 郑岩 大模型时代下的AGI Agent
【RLChina 2022】理论课一:机器学习和深度学习基础 陈旭
【RLChina 2023】Workshop5 方蒙 Language Agents for Text-based Games
【RLChina 2021】第5课 强化学习入门(一) 张伟楠
【RLChina 2021】第1课 机器学习入门 陈旭
【RLChina 2022】前沿进展二:强化学习在金融决策里的应用 徐任远
【RLChina 2023】Workshop4 王文冠 知识和大模型驱动的具身智能
【RLChina 2023】Workshop1 袁洋 On the Power of Foundation Models
【RLChina 2023】Workshop4 连德富 大语言模型驱动的交互式推荐智能体
【RLChina 2022】前沿进展十:Fully Decentralized Multi-Agent RL 卢宗青
【RLChina 2023】 专题报告四:预训练,指令微调,对齐,专业化:论大语言模型能力的来源 符尧
具身智能新思路———Diffusion Policy 结合 PPO 模仿+强化 (上)
【RLChina 2021】第2课 机器学习进阶 张景昭
【RLChina 2023】Workshop3 张宁豫 大模型智能体的自主规划学习
【RLChina 2022】专题报告二:贝叶斯优化 汪军、Rasul Tutunov