【RLChina 2023】Workshop7 杨耀东从偏好对齐到价值对齐与超对齐 - 视频下载 Video Downloader

京东 11.11 红包

【RLChina 2023】Workshop7 杨耀东从偏好对齐到价值对齐与超对齐

发布人

打开封面下载高清视频观看高清视频视频下载器

【RLChina 2023】Tutorial 杨梦月 Causality For Decision Making

【RLChina 2023】Workshop7 张崇洁 Offiline Reinforcement Learning with Reward-Free Dat

【RLChina 2023】Workshop8 陈立基于RL的足式机器人控制技术

【RLChina 2023】Workshop2 章宗长驾驭信息：智能决策Agent的设计及挑战

【RLChina 2023】Workshop1 王立威 A Theory of Chain of Thought

【RLChina 2023】主旨报告邓小铁 On Provable Bound of Nash Equilibrium Approximtor

【RLChina 2023】专题报告六：基于大语言模型的开放世界智能决策杨耀东

【RLChina 2021】第3课博弈论入门张海峰

【RLChina 2023】Workshop2 吴翼 Diversity-Driven Reinforcment Learning

【RLChina论文研讨会】第91期刘润泽 PEARL：机器人操作的零样本跨任务偏好对齐和鲁棒奖励学习

【RLChina 2023】Tutorial 张伟楠强化学习入门

【RLChina 2023】Workshop8 许华哲基础大模型一机器人操作的先验知识库

【RLChina 2023】Workshop4 李林静动态存储增强的决策大模型

【RLChina 2023】Workshop3 卢暾以人为中心的推荐系统模拟——大模型驱动的Agent建模方法

【RLChina 2023】Workshop3 梁一韬在开放环境下对于通用代理（智能体）的尝试

【RLChina 2023】Workshop9 鲍凡多模态生成大模型

【RLChina 2023】Workshop4 Panel Discussion 大语言模型辅助的智能体决策与推理

【RLChina 2023】Workshop5 宋研 Evaluation of Agents

【RLChina 2021】第12课多智能体入门（二）杜雅丽

【RLChina 2023】特别论坛王磊 When Large Language Model based Agent Meets User Behavior

震撼！AI 像人一样操作手机，AutoGLM 一句话指令搞定一切

【RLChina 2023】主旨报告刘群大语言模型的自我改进和自我进化

【RLChina 2023】Workshop1 Jean-Claude Belfiore Reality and its representations：a m

【RLChina 2023】Tutorial 方蒙 Generative AI：NLP

【RLChina 2023】Workshop9 杨宁智能运筹创新应用

【RLChina 2023】Workshop4 郑岩大模型时代下的AGI Agent

【RLChina 2022】理论课一：机器学习和深度学习基础陈旭

【RLChina 2023】Workshop5 方蒙 Language Agents for Text-based Games

【RLChina 2021】第5课强化学习入门（一）张伟楠

【RLChina 2021】第1课机器学习入门陈旭

【RLChina 2022】前沿进展二：强化学习在金融决策里的应用徐任远

【RLChina 2023】Workshop4 王文冠知识和大模型驱动的具身智能

【RLChina 2023】Workshop1 袁洋 On the Power of Foundation Models

【RLChina 2023】Workshop4 连德富大语言模型驱动的交互式推荐智能体

【RLChina 2022】前沿进展十：Fully Decentralized Multi-Agent RL 卢宗青

【RLChina 2023】专题报告四：预训练，指令微调，对齐，专业化：论大语言模型能力的来源符尧

具身智能新思路———Diffusion Policy 结合 PPO 模仿+强化（上）

【RLChina 2021】第2课机器学习进阶张景昭

【RLChina 2023】Workshop3 张宁豫大模型智能体的自主规划学习

【RLChina 2022】专题报告二：贝叶斯优化汪军、Rasul Tutunov