V
主页
青源 LIVE 第 29 期 |使用有限的数据掌握Atari游戏
发布人
当前强化学习已在许多应用中取得了巨大成功。但样本效率仍是强化学习中一个重大挑战,重要的方法需要数百万(甚至数十亿)的环境步骤来训练。虽然,当前在基于图像的样本高效RL算法方面取得了重大进展;但是,在Atari游戏基准上,要达到与人类水平相一致,仍然是一个难以实现的目标。 智源社区特邀请了清华大学交叉信息研究院助理教授高阳博士分享其团队的新研究《使用有限数据掌控Atari游戏》( Mastering Atari Games with Limited Data)。
打开封面
下载高清视频
观看高清视频
视频下载器
青源 LIVE 第27期 | 可迁移、可解释的单细胞RNA测序模型
青源LIVE第34期
青源 LIVE 第 32 期 | 蔡瑞初:因果关系发现进展及其应用
青源LIVE第45期 | 哈工大教授车万翔:自然语言处理中的伪数据
青源LIVE 第37期 | 张坤:因果与学习
青源 LIVE 第 18 期 | 达摩院王玮:超大规模中文理解&生成联合模型PLUG
青源 LIVE 第 31 期 | 旷视研究院:用于物体检测的实例条件知识蒸馏 | NeurIPS 2021
2024北京智源大会-人工智能+数据新基建
青源Salon 第一期 | 强化学习专场报告,吴翼,方飞,顾世翔,杜少雷,高阳、张崇洁
青源LIVE第39期 | 微软徐一翀:在常识问答中超越人类水平?自注意力与外注意力机制
青源live30期丨Envpool-高性能RL环境并行模拟器
青源 LIVE 第 21 期 | 人大张静:知识图谱的神经符号推理
青源Talk第19期丨技能网络:解决多任务多模态问题的稀疏模型
青源Talk第11期|刘偲: AI+艺术
青源LIVE第46期 | 上海交大教授卢策吾:行为理解与具身智能
青源LIVE第35期
【浙大知识图谱完整版】不愧是浙大教授!5小时让我搞定了知识图谱!知识图谱/计算机视觉/神经网络
青源Talk第9期|冯洋: 从Sequence–to–Sequence生成到Prefix–to–Prefix生成
青源Talk第17期丨多样性强化学习:不光要赢,还要赢得精彩
青源 LIVE 第 20 期 | 复旦大学吴祖煊:动态选择,高效识别「视频内容」
青源LIVE第33期 | 夸父AI—用于大规模并行训练的统一深度学习系统
青源 LIVE 第 28 期 | 下一代AI芯片—存内计算的硬核与软着陆
青源Talk第二期丨从学习的角度看NLP的现状与未来
青源Talk第一期丨自然人机交互的进展与挑战
青源 LIVE 第 13 期 | 牛津大学胡庆拥:学习理解大规模点云
【青源Live】第四期:AI可以帮我们实现自动审稿吗?
青源Talk第32期丨Understanding Deep Representation Learning via Neural Collapse
智源LIVE 第7期 | 何洋波:因果学习和推断的一种局部方法
青源Talk第28期丨快速高效AI大模型训练和部署
青源Talk第36期丨DRAM近存计算架构的发展、挑战与设计优化
青源Talk第29期丨视觉机器人学习
“青源Talk”第38期 | 从数据中自动发现物理规律
青源 LIVE 第 19期 | 佐治亚理工杨笛一:少数据,多框架的自然语言处理
青源 LIVE 第 10 期 | 南洋理工张含望:因果推理在计算机视觉中的进展
青源Talk第35期丨Generative Biology: Towards Building the “ChatGPT” in Biology.
青源Talk第12期|吴琦:视觉-语言导航新进展:Pre-training与Sim2
智源LIVE 第11期 | 胡迪:听声识物与辨物知声
青源 LIVE 第 16 期 | CVPR 2021 预讲 · 悉尼科技大学 ReLER 实验室专场
CV强化论文分享-20240829-2
人工智能革命:科技领袖探讨医疗、游戏与情感机器人的未来|双语