V
主页
20220330特邀报告【数据驱动的强化学习及其工业应用】俞扬 (南京大学)
发布人
报告时间:2022年03月30日 (星期三)晚上20:00 (北京时间) 主题:数据驱动的强化学习及其工业应用 主持人:魏秀参 (南京理工大学) 特邀报告嘉宾:俞扬 (南京大学) 报告题目:数据驱动的强化学习及其工业应用 报告人简介: 俞扬,南京大学人工智能学院教授,主要从事机器学习、强化学习的研究工作。入选国家万人计划青年拔尖人才计划、AI's 10 to Watch。获CCF-IEEE青年科学家奖,首届亚太数据挖“青年成就奖”,并受邀在国际人工智能联合大会 IJCAI'18 作“青年亮点报告” (Early Career Spotlight)。研究工作获4项国际论文奖励和3项国际算法竞赛冠军。 个人主页: www.lamda.nju.edu.cn/yuy 报告摘要: 强化学习现已成为机器学习最受关注的子领域之一,在游戏环境中表现出超越人类的决策控制能力。如何让强化学习走出游戏,用于生产力的提升,是报告人关注的问题。针对这一问题,报告人对数据驱动的强化学习开展了研究,并尝试使用在工业控制中。本次报告将汇报数据驱动强化学习的理论与技术进展,以及在工业控制中的应用案例。 参考文献: [1] Jing-Cheng Shi, Yang Yu, Qing Da, Shi-Yong Chen, and An-Xiang Zeng. Virtual-Taobao: Virtualizing real-world online retail environment for reinforcement learning. In: Proceedings of the 33rd AAAI Conference on Artificial Intelligence (AAAI’19), Honolulu, HI, 2019. [2] Tian Xu, Ziniu Li, Yang Yu. Error bounds of imitating policies and environments. In: Advances in Neural Information Processing Systems 33 (NeurIPS'20), Virtual Conference, 2020. [3] Tian Xu, Ziniu Li, Yang Yu, Zhi-Quan Luo. On Generalization of Adversarial Imitation Learning and Beyond. https://arxiv.org/abs/2106.10424, 2022. [4] Rongjun Qin, Songyi Gao, Xingyuan Zhang, Zhen Xu, Shengkai Huang, Zewen Li, Weinan Zhang, Yang Yu. NeoRL: A Near Real-World Benchmark for Offline Reinforcement Learning, https://arxiv.org/abs/2102.00714, 2021.
打开封面
下载高清视频
观看高清视频
视频下载器
20240731【多模态研究进展】徐偲:面向低质多模态数据的深度学习
20220615【AI for Science之物理信息驱动的深度学习】陆路:Learning operators using deep neural……
20220427特邀报告【复杂场景下的实用目标跟踪技术】卢湖川 (大连理工大学)
这才是科研人该学的!一口气学完目标检测六大算法-R-CNN、Fast R-CNN、YOLO、SSD等,原理到实战,太通俗易懂了!机器学习|深度学习|计算机视觉
20210625;短教程:《Transformers》;特邀讲师:邱锡鹏教授
上海交大张伟楠强化学习课程第16讲:基于扩散模型的强化学习
强推!【全150集】机器学习+强化学习+深度学习,一口气带你全部学完!真的太通俗易懂了!(人工智能、深度学习、神经网络、机器学习算法、计算机视觉)
还得看吴恩达!一口气讲透CNN、RNN、GAN、LSTM、YOLO、transformer等六大深度学习神经网路算法!真的不要太爽~(AI人工智能丨机器学习)
20211215【学无止境:深度连续学习】洪晓鹏:记忆拓扑保持的深度增量学习方法
【VALSE2024】0505 杨易《特邀报告:混合模型驱动的内容生成与具身智能》
20220505【VALSE短教程】《因果发现与因果性学习》特邀讲师:蔡瑞初教授
20240814【多模态医学图像处理及医学大模型的发展近况】王连生:病理数据的多模态分析
什么是卷积?强推!这绝对是全网最通俗易懂的【卷积神经网络教程】!草履虫听了都点头!人工智能、深度学习、机器学习
2024年最新!【人工智能三大算法】卡尔曼滤波、transformer、CNN卷积神经网络!6小时一次讲清楚!建议收藏!——(人工智能、深度学习、机器学习)
Arm+Qt+opencv嵌入式项目-基于人脸识别的考勤系统!这可能是最好的嵌入式项目实战了吧!(人工智能、机器学习算法、神经网络、Pytorch、AI)
20220112【脉络分明:脉冲神经网络及其应用】余肇飞:脉冲神经网络学习理论与方法
发论文idea来了!强化学习融合Transformer,全是创新点!
人工智能医学影像处理实战:医疗大数据、影像组学、临床研究应用、SCI论文解读、Python数据处理、机器学习论文一口气学爽!
机器学习-强化学习详解!这绝对是全网最简单的强化学习基础概念与算法讲解,代码实战!
20210407【如何做出高水平的科研工作?--来自顶会AC/PC的观点】Panel
青龙人形机器人开源强化学习库GymLoong测试
从模型预测控制到强化学习10:“直来直往-直接给策略推荐”的确策略梯度(PG)方法REINFORCE-A2C-原理与仿真
这才是科研人该学的!一口气学完自动驾驶八大算法-环境感知、目标检测、语义分割、强化学习、决策与控制算法!原理到实战,太通俗易懂了!机器学习|深度学习|计算机视觉
IsaacLab+rsl_rl强化学习
强推!不愧是李宏毅教授!一口气把机器学习、深度学习、强化学习、神经网络、生成式AI给讲透了!存下吧,真的比啃书好多了!(AI人工智能/ChatGPT)
20240117【学术新人“修炼手册”】彭思达:完成一篇论文的科研历程与经验
性能翻倍!LSTM+Transformer王炸创新,荣登Nature,精度高达95.56%!!整理11种融合创新方案!机器学习|深度学习|计算机视觉
20211121特邀报告【人工智能在赋能设备、赋能临床、赋能科研中的应用实例】沈定刚(上海科技大学、上海联影智能医疗科技有限公司)
20220406【“热门中的冷门”-实用深度学习优化方法】刘日升:基于梯度的双层优化方法初探
我居然在9月只花7天学会机器学习十大算法!新手一口气学会线性回归、逻辑回归、SVM支持向量机、随机森林、决策树、贝叶斯、聚类算法、神经网络等十大算法!人工智能
【一起啃书】全16章机器学习西瓜书速成!算法原理+手推公式,线性回归、强化学习、聚类算法、规则学习、决策树
20240605【Prompt Learning in Vision】陈广义:Prompt Learning Meets Dense Context for …
Transformer一统天下!迪哥带你全面解析Transformer在各大领域的应用实战,学完秒懂基于Transformer实现的项目与论文写作!
论文创新秒懂!GNN图神经网络:原理++论文解读+代码复现,入门必看基础干货,全套教程快码住!深度学习/神经网络/人工智能
20211021【Transformer在医学图像处理的应用】Panel
20211222【自动驾驶中的机器视觉与学习问题】Panel
入门到进阶!一口气学完CNN、RNN、GAN、transformer、ResNet、BERT、GPT、YOLO等八大深度学习神经网络算法模型!
20220112【脉络分明:脉冲神经网络及其应用】Panel
强烈推荐给深度学习初学者的pytorch最全学习资源!!
20220713【超级视觉深度学习模型与标签学习方法】张敬:ViTAE Transformer 超级视觉深度学习模型