20220330特邀报告【数据驱动的强化学习及其工业应用】俞扬 (南京大学)

发布人

报告时间：2022年03月30日 (星期三)晚上20:00 (北京时间)
主题：数据驱动的强化学习及其工业应用
主持人：魏秀参 (南京理工大学)
特邀报告嘉宾：俞扬 (南京大学)
报告题目：数据驱动的强化学习及其工业应用
报告人简介：
俞扬，南京大学人工智能学院教授，主要从事机器学习、强化学习的研究工作。入选国家万人计划青年拔尖人才计划、AI&#39;s 10 to Watch。获CCF-IEEE青年科学家奖，首届亚太数据挖“青年成就奖”，并受邀在国际人工智能联合大会 IJCAI&#39;18 作“青年亮点报告” (Early Career Spotlight)。研究工作获4项国际论文奖励和3项国际算法竞赛冠军。
个人主页：
 www.lamda.nju.edu.cn/yuy
报告摘要：
强化学习现已成为机器学习最受关注的子领域之一，在游戏环境中表现出超越人类的决策控制能力。如何让强化学习走出游戏，用于生产力的提升，是报告人关注的问题。针对这一问题，报告人对数据驱动的强化学习开展了研究，并尝试使用在工业控制中。本次报告将汇报数据驱动强化学习的理论与技术进展，以及在工业控制中的应用案例。
参考文献：
[1] Jing-Cheng Shi, Yang Yu, Qing Da, Shi-Yong Chen, and An-Xiang Zeng. Virtual-Taobao: Virtualizing real-world online retail environment for reinforcement learning. In: Proceedings of the 33rd AAAI Conference on Artificial Intelligence (AAAI’19), Honolulu, HI, 2019.
[2] Tian Xu, Ziniu Li, Yang Yu. Error bounds of imitating policies and environments. In: Advances in Neural Information Processing Systems 33 (NeurIPS&#39;20), Virtual Conference, 2020.
[3] Tian Xu, Ziniu Li, Yang Yu, Zhi-Quan Luo. On Generalization of Adversarial Imitation Learning and Beyond. https://arxiv.org/abs/2106.10424, 2022.
[4] Rongjun Qin, Songyi Gao, Xingyuan Zhang, Zhen Xu, Shengkai Huang, Zewen Li, Weinan Zhang, Yang Yu. NeoRL: A Near Real-World Benchmark for Offline Reinforcement Learning, https://arxiv.org/abs/2102.00714, 2021.

打开封面下载高清视频观看高清视频视频下载器

20220330特邀报告【数据驱动的强化学习及其工业应用】俞扬 (南京大学)

20240731【多模态研究进展】徐偲：面向低质多模态数据的深度学习

20220615【AI for Science之物理信息驱动的深度学习】陆路：Learning operators using deep neural……

20220427特邀报告【复杂场景下的实用目标跟踪技术】卢湖川 (大连理工大学)

这才是科研人该学的！一口气学完目标检测六大算法-R-CNN、Fast R-CNN、YOLO、SSD等，原理到实战，太通俗易懂了！机器学习|深度学习|计算机视觉

20210625；短教程：《Transformers》；特邀讲师：邱锡鹏教授

上海交大张伟楠强化学习课程第16讲：基于扩散模型的强化学习

强推！【全150集】机器学习+强化学习+深度学习，一口气带你全部学完！真的太通俗易懂了！（人工智能、深度学习、神经网络、机器学习算法、计算机视觉）

还得看吴恩达！一口气讲透CNN、RNN、GAN、LSTM、YOLO、transformer等六大深度学习神经网路算法！真的不要太爽~（AI人工智能丨机器学习）

20211215【学无止境：深度连续学习】洪晓鹏：记忆拓扑保持的深度增量学习方法

【VALSE2024】0505 杨易《特邀报告：混合模型驱动的内容生成与具身智能》

20220505【VALSE短教程】《因果发现与因果性学习》特邀讲师：蔡瑞初教授

20240814【多模态医学图像处理及医学大模型的发展近况】王连生：病理数据的多模态分析

什么是卷积？强推！这绝对是全网最通俗易懂的【卷积神经网络教程】！草履虫听了都点头！人工智能、深度学习、机器学习

2024年最新！【人工智能三大算法】卡尔曼滤波、transformer、CNN卷积神经网络！6小时一次讲清楚！建议收藏！——（人工智能、深度学习、机器学习）

Arm+Qt+opencv嵌入式项目-基于人脸识别的考勤系统！这可能是最好的嵌入式项目实战了吧！（人工智能、机器学习算法、神经网络、Pytorch、AI）

20220112【脉络分明：脉冲神经网络及其应用】余肇飞：脉冲神经网络学习理论与方法

发论文idea来了！强化学习融合Transformer，全是创新点！

人工智能医学影像处理实战：医疗大数据、影像组学、临床研究应用、SCI论文解读、Python数据处理、机器学习论文一口气学爽！

机器学习-强化学习详解！这绝对是全网最简单的强化学习基础概念与算法讲解，代码实战！

20210407【如何做出高水平的科研工作？--来自顶会AC/PC的观点】Panel

青龙人形机器人开源强化学习库GymLoong测试

从模型预测控制到强化学习10：“直来直往-直接给策略推荐”的确策略梯度（PG）方法REINFORCE-A2C-原理与仿真

这才是科研人该学的！一口气学完自动驾驶八大算法-环境感知、目标检测、语义分割、强化学习、决策与控制算法！原理到实战，太通俗易懂了！机器学习|深度学习|计算机视觉

IsaacLab+rsl_rl强化学习

强推！不愧是李宏毅教授！一口气把机器学习、深度学习、强化学习、神经网络、生成式AI给讲透了！存下吧，真的比啃书好多了！（AI人工智能/ChatGPT）

20240117【学术新人“修炼手册”】彭思达：完成一篇论文的科研历程与经验

性能翻倍！LSTM+Transformer王炸创新，荣登Nature，精度高达95.56%！！整理11种融合创新方案！机器学习|深度学习|计算机视觉

20211121特邀报告【人工智能在赋能设备、赋能临床、赋能科研中的应用实例】沈定刚(上海科技大学、上海联影智能医疗科技有限公司)

20220406【“热门中的冷门”-实用深度学习优化方法】刘日升：基于梯度的双层优化方法初探

我居然在9月只花7天学会机器学习十大算法！新手一口气学会线性回归、逻辑回归、SVM支持向量机、随机森林、决策树、贝叶斯、聚类算法、神经网络等十大算法！人工智能

【一起啃书】全16章机器学习西瓜书速成！算法原理+手推公式，线性回归、强化学习、聚类算法、规则学习、决策树

20240605【Prompt Learning in Vision】陈广义:Prompt Learning Meets Dense Context for …

Transformer一统天下！迪哥带你全面解析Transformer在各大领域的应用实战，学完秒懂基于Transformer实现的项目与论文写作！

论文创新秒懂！GNN图神经网络：原理++论文解读+代码复现，入门必看基础干货，全套教程快码住！深度学习/神经网络/人工智能

20211021【Transformer在医学图像处理的应用】Panel

20211222【自动驾驶中的机器视觉与学习问题】Panel

入门到进阶！一口气学完CNN、RNN、GAN、transformer、ResNet、BERT、GPT、YOLO等八大深度学习神经网络算法模型！

20220112【脉络分明：脉冲神经网络及其应用】Panel

强烈推荐给深度学习初学者的pytorch最全学习资源！！

20220713【超级视觉深度学习模型与标签学习方法】张敬：ViTAE Transformer 超级视觉深度学习模型