V
主页
刘相宇 - Reinforcement Learning with Deep Energy-Based Policies
发布人
视频摘要:本文基于最大熵的框架,提出了一个soft q learning的算法,借助概率推断算法SVGD,解决了在连续动作空间中学习一个stochastic policy的问题 先导知识列表:深度学习,强化学习,DQN PS:关于此论文的更多相关讲解,尽在伯禹ElitesAI学习平台~ https://www.boyuai.com/elites/course/x3fyYxaRhVWJxGSI/lesson/ypB1ZyELuHWQRCpV6fWCm
打开封面
下载高清视频
观看高清视频
视频下载器
冯思远-Learning-based Deep Learning Compiler
韩松 - Model Compression and Efficient Deep Learning
周铭 - DQN
潘哲逸-Urban Traffic Prediction from Spatio Temporal Data Using Deep Meta Learning
【强化学习玩游戏】简单易懂的PPO算法及公式推导!强化学习轮足机器人控制器、月球登陆器训练+超级马里奥项目实战!
何泰然 - Generative Adversarial Imitation Learning
汪润中 - Deep Embedding for Graph Matching
张文涛 - LM-LSTM-CRF
西云佳 - Session-based Recommendations with RNN
这是B站目前讲的最好的【强化学习实战】教程!带你从零详解PPO算法/DQN算法/A3C算法教程!
陈天奇 - TVM
西云佳 - Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation
王鸿伟 - Knowledge Graph Neural Networks for Recommender Systems
谢雨桐-A Brief Introduction to Graph Machine Learning Methods in Drug Discovery
【比刷剧还爽!】从入门到精通CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络一口气学完!
侯博涵 - AutoTVM
陈伟哲-DeepFM
陈伟哲 - TD3
任侃 - Deep Learning for Market Price Modeling
黄培耕 - Nash Q-Leaning
OpenAI全新模型o1深度解读与评测【模型评测12】
侯博涵-Transformer
任哲-unsupervised deep learning for optical flow esitmaiton
黄泽人 - QMIX
为什么Isaac gym 读取的速度不等于位置的微分呀,用pd算的力矩不就是错的吗
什么是卷积?强推!这绝对是全网最通俗易懂的【卷积神经网络教程】!草履虫听了都点头!人工智能、深度学习、机器学习
error0: 从零开始的五虎棋AI开发
陈贤宇 - Deep Residual Learning for Image Recognition
房宇辰 - Jointly Learning Explainable Rules for Recommendation with Knowledge Graph
上海交大张伟楠强化学习课程第12讲:模仿学习I
程若愚 - Least-Squares Temporal Difference Learning
这绝对是全B站最系统(没有之一)的人工智能基础教学!内含机器学习、深度学习、强化学习、NLP、等多个方向解析,零基础必看!
杨学 - SCRDet
【S3】中文字幕|They Built This Robot For Your Home | 1X Technologies
粟锐 - DDPG
(教材+源码)【动手学深度学习v2】看原著大佬李沐如何通俗易懂的讲解深度学习!真的建议收藏!(人工智能、深度学习、机器学习算法、计算机视觉、Pytorch)
蒋乐天 - PPO
RA-L 24浙大最新成果Parkour with Implicit-Explicit Learning Framework for Legged Robots
Unity使用自己的强化学习算法(DQN)训练智能体——学习日记
周志明 - WGAN & Lipschitz