V
主页
京东 11.11 红包
Dueling Network (价值学习高级技巧 3_3)
发布人
youtube 转载自Shusen Wang老师油管课程视频,讲解清晰易懂
打开封面
下载高清视频
观看高清视频
视频下载器
经验回放 Experience Replay (价值学习高级技巧 1_3)
A2C 方法 (策略梯度中的Baseline 3_4)
随机策略做连续控制 (连续控制 3/3)
策略梯度中的Baseline (1_4)
离散控制与连续控制 (连续控制 1_3)
随机排列与Fisher-Yates算法
REINFORCE with Baseline (策略梯度中的Baseline 2_4)
REINFORCE与A2C的异同 (策略梯度中的Baseline 4_4)
稠密矩阵和稀疏矩阵数据结构 (矩阵数据结构和算法 2_2)
多智能体强化学习(1_2):基本概念 Multi-Agent Reinforcement Learning
联邦学习:技术角度的讲解(中文)Introduction to Federated Learning
并行计算与机器学习(1_3)(中文) Parallel Computing for Machine Learning (Part 1_3)
确定策略梯度 Deterministic Policy Gradient, DPG (连续控制 2_3)
并行计算与机器学习(2_3)(中文) Parallel Computing for Machine Learning (Part 2_3)
【MPC+强化学习】四大名校教授精讲强化学习和模型预测控制18讲!Actor Critic模型预测控制、策略梯度方法
Diffusion Policy 结合 PPO 模仿+强化 (下)
【基于深度强化学习的冠军级别无人机竞速】强化学习和模型预测控制MPC中英字幕18讲!
这可能是我见过强化学习和模型预测控制最好的教程!四大名校教授精讲动态系统和仿真、最优控制、策略梯度方法、MPC
【强推】李宏毅深度强化学习完整版教程!简单易懂的PPO算法强化学习入门课程!近端策略优化、Transformer
强推!北京大学王树森半天就教会了我深度强化学习,原理详解+项目实战,学不会来打我!
听劝!【张雪峰】人工智能AI学习压力非常大!你能承受的了吗?!骂醒一个是一个!!!零基础入门人工智能/机器学习入门
Transformer+强化学习成为双热点强强联合的发文方向
太...完整了!同济大佬唐宇迪博士终于把【深度强化学习】入门到精通全套课程分享出来了,最新前沿方向均有涉猎!----人工智能/强化算法/机器学习
用7年前的显卡在那跑强化学习 issacgym
李沐【动手学深度学习】这绝对是全网公认最好的动手学深度学习讲解教程!不愧是原著大佬亲授(人工智能、深度学习、神经网络、机器学习)
OSDI '20 - HiveD_ Sharing a GPU Cluster for Deep Learning with Guarantees
漂亮师娘守寡多年终究耐不住寂寞与徒弟一起学习Anaconda+Conda+Jupyter+pip安装【2024全宇宙最简单AI大模型RAG环境安装配置实战-1】
OSDI '20 - AntMan_ Dynamic Scaling on GPU Cluster for Deep Learning
【共享LLM前沿】直观理解大模型预训练和微调!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习微调,代码讲解
《强化学习》第5章 蒙特卡洛MC方法
大模型如何增强强化学习?简单粗暴理解大模型训练中的人类反馈强化学习RLHF!PPO算法、ChatGPT背后的数学原理
【中英字幕】强化学习和模型预测控制18讲!四大名校教授精讲模型预测控制、最优控制、强化学习入门
CV强化论文分享-20241012
目标检测十大经典YOLO算法合集!从YOLOv1~YOLOv10逐一讲解!看计算机大佬带你玩转YOLO算法!(人工智能、深度学习、机器学习、神经网络)
【Yao Class Seminar】关于强化学习可解释性的talk
g1套humanoid_gym
简直逆天!李永乐老师深度讲解AI!带你了解电脑如何像人一样思考,带你学习AI前沿技术/人工智能/机器学习/深度学习/神经网络/计算机技术
1050ti的显卡勉强能跑跑,sim2sim
卧槽!这么好的【无人驾驶技术】全套教程不能只让我一个人学习,感知实战、视觉定位、路径规划、预测系统,翻遍全网找不到比这更详细的了!!!(自动驾驶/人工智能AI)
强推!公认最强的人工智能入门课程!大佬66集精讲!20小时带你吃透AI必备知识点!