V
主页
创建 Simulink 强化学习环境和训练代理演练
发布人
创建 Simulink 强化学习环境和训练代理演练Creating Simulink reinforcement learning environment and training agent walkthro
打开封面
下载高清视频
观看高清视频
视频下载器
强烈推荐!一套课程解决人工智能入门三步走:机器学习、深度学习、强化学习,真正适合小白自学的神级教程!
12大模型全栈-强化学习05-RLHF实战-端到端全流程解决方案-轩辕大模型强化学习完整流程介绍(数据+奖励模型+强化学习调参经验)
同济大佬倾力打造!三小时带你掌握【强化学习】基础原理及环境配置搭建,小白也能轻松掌握的通俗课程!
不愧是王树森老师讲的【深度强化学习】,零基础入门到实战完整版教程!—DRL、深度强化学习、强化学习、王树森、计算机技术
进来看看吧!零基础入门【王树森深度强化学习】完整版教程,含配套项目代码—王树森、深度强化学习、人工智能、深度学习、强化学习
15大模型全栈-强化学习08-DPO变体:IPO、KTO:无需偏好数据实现对齐
08大模型全栈-强化学习01-RLHF前言传统强化学习
14大模型全栈-强化学习07-DPO原理公式推导
Re强化学习和优化,实现能源和资源高效的 5G
零基础学习强化学习算法:ppo
比刷剧还爽!一口气学完深度强化学习零基础入门视频教程全套课程!PPO算法/DQN算法/A3C (人工智能、深度学习、机器学习、神经网络、图像处理、AI)
B站首推!不愧是李宏毅老师讲的【强化学习】简直太详细!!!2024公认最通俗易懂的【强化学习教程】小白也能信手拈来(人工智能|机器学习|深度学习|强化学习)
使用强化学习和模型预测控制的电力微电网优化Electric Microgrid Optimization using Reinforcement Learnin
【强化学习入门到实战】这也太全了!Q-learning算法、DQN算法、PPO算法、A3C算法等强化学习核心算法一口气学完!_AI/人工智能/深度学习/强化学习
吹爆!人工智能从入门到精通:Python基础+数学基础机器学习+深度学习+强化学习,涵盖所有基础知识及项目实战,AI新手必备!
深度强化学习算法carla平台实战-PPO算法
强推!上海交大、腾讯、中国科学院三方强强联合的【python+机器学习+深度学习】系列课程,堪称人工智能系列课程的巅峰之作!-人工智能/深度学习/机器学习
发论文idea来了,强化学习+Transformer 29个创新点汇总! 再也不用担心发论文了
11大模型全栈-强化学习04-RLHF实战-deepspeed-chat实战
太全了!2024李宏毅AI人工智能教程合集!一口气带你刷完机器学习、深度学习、强化学习、神经网络和自然语言处理!真的比盲目自学好多了!
请问强化学习的损失是上升的怎么回事
机器智能硕士【几何深度学习】课程!将几何先验知识融入深度学习模型!物理、强化学习、transformer、图神经网络、数学
基于强化学习的机器人轴孔装配仿真
强推!这估计是B站最全的(机器学习+深度学习+强化学习)系列课程了,不愧是上海交大和腾讯联合出品!快速入门巨简单,还学不会来锤爆我!—人工智能/神经网络/AI
分布式鲁棒优化介绍Introduction to Distributionally Robust Optimization
论文精读:基于可解释强化学习的投资组合策略
论文带读+代码复现!多模态.大模型精讲!一口气学完:Diffusion扩散模型、Openai CLIP模型、对比学习、Openai Dalle2建模分析!
被PPO算法惊艳到了--自动驾驶强化学习决策规划工程-PPO算法实战
动画解析神经网络为什么可以学习?看计算机大佬如何通俗易懂的讲解神经网络底层逻辑原理!带你入门到实战!——(人工智能、深度学习、机器学习、机器学习算法、AI)
如何为中小型站点设计微电网和微电网控制How to design microgrids and microgrid controls for small and
[强化学习]自动驾驶路径规划与控制-DQN/DDPG+pure pursuit路径跟踪实现
为什么说强化学习在近年不会被广泛应用?
2024智源大会 特邀报告 Reinforcement Learning with Large Datasets
985、211高校强推!这应该是全网讲解最全面的深度学习神经网络教程,三天时间即可掌握CNN、RNN、GAN、LSTM、DQN、GNN、Transformer!
起立!上海交大、腾讯、中国科学院三强联合的【python+机器学习+深度学习】课程都给我跪下,真真AI人工智能系列课程的巅峰之作!-人工智能/深度学习/机器学习
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
全网最通俗易懂,大模型偏好对齐RLHF从PPO推导DPO再推导simPO
AI大讲堂:敢叫transformer换新天!专业拆解【Mamba-2模型】
学习打卡
强推!【太完整了】B站首套机器学习+深度学习+Python完整版教程来了!堪称人工智能系列课程的巅峰之作!真的通俗易懂!(人工智能、深度学习、神经网络、AI)