V
主页
《强化学习:想象力机制》||基础图解释
发布人
-
打开封面
下载高清视频
观看高清视频
视频下载器
大白话理解强化学习中的td更新
《想象力机制更新本质》| iclr2024论文工作讨论
Transformer+强化学习成为双热点强强联合的发文方向
【具身论文阅读】Diffuser: 基于diffusion的强化学习规划器
【基于深度强化学习的冠军级别无人机竞速】强化学习和模型预测控制MPC中英字幕18讲!
模型服务(MaaS)可能颠覆SaaS服务
【即插即用】Pybullet端强化学习算法训练机械臂
【强化学习实战】计算机博士花半天带你学会强化学习PPO算法/DQN算法/A3C算法原理及实战!_AI/人工智能/深度学习/强化学习
【共享LLM前沿】直观理解大模型预训练和微调!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习微调,代码讲解
强化学习四足机器人二
元强化学习控制车辆模型 自动化驾驶模型
强化学习给视觉里程计自适应调参
你太在意结果了
不愧是李宏毅老师讲的【强化学习】简直太详细了!!小白也能信手拈来,建议收藏!(人工智能|机器学习|深度学习|强化学习)
【强推】李宏毅深度强化学习完整版教程!简单易懂的PPO算法强化学习入门课程!近端策略优化、Transformer
百万播放!看AI学习如何上下楼梯(深度强化学习)!计算机大佬带你深入学习强化学习的底层逻辑原理,真的太通俗易懂了!(人工智能、深度学习、机器学习实战、神经网络)
基于安全区域强化学习的狭窄空间阿克曼机器人自探索
《强化学习》第4.1-4.3章 策略更新规则(上)
具身智能的开源整合代码库 || Embodiment-AI || 目前应该是B站最全
分享心法(一)
【Yao Class Seminar】关于强化学习可解释性的talk
大模型如何增强强化学习?简单粗暴理解大模型训练中的人类反馈强化学习RLHF!PPO算法、ChatGPT背后的数学原理
【唐宇迪 | 强化学习】大模型必备的强化学习教程来了!绝对是2024年讲的最好的强化学习零基础入门到精通完整版教程!!(含实战源码)
RLHF基于人类反馈的强化学习动画讲解(LLM)
辨别大脑信息答辩,提高解决问题效率
中医基础理论——辽中医(全60讲 完整版)
直观理解大模型预训练和微调!四大LLM微调方法,RLHF基于人类反馈的强化学习微调
智能流程自动化(IPA)等于RPA+AI # 简单介绍
师弟说:codegeex插件很爽(代码辅助生成)
基于强化学习的笼式抓握与评估
CV强化论文分享-20241012
210:cyber 无人船优化反步控制 轨迹跟踪 强化学习Actor-critic架构,李雅普诺夫稳定性,优化反布控制,强化学习(RL),水面舰艇
一些关于chatgpt的论文创新思考(逆向思考)
IsaacLab交流群及文档更新说明
【初中数学】(B站首发)我花三万买的刘梦亚的初中数学课程,内部暑秋季(弯道超车,打好基础),白嫖!基础差的必看!老梦教你如何培养数学思维!
UR5机器人示教器沉浸式体验
无需vpn,与chatgpt进行语音以及文字交互(自制)
不愧是李宏毅老师讲的【强化学习】简直太详细了!!小白也能信手拈来,学完可就业!-附资料(人工智能|机器学习|深度学习|强化学习)
唠嗑‖蚂蚁和人类的恋爱有本质区别吗?(我认为没有)