V
主页
北大硕士带你理解ChatGPT底层原理:从人类反馈中学习
发布人
蘑菇书作者带你读懂ChatGPT背后的原理:从人类反馈中学习,Datawhale公众号回复蘑菇书,可加入蘑菇书读者群,领取本次分享PPT,更多强化学习材料,与多位作者嘉宾深度交流 【分享嘉宾】 江季:Datawhale成员,北京大学硕士,网易伏羲实验室强化学习算法工程师,《EastRL:强化学习教程》作者 【分享大纲】 1. ChatGPT简介(强化学习) 2. ChatGPT带来的启发 3. ChatGPT的优劣势分析 4.Q&A
打开封面
下载高清视频
观看高清视频
视频下载器
如何用GPT全阶段辅助论文写作
直观理解大模型预训练和微调!四大LLM微调方法,RLHF基于人类反馈的强化学习微调
深入浅出Pytorch
【共享LLM前沿】直观理解大模型预训练和微调!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习微调,代码讲解
从零自制深度学习推理框架:第一讲 项目预览和环境配置
集成学习:从原理到实现
AI:从小白到入门,超详细人工智能成长路径分享
从零自制深度学习推理框架:第四讲 构建计算图关系和执行顺序
强推!这绝对是B站最全的(python+机器学习+深度学习)系列教程,草履虫都能学会,学不会你来锤爆我!人工智能/机器学习/深度学习/python/神经网络
水很深的深度学习
通俗理解大模型从预训练到微调实战!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习
从零自制深度学习推理框架:第八讲 动手支持Resnet网络的推理
李宏毅《机器学习/深度学习》2021课程(国语版本,已授权)
从零自制深度学习推理框架:第三讲 计算图的定义
内容全开源、学习全免费、引爆:ChatGPT/GPT-4背后的逻辑与应用趋势
从零自制深度学习推理框架:第五讲 KuiperInfer中的算⼦和注册⼯⼚
扩散模型如何快速上手,如何高效微调?
蘑菇书作者杨毅远:AI浪潮下的学习新探索
大模型学习路线分享:作为开发者,我们如何学习大模型
NLP算法工程师吐槽机带你上分:阿里灵杰电商搜索算法赛
水哥带你用prompt构建你的专属聊天机器人
聪明方法学Python
我用GPT搭建了一个虚拟女友
首届世界智能科学大赛 | AI for Science 概述
手把手带你配动手学深度学习的环境
【AI第一课】Datawhale - AI培养方案2.0发布
【AI夏令营】LightGBM的数学原理解读
【Prompt大赛专题分享】 Prompt工程师养成记——从小白到大神
浙大吴飞教授:从101计划知识点建设对人工智能人才培养的思考
Datawhale x 天池计算机视觉实战系列分享
【Datawhale】手把手教你打比赛 - 新闻推荐系列来了
ChatTests:AI带你刷题上瘾 - 优秀作品答辩分享Top1
Datawhale x 天池《零基础入门金融风控》系列分享
学会如何使用大模型,让创意有能力落地成应用:HuggingLLM,Hugging未来
[Chap 1 启航] 聪明办法学Python第二版
Bili Insight:无需点开视频自动总结内容的真省流助手 - 优秀作品答辩分享Top2
大模型启发演讲:Chat凉宫春日
动画讲解深度强化学习(RL、Q-网络、策略优化、大模型算法入门教程)
AIGC下的人才培养 - ChatGPT Prompt技巧、案例与代码演示 & 法律领域应用
Pybind使用指南 - python和c++混合编程的基本方法