V
主页
RLHF: From Zero to ChatGPT
发布人
由 Hugging Face 的研究科学家 Nathan Lambert 跟大家分享 RLHF 相关的内容:RLHF -- Reinforcement Learning from Human Feedback,从人类反馈中强化学习,它是 ChatGPT 背后的“功臣”。我们将为大家介绍相关联的机器学习模型,涵盖自然语言处理 (NLP) 和强化学习,以带领读者了解如何在大型语言模型上使用 RLHF。 Nathan Lambert 拥有加州大学伯克利分校的博士学位,研究机器学习和机器人的交叉领域,博士期间也在 Meta AI 和 DeepMind 团队实习。
打开封面
下载高清视频
观看高清视频
视频下载器
Hugging Face:普惠生成式AI
【 Hugging Face 课程 🤗 】 3D 机器学习 - 第三节 多视图扩散模型
【Hugging Face 科普】构建高性能大语言模型的小指南-2024
【 Hugging Face 课程 🤗 】 3D 机器学习 - 第四节 高斯喷溅
【新的免费课程发布】Hugging Face 音频课程来啦
【使用 Gradio 创建聊天机器人】Create Your Own Gradio Component - Part 1
【聊聊 HuggingChat】HuggingCast v1 - AI News and Demos
Food for Diffusion (Patrick Esser)
【发布会回放】Gradio 4.0 正式发布!
JAX Diffusers 社区冲刺演讲 Day 2
【 Hugging Face 课程 🤗 】 3D 机器学习 - 第一节 简介
【免费音频课程发布】在线 AMA,与 🤗 音频课程团队面对面
Collective Intelligence and Creative AI (David Ha)
HuggingFace Diffusion Model Class, Unit 1 (casual notebook walkthough
【StarCoder 来了!】HuggingCast v2 - StarCoder, Transformer Agents, AI news and demos
【CV 学习小组】BLIP-2
【中文科普】用 OpenVINO 加速生成式 AI 推理 🤗
【开源 ChatGPT】The Race to Open Source ChatGPT
Keras Dreambooth Event Kick-off Session with talks on diffusers & KerasCV
生产环境中的小样本学习
JAX Diffusers 社区冲刺演讲 Day 1
【Hugging Face 成功故事】 Writer
High-Resolution Image Synthesis via Two-Stage Generative Models (Robin Rombach)
Transformers.js:Web 上的最新机器学习技术
第四课 Materials Studio DMol3 模块讲解
【中文演讲】AI 快速发展年,来自 Hugging Face 的开源最新进展
Diffusion Models for Text-to-Video Generation without Text-Video Data (Devi)
Hugging Face 机器人主管🧑💼教你在家做机器人🤖️
从 LLM 到扩散模型,使用 Hugging Face 构建机器学习应用
【中文科普】🤗 Hugging Face 与 Intel 共同构建生成式 AI
【中文科普: Hugging Face 是什么?】🤗 Hugging Face Hub 和开源生态介绍
【AWS加速器上的LLMs】Hugging Cast S2E1 - LLMs on AWS Trainium and Inferentia
Beyond text - giving Stable Diffusion new abilities (Justin Pinkney)
DevDay | VL+Agent:探索AI与硬件融合的无限可能
最新发布!HuggingChat macOS 版现已可用
【中秋特辑】这可能是b站最全的【人工智能-数学基础】教程!微积分、概率论、线性代数、机器学习数学基础~
🤗 Whisper 微调冲刺竞赛活动介绍
Hugging Face: 代码生成模型的预训练和微调
HuggingFace CTO专访:开源崛起、创业故事和AI普惠化
Hugging Face 🤗 12分钟带你全面了解多模态人工智能