V
主页
京东 11.11 红包
【生成式AI導論 2024】第8講:大型語言模型修練史 — 第三階段: 參與實戰,
发布人
https://www.youtube.com/watch?v=v12IKvF6Cj8 【生成式AI導論 2024】第8講:大型語言模型修練史 — 第三階段: 參與實戰,打磨技巧 (Reinforcement Learning from Human Feedback, RLHF) 10,858次观看 • 2024年4月12日 • 【生成式AI導論 2024】 投影片:https://drive.google.com/file/d/1CTSo... 9:30 在這段課程錄影中,為了更清楚地比較 Alpha Go 的訓練過程與大型語言模型的訓練方式,我對 Alpha Go 的實際推論與訓練過程進行了大幅度的簡化。例如,我並未提及 Value Network 和 MCTS 等概念。如果您希望深入了解 Alpha Go 的訓練與推論過程,建議您閱讀原始論文。 13:30 需要注意的是,本段課程主要講述的是 Alpha Go 中 Policy Network 的訓練方式。事實上,Alpha Go 還包含了 Value Network 的訓練,用於估算棋局的勝率。這引發了一個有趣的思考:是否可以在大型語言模型的 RLHF中引入類似的概念? 19:50 在翻譯術語時,Reward Model 可能譯為「報酬模型」或「獎勵模型」比較合適 34:00 有關人生道路的抉擇不建議詢問大型語言模型
打开封面
下载高清视频
观看高清视频
视频下载器
【生成式AI導論 2024】第6講:大型語言模型修練史 — 第一階段_ 自我學習,累積實力 (熟悉機器學習的同學從 15_00 開始看起即可)
【生成式AI導論 2024】第12講:淺談檢定大型語言模型能力的各種方式
【李宏毅】2024秋《生成式人工智能导论》教程!LLM大模型入门到进阶,一套全解决!2024生成式人工智慧-附带课件代码
台湾大学-李宏毅-机器学习深度学习/生成式AI(2023-2024公开课汇总)
【李宏毅2023机器学习】【生成式AI】讓 AI 村民組成虛擬村莊會發生甚麼事?
强推!不愧是李宏毅教授!一口气把机器学习、深度学习、强化学习、神经网络、生成式AI给讲透了!存下吧,真的比啃书好多了!(AI人工智能/ChatGPT)
Claude AI创始人Dario Amodei 大胆预测:下一代千亿参数AI模型智力将媲美诺奖得主,
2024最新!(中英字幕)公认最好的【吴恩达大模型LLM】系列教程,斯坦福人工智能顶级专家带你掌握前沿大模型技术(RAG模型应用_agent_ChatGPT)
(超爽中英!) 2024公认最全的【吴恩达大模型LLM】系列教程!附代码_LangChain_微调ChatGPT提示词_RAG模型应用_agent_生成式AI
真实感爆棚!Flux你太强了!Midjourney估计要胆战心惊了! | AI绘画
AI 大模型周报 2024年8月 b
邀请报告-AI在气候变化中的应用-童宣博士
跟着吴恩达大佬15个小时啃透【AI大模型】,详解Langchain、ChatGPT、Agent等生成式AI、RAG模型应用以及大模型微调,技能点拉满!!!
吹爆!不愧是李宏毅教授!一口气把全系列人工智能课程整理出来了,一口气学完机器学习、深度学习、强化学习、神经网络与生成式AI!存下吧,真的比啃书好多了!-AI合集
吹爆!这可能是2024年公认最通俗易懂的MATLAB教程,花3小时就能从入门到精通,全程手把手教学!这还学不会,我直接退出AI圈!-数值计算丨神经网络丨计算机
【CVPR 2024 Tutorial】Introduction to Classical Point Cloud Backbones
Andrej Karpathy:大模型10亿参数就够了,蒸馏技术效果非常好!
PhotoMaker V2,全新版本来了,不用训练lora,一张图即可生成完美人脸图片!
手把手教学!深度学习模块缝合,轻松发论文,再也不怕导师放养了!
强推!这可能是唯一能将AI Agent讲清楚的课程了,公认最适合新手入门Agent大模型实战系列,3小时全流程解读分析,简直比刷剧还爽!人工智能|大模型
MAMBA and State Space Models explained _ SSM explained
Andrej Karpathy《从零开始搭建GPT》 |Let s build GPT_ from scratch, in code, spelled out.
【y总语录】女朋友会骗你,算法不会骗你
吹爆!不愧是李宏毅教授!一口气把全系列人工智能课程整理出来了,一口气学完机器学习、深度学习、强化学习、神经网络与生成式AI!存下吧,真的比啃书好多了!-AI合集
地表最强AI写代码工具——Cursor:人人都是P8程序员
【基于PyTorch从零构建多模态(视觉)大模型 by Umar Jamil】
草履虫都能学会!这可能是B站最全的(Python+机器学习+深度学习)系列课程了,入门巨简单学不会你打我!机器学习/深度学习/人工智能/python学习
【强推】终于有大神把【马尔可夫链】给做成动画了!2024最新内容从模型理论到核心概念,越学越爽!
【FLUX 大模型微调/Lora训练】Linux一键训练包,Windows部分修复torch2.4.0BUG问题
Transformer如此火爆,是不是可以舍弃卷积了呢?迪哥带你分析在不同应用场景下Transformer与卷积的实用性,零基础必看!
【深度生成模型 CS236 2023】斯坦福—中英字幕
Cursor如何撬动AI数十亿美元市场?一个复制粘贴的小创新
性能炸裂!Meta提出Sapiens:人体视觉基础模型!收录ECCV 2024 Oral
Transformer一统天下!迪哥带你全面解析Transformer在各大领域的应用实战,学完秒懂基于Transformer实现的项目与论文写作!
【课件+代码】李沐大神《动手学深度学习》2024最新视频教程,比啃书高效!比刷剧还爽!(人工智能丨深度学习丨神经网络)
pytorch编程快速学习-01-关于tensor
陶哲轩在2024年国际数学奥林匹克(IMO)的演讲:AI 与数学
【自动驾驶技术】花18000大价钱买的无人驾驶课程,从入门到提升的自动驾驶算法——感知实战、视觉定位、预测系统、路径规划、控制理论、强化学习