V
主页
DPO V.S. RLHF 模型微调
发布人
https://www.youtube.com/watch?v=iSGnJ5x8TVA
打开封面
下载高清视频
观看高清视频
视频下载器
【DPO衍生算法串讲-Part 1】r2Q*,Step-DPO,RTO,TDPO,SimPO,ORPO
【保姆级教程】使用LLaMA-Factory,实现Llama3中文增强模型微调+法律大模型微调
【秒懂教程】10分钟学会部署大模型GLM4,本地部署+模型微调+效果展示详细教程!草履虫都能学会~
LoRA: Low-Rank Adaptation of LLMs, 模型微调利器【上】
8篇scaling laws 论文泛读,哪篇是你的心头好?Scaling Law
【喂饭教程】6分钟学会微调大模型GLM-4,环境配置+模型微调+模型部署+效果展示详细教程!草履虫都能学会~
本地安装Qwen2-VL 2B-Instruct 效果最好的视觉语言模型
Stanford CS234 Reinforcement Learning,RLHF&DPO
【本地微调大模型】不吃配置,本地笔记本上轻松微调Llama3,Windows中文微调教程(附弱智吧训练训练集)
30分钟教会你使用Llama Factory微调一个专属自己的中文llama3
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
【微调实战】喂饭级教程!!15分钟学会Qwen2-7B微调及部署,帮你从零基础到大神,通俗易懂,连草履虫都能学会~
使用自己的数据简单微调LLAMA-3.1 🦙
20分钟学会微调大模型Qwen2,本地部署+微调法律大模型,效果展示喂饭教程,草履虫都能学会!!!
鲨疯了!最适合新手入门的【LLM医疗大模型】教程:医疗大模型LLM应用现状及如何微调一个医疗大模型?我竟然一天就搞懂了!
基于unsloth微调llama3.1
【开箱即用】10分钟快速上手部署RAGFlow,构建你的专属助理!真的非常好用!附安装包和文档,支持多种文件类型,本地部署大模型,效果好到尖叫!新人小白必看教程
(超爽中英!) 2024公认最全的【吴恩达大模型LLM】系列教程!附代码_LangChain_微调ChatGPT提示词_RAG模型应用_agent_生成式AI
RLHF训练法从零复现,TRL版本复现,代码实战,大语言模型训练
通俗理解大模型从预训练到微调实战!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习
斯坦福大学 CS229 构建大语言模型
【全748集】这绝对是2024最细最适合自学的AI大模型实战教程:提示词+应用框架+知识库+智能体+微调原理讲解+代码解析,草履虫都能轻松听懂!
30分钟学会微调Qwen1.8B大模型,轻松实现天气预报功能
10分钟搞定!免费开源 AI 助手 Ollama 从安装到微调,离线保护隐私~小白入门必看的保姆级教程!!!
【全100集】AI大模型课程:零基础入门必备教程!百万年薪大佬带你变身AI专家!涵盖大模型如何学习,AI项目实战 ,大模型入门,技术路线,原理详解 项目实战!
上下文相关Embedding模型
LoRA: Code Demo [下]
大模型做 OCR? Llama OCR 和 Zerox 介绍
B站讲的最好的AI大模型实战(2024最新版)LLM+RAG系统+GPT-4o+OpenAI,全部都讲明白了!!
【宝藏级微调教程】使用Llama Factory实现中文llama3微调,这绝对是全B站最用心(没有之一)
【微调实战】30分钟学会微调大模型,通义千问1.8B大模型微调从0到1,实现天气预报功能,进行结构化信息提取
【共享LLM前沿】直观理解大模型预训练和微调!P-Tuning微调、Lora-QLora、RLHF基于人类反馈的强化学习微调,代码讲解
【喂饭教程】20分钟手把手带你微调大模型Qwen2.5-7B,从零微调行业大模型,详细教程,过程可视化呈现,草履虫都能学会!!!
2025版AI大模型全套视频 (LLM+RAG系统+GPT-4o+OpenAI)这绝对是ai大模型教程天花板!
冒死上传!目前B站最完整的大模型微调教程,适应于所有大模型微调实战!微调|量化|部署|应用
【包学包会】不需要高配置!6分钟教会你使用Ollama在本机运行部署llama3.1 || 大模型本地部署、LLM、
【B站最详细】使用Ollama+fastGpt搭建一个全能知识库!专属自己!支持多种文件类型,实现本地化大型模型部署,效果非凡!
30分钟学会Qwen2.5-3B本地部署LightRAG,完胜GraphRAG!从模型部署到源码解读,带你全流程解析,速度快,效果好,落地部署更方便!!!
【AI大模型】3天构建一个AI Chatbot聊天机器人,2025版最系统全面的AI大模型教程(LLM+RAG+Open AI+GPT+生成式AI)
2024AI大模型核心技术揭秘,大模型RAG项目实战基于Llamalndex构建企业级私有知识库