V
主页
【通义千问2.0】微调之理论篇(pre-train/sft/dpo)
发布人
视频中的源码地址:https://github.com/owenliang/qwen-dpo
打开封面
下载高清视频
观看高清视频
视频下载器
个人非常推荐的GraphRag相关的论文(附代码),不像Microsoft官方的graphRag那么复杂,这篇论文更偏向于阐述LLM和KG的结合范式的研究。
【通义千问2.0】微调之SFT训练
【通义千问2.0】微调之DPO训练
通义千问-大模型vLLM推理与原理
阿尔特曼:o1仅仅是“推理模型的GPT-2”;黄仁勋:我给你加速50倍
通义千问-一起写个agent吧!
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
【实战】通义千问1.8B大模型微调,实现天气预报功能
通义千问-大模型SFT微调生成JSON
【大模型工程基本功】asyncio+uvicorn+fastapi+threadpool
通义千问 - 如何打造一款AI生成PPT的工具?
【实战教程】5分钟快速搭建本地 FastAPI 服务,无缝对接 18B 参数通义千问大模型!
通义千问-大模型encoder-decoder与decoder-only架构是什么?
通义千问-从0打造HTTP并发推理服务
【龙年大吉】通义千问-用gradio打造你的webui
LLM大海捞针实验
外网超爆火的大模型黑书!大模型应用解决方案:基于GPT-3、ChatGPT、GPT-4等 Transformer 架构的自然语言处理(附PDF)
Lora微调代码实现
GraphRAG实现解读【下篇 - 查询】
【手写ChatGPT - 1/3】实现BPE Tokenizer
Lora模型微调原理
GraphRAG实现解读【上篇 - 写入】
【大模型生成SQL】Vanna项目分析&实践
【2024最新】68个大模型实战项目,练完即可就业,从入门到进阶,基础到框架,你想要的全都有,建议码住!超级适合小白入门学习(大模型教程|微调|部署|入门)
手写一个LLama Factory!代码逐行解析
吹爆!这绝对是南京大学最出名的LLAMA3教程了没有之一,llama3原理代码精讲与微调量化部署实战,通俗易懂太适合小白了!人工智能|机器学习|深度学习
【AI必备技能】ONNX Runtime推理框架
新手如何学习大语言模型,从个人角度谈一谈(基础,论文,代码等等)
deepspeed框架-大模型分布式训练与推理
通义千问大模型,霸榜高分,极致Open ~
iptables超干货直播(110分钟),慎入!
从0到1搭建自己的的智能体(Agent)!大模型Agent智能体企业级项目实战:手把手带你搭建,原理讲解+代码解析,超详细,LLM_大模型_微调_提示词
(超爽中英!) 2024公认最全的【吴恩达大模型LLM】系列教程!附代码_LangChain_微调ChatGPT提示词_RAG模型应用_agent_生成式AI
LangChain实现RAG检索增强
手写AI框架-今天起个头
在这里,我看见了未来
通义千问 + 阿里云实时语音识别
【大模型workflow】开源项目Dify.AI试玩
通义千问-关于模型打榜评分的原理
探索OpenAI o1模型系列:推理能力的全新进展