V
主页
你知道用什么指标评价一个大模型的好坏吗?PPL,MMLU,MATH,GPQA,BBH,IF-EVAL,MMLU-PRO
发布人
你知道用什么指标评价一个大模型的好坏吗?PPL,MMLU,MATH,GPQA,BBH,IF-EVAL,MMLU-PRO这些指标是什么?
打开封面
下载高清视频
观看高清视频
视频下载器
怎么加快大模型推理?10分钟学懂VLLM内部原理,KV Cache,PageAttention
十分钟搞明白Adam和AdamW,SGD,Momentum,RMSProp,Adam,AdamW
模型量化六:QLoRA 4bit 量化 NormalFloat4 量化
动画理解Pytorch 大模型分布式训练技术 DP,DDP,DeepSpeed ZeRO技术
大模型微调看这个视频就够了 SFT NEFTune
大模型预训练看这个视频就够了
模型量化一:量化基础 对称量化 非对称量化 极大值量化 零点量化
大模型训练如何计算显存占用
大模型修炼之道(三): Llama系列讲解 Llama1,Llama2, Llama3
大模型修炼之道(二): GPT系列GPT1,GPT2,GPT3,GPT4
模型量化二:训练后动态量化 PTQ PTDQ,pytorch里进行模型训练后动态量化
模型量化四:量化感知训练 QAT pytorch里进行量化感知训练
三分钟学会大模型PEFT的LORA算法 lora_rank, lora_alpha
10分钟搞明白如何设置大模型推理参数,top_k,top_p, temperature, num_beams。温度,beam search。
你还不懂旋转位置编码吗?
用梯度检查点来节省显存 gradient checkpointing
模型量化五:LLM.int8() Bitsandbytes HuggingFace 默认大模型量化方法
2024年吃透经典AI大模型面试题500问,7天学完,让你面试少走99%弯路!!大模型与深度学习算法面试指南。【存下吧,附80W字面试宝典】
【2024最新】54个大模型实战项目,练完即可就业,从入门到进阶,基础到框架,你想要的全都有,建议码住!超级适合小白入门学习,大模型教程
【AI大模型】使用Ollama+Dify搭建一个专属于自己的知识库!支持多种文件类型,本地部署大模型,效果出奇的好!
「AI评测」国产视频生成模型?清影!
入门Dify工作流 | 基于爬虫与LLM的新闻编辑助手
ChatGPT下一代模型官宣,比GPT-4强100倍
【Andrej Karpathy】中文字幕|Let's build the GPT Tokenizer
【B站强推】一小时彻底掌握提示工程(Prompt Engineering)超详细,草履虫都能听懂!!!(大模型|LLM|多模态|人工智能)
我们训练了一个没有道德限制的大模型
【AI大模型】使用Ollama+Dify搭建一个全能知识库!专属自己!支持多种文件类型,实现本地化大型模型部署,效果非凡!
Pytorch里的register_parameter和register_buffer是干什么的?
一次学懂混合精度训练 AMP Automatic Mixed Precision
【整整600集】字节大佬196小时讲完的AI大模型教程(LLM)零基础入门到精通全套教程,全程干货无废话,这还学不会,我退出IT圈!微调/模型训练/私有化部署
【AI大模型】五分钟教你打造一个免费的本地企业级知识库问答系统!(附教程)小白也能学会!
给大模型新人的经验,刷到少走3年弯路!
【三维重建】近期进展:从UC-GS、实时高斯到Splatt3R、Spann3R(上)
模型量化三:训练后静态量化 PTQ PTSQ pytorch里进行模型训练后静态量化
最全面最详细的Flux使用说明书:30分钟学会Flux的一切
手把手教你用PyTorch实现Transformer模型,我看一遍就会了!_人工智能/深度学习/pytorch/transformer/AI
krita AI 本地部署 flux 大模型,仅需30秒,抛弃ComfyUI烦恼,技术碾压Stable diffusion3,MidjourneyV6!
Dify聊天工作流 | 基于私有知识库和搜索引擎,构建高质量RAG聊天应用
手写一个LLama Factory!代码逐行解析
30秒生成高质量Mesh,精细度最高可达1600面,AI 3D建模开源项目V2版本发布,