V
主页
不看太可惜!又快又准,即插即用!Sage Attention——清华8bit量化Attention
发布人
本次分享主要讲了2024年10月份刚出的一篇量化工作,相比FlashAttention,该工作可以在保证精度的前提下加速两倍,效果拔群。 [1]Zhang J, Zhang P, Zhu J, et al. SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration[J]. arXiv preprint arXiv:2410.02367, 2024.
打开封面
下载高清视频
观看高清视频
视频下载器
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
【NobleAI】混合专家模型Mixture of Experts(moe)论文混讲
30分钟学会Qwen2.5-3B本地部署LightRAG,完胜GraphRAG!从模型部署到源码解读,带你全流程解析,速度快,效果好,落地部署更方便!!!
B站首推!清华大佬168小时讲完的AI大模型教程,2024最新版,全程干货无废话!7天学完从小白变大佬!这还学不会我退出IT界!
冒死上传!目前B站最完整的大模型微调教程,适应于所有大模型微调实战!微调|量化|部署|应用
OpenWebUI+Ollama本地部署保姆级教程(非Docker),轻松搭建大语言模型!
【Coze教程】这可能是全网最系统的Coze入门教程了!手把手教你用Coze手搓Agent智能体到搭建Coze工作流,入门到精通!
CVPR最佳论文候选!基于Diffusion的单目视觉估计方法
ESP-AI 开放平台使用教程(ESP32 可视化配置接入AI)
人工智能将在未来十年,以十种可怕的方式,改变你的生活!
10分钟快速部署上手RAGFlow!支持多种文件类型,大模型小白必看本地部署大模型教程(附教程)
DPO:人类偏好对齐技术——大模型训练的最后一公里
给你一个亿,这碗双皮奶你也不敢吃一口! #绘画 #画画 #Ai绘画 #ai
吃透多模态四大模型!计算机大佬带你一口气学会:CLIP BLIP VIT MLLM多模态底层逻辑!真的通俗易懂!带你真正的对话机器人!(人工智能、深度学习)
B站最全【Transformer教程精讲及其案例应用教程】一口气学完,transformer入门到实战教程!——(图像分类、图像分割、目标检测、机器学习)
瞎聊点位置编码|旋转位置编码RoPE简介
【保姆级教程】使用LLaMA-Factory,实现Llama3中文增强模型微调+法律大模型微调
BiLLM: 1-bit模型量化简介
Animate Anyone-AI舞王技术
【微调实战】喂饭级教程!!15分钟学会Qwen2-7B微调及部署,帮你从零基础到大神,通俗易懂,连草履虫都能学会~
【Llama3微调全攻略】B站最全教程!手把手教你微调-量化-部署-应用一条龙!
【全878集】零基础自学AI大模型能救一个是一个,新手小白少走99%的弯路(LLM+RAG系统+GPT-4o+OpenAI)光刷完就赢麻了,通俗易懂|学完即
【一小时掌握RAG】从0到1搭建一套完整的RAG系统,知识讲解+部署源码+实战项目+代码解析,大模型RAG企业项目实战教程!
超全超简单!一口气刷完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM、DBN等八大深度学习神经网络算法!真的比刷剧还爽!
Transformer 很 难 ? 50行代码手撸一个!(上)
Peft: 从Adaptor, Prefix Tuning, 到LoRA
手撕代码#1|为了128K context的attention map我真的是手撕到不行
全程干货!低成本手把手教你Fine-Tuning基于Qwen2.5-7B大模型从零微调行业大模型,过程可视化呈现
B站首推!AI大模型课程2024年最新版!从零基础到入行大模型算法工程师,看完这一篇就够了,学完来找我内推!
【AI项目实战】全网最适合新手入门的【RAG医疗问答系统】教程:如何搭建一个基于RAG的医疗问答系统,我竟30分钟就搞懂了?
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,学完即就业!拿走不谢,学不会我退出IT圈!!!
【AI主播-功能篇】聊天 支持打断功能,自定义打断词,可以在AI说话中让AI住嘴喵,主人的权利UP喵~
Phidata:首个代理 UI - 构建具有记忆、知识、工具和推理能力的代理!(开源)
鲨疯了!最适合新手入门的【LLM医疗大模型】教程:医疗大模型LLM应用现状及如何微调一个医疗大模型?我竟然一天就搞懂了!
栗栗妹看视频系列《八大名菜系列》
30分钟学会微调Qwen1.8B大模型,轻松实现天气预报功能
Efficient model与Efficient ViT简介
基于大模型的复杂问题规划:树搜索(Tree Search)视角
【本地微调大模型】不吃配置,本地笔记本上轻松微调Llama3,Windows中文微调教程(附弱智吧训练训练集)
2045年实现永生!纳米机器人!人工智能技术