V
主页
llama3-04 使用llama.cpp进行llama3模型的量化和部署
发布人
在本课时中,我们将探索如何使用llama.cpp工具来量化llama3模型,以便在CPU上进行高效的本地模型推理。
打开封面
下载高清视频
观看高清视频
视频下载器
案例实战-16-llama.cpp量化模型GPU加速推理
LoRA_04_基于PEFT进行llama3模型微调实战
在摩尔线程原生驱动上进行Llama.cpp的推理(没有使用vulkan)
llama3-07 基于 TensorRT-LLM 和 Triton 进行 llama3 模型部署
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
大模型时代下的端到端自动驾驶(上篇)
【喂饭教程】不挑配置,本地电脑无痛微调Llama3!仅需5分钟(附训练数据集)环境配置+模型微调+模型部署+效果展示详细教程!草履虫都能学会~
04_多模态_基于vLLM进行模型推理与源码讲解
精讲版-12 天气预测实战-模型搭建
【包学包会】不需要高配置!6分钟教会你使用Ollama在本机运行部署llama3.1 || 大模型本地部署、LLM、
03_TensorFlow模型转换TensorRT引擎推理
案例实战-10-LLaMA tokenizer模型与中文tokenizer模型合并操作
02_多模态_基于Gradio和Streamlit实现Web端问答交互
LoRA_07_在VS Code中debug LoRA微调细节
B站讲的最好的AI大模型实战(2024最新版)LLM+RAG系统+GPT-4o+OpenAI,全部都讲明白了!!
精讲版-05 自动梯度计算backward
【宝藏级微调教程】使用Llama Factory实现中文llama3微调,这绝对是全B站最用心(没有之一)
【本地微调大模型】不吃配置,本地笔记本上轻松微调Llama3,Windows中文微调教程(附弱智吧训练训练集)
06_tensorflow_serving_单个模型部署与推理_线性回归
源码讲解-05-中集-模型预训练代码逐行剖析
【研三】自研多模态大模型架构——长时程、高鲁棒
GPT-o2推理超神,GPT-o1为何被 “冷落”? 大模型训练
源码讲解-01-中文词汇表扩充
05_多模态_基于MiniCPM-V进行全参微调和lora微调
AI模型技术架构全景图
探索OpenAI o1模型系列:推理能力的全新进展
调整AI工具:精准提取Obsidian Excalidraw画布中的文字内容
精讲版-11 天气预测实战-数据预处理
bitnet.cpp 推理,速度超越 llama.cpp,内存最高降低 16 倍 | 附 BitNet b1.58 模型安装演示
10_torch_serving_案例2-QA问答
马斯克的AI大模型五分钟上手!每月25美元免费额度!
源码讲解-06-下集-模型预训练代码逐行剖析
04 轻松学 OpenCV 读取图片
DeepSpeed分布式训练框架 DeepSpeed-Chat Step-1-02 actor 模型微调
案例实战-13-指令精调手把手教程-升级版
B站强推!绝对保姆级教程,同济大佬从零到一讲解【llama3】微调、量化、部署及应用,全程大白话讲解绝对通俗易懂!
LoRA_05_02_基于GPT-2进行LoRA微调实战
精讲版-07 定义模型类 进行前向传播计算
FrontierMath数学基准测试 最牛大模型正确率不到2% 60多位顶尖数学家出题
轻松学·Streamlit_03_基础功能探索