V
主页
【大模型量化】- Llama.cpp轻量化模型部署及量化
发布人
🚵♀️ 使用Llama.cpp实现gguf模型的轻量化部署及量化。 🎮 相关代码和数据:https://github.com/echonoshy/cgft-llm
打开封面
下载高清视频
观看高清视频
视频下载器
【KUAE夸娥】摩尔线程千卡出击!千亿大模型国产算力基座就位!
Ollama 支持的 flash attention 能提升推理速度吗?我们一起测测看吧
这AI语音模型有点吓人了!
【大模型微调】- 使用Llama Factory实现中文llama3微调
关于RWKV的5个谣言
RWKV-6论文解读
【大模型部署】- vllm部署glm4及paged attention介绍
【大模型部署】- Ollama部署Qwen2及llama.cpp补充
在家用台式机,RTX 4070 Ti Super显卡上,本地部署多模态大模型
【暑假甄选】B站大学终于把算法与数据结构做成动画片了,一周刷爆LeetCode,2024最新版,学完即就业!拿走不谢,学不会我退出IT圈!
QLoRA_02_算法原理_深入解析
大模型的函数调用 - 支持 Ollama 的通用实现方法
LoRA_05_01_基于GPT-2进行LoRA微调实战
AI大模型研究:做大房or做小三给大模型生孩子?大模型喜当爹稳了!
让大模型编码生成聊天系统
【大模型应用】- Chat TTS有意思的语音生成
LoRA_05_02_基于GPT-2进行LoRA微调实战
【LibrAI | 智衡 阅读会】第二期:是谁在抄袭我!大模型输出水印的施加与检测
QLoRA_01_课程简介
QLoRA_03_算法原理_案例实践
label-studio打标质检流程
LoRA_06_LoRA核心算法实现
LoRA_07_在VS Code中debug LoRA微调细节