V
主页
京东 11.11 红包
合成指令持续预训练 LLaMA3-8B性能超过70B
发布人
合成指令持续预训练 LLaMA3-8B性能超过70B
打开封面
下载高清视频
观看高清视频
视频下载器
大模型微调训练实践 准确度10%提升至90%
智源公开大模型SFT训练数据集微调后性能达到和超过GPT4
10月全网最新首发!【大模型预训练与微调】这绝对是目前为止最强的AI大模型Llama3原理代码精讲与部署微调评估实战!(人工智能、深度学习、机器学习、AI)
【喂饭教程】20分钟学会微调大模型Llama3,环境配置+模型微调+模型部署+效果展示详细教程!草履虫都能学会~
提示词工程教程!B站强推!建议所有想学AI大模型(LLM)的同学,死磕这条视频,2024年字节大佬花了一周时间整理的提示词工程保姆级教程!
训练写万字长文大语言模型实践 #小工蚁
将LLaMA3上下文长度从8K扩展 到超过100万
Unsloth微调LLM训练更快2~5倍 GPU显存省50% #小工蚁
如何消除大模型幻觉? 提高准确率 LoRA+MoE
微调大语言模型如何自动生成 训练数据以及优化技巧
使用Triton内核加速Llama3-70B FP8推理 #小工蚁
比较3种开源大模型Roberta Llama2,Mistrial微调性能
提示词工程教程!B站强推!建议所有想学AI大模型(LLM)的同学,死磕这条视频,2024年字节大佬花了一周时间整理的提示词工程保姆级教程!
一键部署本地私人专属知识库,开源免费!1000多种开源大模型随意部署!
训练大语言模型LLM 如何定义自己训练数据集?#小工蚁
使用ExLlamaV2消费级GPU上 运行Llama2 70B #小工蚁
多模态Embedding开源模型 Visualized BGE #小工蚁
Mixtral-8*7B开源大模型合成 训练数据媲美ChatGPT #小工蚁
Jamba开源模型性能超越 Mixtral8*7B 采用最先进混合架构
LLM解码参数Temperature Top K & Top P有啥作用?#小工蚁
通义千问千亿大模型开源性能超LLaMA-3-70B #小工蚁
使用RTX4090+GaLore算法 全参微调Yi-6B大模型
只要5步!就能用Ollama+Dify搭建一个专属于自己的知识库!支持多种文件类型,本地部署大模型,效果出奇的好!知识库搭建教程,附搭建文档!
多模态RAG检索增强生成2种实现方式 #小工蚁
抱抱脸开源小模型SmolLM和训练数据集 #小工蚁
如何训练企业自己的大语言模型?Yi-6B LORA微调演示 #小工蚁
OCR-2.0开源小模型实现OCR端到端应用 #小工蚁 #pdf转markdown
DeepSpeedChat一键式RLHF训练 让LLM训练提速15倍,更省钱
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
【B站最详细】使用Ollama+FastGPT快速搭建属于自己的免费本地知识库
B站强推!手把手教你如何选取RAG中的embedding模型,模型讲解+代码解析,看完就能学明白!LLM大模型_RAG_大模型微调_多模态
BAdam大模型全参训练方法更省显存,速度更快,性能更优
小工蚁开源大模型解决方案 快速部署,轻松满足定制需求
斯坦福开源RadixAttention算法 和SGLang语言,性能再翻5倍
S-LORA为数千个LoRA同时提供推理,性能提升30倍 #小工蚁
【B站强推】一小时彻底掌握提示工程(Prompt Engineering)超详细,草履虫都能听懂!!!(大模型|LLM|多模态|人工智能)
打造智能客服:LLM和本地 知识库的完美协同原理
直观理解大模型预训练和微调!四大LLM微调方法,RLHF基于人类反馈的强化学习微调
训练LLM通过强化学习进行自我纠正 #小工蚁
用GPTQ算法量化大型模型 大幅减少GPU使用并提高准确率