V
主页
Qwen2-7B-Instruct不同量化方法准确度和性能比较
发布人
Qwen2-7B-Instruct不同量化方法准确度和性能比较
打开封面
下载高清视频
观看高清视频
视频下载器
20分钟学会Qwen2-7b本地部署GraphRAG,无需Ollama,从环境搭建到报错解决全流程,草履虫都能学会~
AutoLabel:自动标注,比人快100倍,准确度和人一样!#小工蚁 #大语言模型
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
大模型微调训练实践 准确度10%提升至90%
喂饭教程!25分钟本地部署Qwen2大模型:配置、微调、部署+效果展示,带你训练自己的行业大模型!
不看太可惜!又快又准,即插即用!Sage Attention——清华8bit量化Attention
PDF文档文字、表格混排自动识别,增强RAG应用准确度 #小工蚁
【保姆级教程】28分钟手把手的带你微调Qwen2.5-7B,小学生看了都说会!
Qwen2-Audio语音多模态大模型使用实践 #小工蚁
Text2SQL Llama 7B模型微调DuckDB-NSQL-7B #小工蚁
20分钟学会微调大模型Qwen2,本地部署+微调法律大模型,效果展示喂饭教程,草履虫都能学会!!!
如何让大语言模型Qwen-7b使用Langchain中的工具? #小工蚁 #qwen7b
Qwen1.5-72B上下文推理准确度评估演示16K时最优 #小工蚁
最强7B模型Zephyr,打败LlaMA2-70B #小工蚁
越学越爽!25分钟学会Qwen2大模型本地部署&法律大模型微调(只需5G内存)大模型实战详细教程!草履虫都能学会~
Embedding模型8bit量化推理 成本下降4倍,准确度下降0.7%
自适应RAG算法和实现
打造智能客服:LLM和本地 知识库的完美协同原理
PDF LaTex论文翻译总结工具gpt_academic整合包,大语言模型实用交互接口
如何提高垂直领域RAG准确率? #小工蚁
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
演示ChatGLM-6B加载本地知识库精确回答财税问题
【喂饭教程】20分钟手把手带你微调大模型Qwen2.5-7B,从零微调行业大模型,详细教程,过程可视化呈现,草履虫都能学会!!!
使用Triton内核加速Llama3-70B FP8推理 #小工蚁
LightRAG一种简单高效的RAG新方法 #小工蚁
在RAG应用中LLM不同上下文检索和推理准确度不同 #小工蚁
用GPTQ算法量化大型模型 大幅减少GPU使用并提高准确率
【墙裂推荐】25分钟搞定qwen大模型本地部署+微调法律大模型(只需5G内存)
多GPU推理加速Qwen-72B开源大模型 #小工蚁
清华智谱开源视觉大模型 CogVLM,可免费商用
比较3种开源大模型Roberta Llama2,Mistrial微调性能
通义千问千亿大模型开源性能超LLaMA-3-70B #小工蚁
BCE Embedding开源大模型 RAG应用准确度提升关键
开源Mistral-7B LORA微调 增强中文能力演示
多模态Embedding开源模型 Visualized BGE #小工蚁
LangGraph Autogen CrewAI 哪个Agent框架更好?#小工蚁
如何让清华ChatGLM2-6b模型推理性能提升20倍? #小工蚁 #chatglm2
将LLaMA3上下文长度从8K扩展 到超过100万
多模态RAG检索增强生成2种实现方式 #小工蚁
中文ChatGLM-6B预训练模型 5.2万提示指令微调演示