V
主页
模型微调中最不需要关注的应该是GPU成本
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
天才乔布斯,一语道破计算机的本质
Python性能这么差,为什么会在AI中大量使用
比Python快35000倍,新编程语言官宣,打入AI领域
【卢菁老师说】Agent就是一场彻头彻尾的AI泡沫
没以前那感觉了
大模型其实没有真正意义上的开源
双4090部署qwen72b大模型 每秒150tokens
半块RTX4090 玩转70B大语言模型
乔布斯对优秀人才的定义
作者亲自讲解:LoRA 是什么?
LoRA是什么?| 5分钟讲清楚LoRA的工作原理
2024世界人工智能大会 李彦宏说:“没有应用,光有一个基础模型,不管是开源还是闭源,一文不值!”
美国禁用中国大学MATLAB快四年,国产替代完成了吗?
[转载]龙芯科学家胡伟武:大模型作用有限,难以转化为生产力
微调一个模型需要多少GPU显存?
通俗易懂理解自注意力机制(Self-Attention)
强到离谱!全新大模型最强架构TTT问世!有望替代Transformer?彻底改变语言模型,性能比Mamba更好!
好好珍惜自己的另一半啊
什么是混合专家模型(MoE)?
AI 工程师都应该知道的GPU工作原理,TensorCore
为什么中国高校被禁用MATLAB?
什么是大模型幻觉?为什么会产生幻觉?
B站强推!这可能是唯一能将LLama大模型讲清楚的教程了,LLama系列复现-微调-预训练-应用实例解读,草履虫都能看懂!人工智能/多模态大模型
20年前的回旋镖,打中了中国AI的脊梁
通俗易懂理解大模型预训练和微调
最近火爆的GraphRAG是什么? 真的那么有用吗?
李沐-YOLOv3史上写的最烂的论文-但很work
Qwen2-7B-微调-训练-评估
什么是模型的泛化能力?
什么是灾难性遗忘?为什么要重视它?
如何给大模型喂数据?让AI更懂你~【小白科普】
提示词、RAG、微调哪个会让大模型表现更好?1、实践中如何选择微调、rag、提示词工程 2、提示词工程使用方式 3、RAG VS 微调 4、rag评估框架
什么是大模型量化和蒸馏?
RAG增强检索是如何工作的?
什么是知识图谱?与大模型的关系是什么?
GraphRAG:很好,但很贵!
大模型项目选择RAG还是微调:八个判断依据
GraphRAG与普通RAG比较,效果,速度,费用
llama3.1国内可直接使用教程,405B堪称最强开源大模型,API无限调用,迪哥带你怎么玩,手把手教你打造自己的大模型!-人工智能、大模型、深度学习、NLP
大模型项目失败的十大原因(一)