V
主页
语言生成类预训练模型的工作流程是怎么样的?
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
大模型预训练和微调的区别是什么?
指令微调与常规微调的区别是什么?
多任务学习中各loss权重应该如何设计呢?
大模型训练、推理、微调;从原理到技术细节的《大模型关键技术》白皮书文档分享
喂饭教程!25分钟本地部署Qwen2大模型:配置、微调、部署+效果展示,带你训练自己的行业大模型!
多目标优化和多任务学习的区别是什么?
LoRA的微调方式为什么是有效的?其中低秩矩阵的作用是什么?
如何验证评价模型的正确性?
为何相同的模型在不同测试集上表现迥异?
OpenWebUI+Ollama本地部署保姆级教程(非Docker),轻松搭建大语言模型!
论文速读35:大语言模型存在逆转诅咒
生成式大语言模型系列直播-第六期《指令微调与上下文学习》
【大语言模型】台湾大学李宏毅大佬带你80分钟学会大语言模型!真的很简单,看完就能用!
画出漂亮的神经网络图!
多模态大模型中,模态数据的融合是如何进行的?
大模型面试就是演戏,胆子越大offer越多!
被导师夸了3年的文献阅读+笔记整理方法!研0不会看论文的真心建议你来学三分钟!研究生/毕业论文/文献综述
机器翻译与人工翻译相比有哪些优势和劣势?
神经网络一键可视化!这个AI神器可以放大网络中的任何一层
绝了,这个网站居然可以直接找到别人复现好的代码
张量的连续性及其变形-pytorch基础
用AI写文章必看!一条指令彻底去除AI味!轻松写出爆款!【全网独家】深层解析AI底层原理!
神经网络都是Encoder-Decoder架构吗?
调参利器 ,复旦NLP实验室专用!
Fish-speech 1.4.2语音克隆工具,支持模型微调训练,API服务,文本生成语音,集成大语言模型语音聊天,本地一键部署整合包,解压即用
2024人工智能到底应该怎么学?有哪些捷径可以走?迪哥最新打造的这套学习路线图,带你从最基础的开始到实战200+项目,全程干货!
【大模型面试】Flash Attention面试连环炮,淘汰80%面试竞争者
导师推荐的数据库!4个神级代码复现网站,里面99%的论文都能找到!
微调大语言模型 本地WINDOWS笔记中 奇妙的一段人机对话
10月刚发布就爆火了!威斯康星麦迪逊教授 的这本【从零构建大语言模型】终于搞到了,仅靠Pytorch也能玩转大模型!
前两天面了个大模型工程师,开始感觉很不错,可是工作几天。。。
大模型面经--量化篇
新手狂喜!这绝对是全网最适合初学者入门的NLP自然语言处理教程!清华大佬20小时带你从入门到实战!!!
刚发布1个月,GitHub斩获星标31.2K!最好的大模型入门指导书!看完无痛从零构建自己的大语言模型!
【文心智能平台】Agent智能体从入门到项目实战!看这一个就够了,Agent开发必备学习路线,大模型入门教程
如何利用硬件加速来提高移动设备上的机器翻译性能
威斯康星大佬又火了,刚发布的 从零构建大语言模型书 终于搞到了,用pytorch就能搞定大模型!(附书籍)
AlphaFold 3 模型架构
【墙裂推荐】2024最新最全ChatGPT教程!一天学完30个ChatGPT使用技巧,全网唯一个把ChatGPT讲的这么详细的教程,是个人都能学会!