V
主页
李沐-全世界不少人用大模型搞搞成人内容
发布人
https://www.bilibili.com/video/BV1u142187S5/
打开封面
下载高清视频
观看高清视频
视频下载器
李沐-除非你是专家否则不建议搞图神经网络
「李沐」学会放下是一个人的必修课
奇葩问题把李沐大神整不会了
我的本科毕业设计(2000年)
李沐-大模型提升主要来自数据清洗工的辛勤工作以及老板大方给了那么多卡
【李沐】因为过拟合刷题,我最后只能去MIT和CMU这种学校
如何看待华为在发布会展示大模型能力,按下 Ctrl-C 中断,对应代码是 time.sleep(6)?
“轻舟已过万重山,我在cmu等你”
李沐-打电话叫皮衣黄吃饭饭
李沐-YOLOv3史上写的最烂的论文-但很work
很多研究人员都放弃具身智能了
李沐-GPT的能力远不如人类大脑(60w灯泡耗能)
李沐-还是要读论文
李沐-大模型训练半年-数据来源不清不白-数据不能公开的原因
伤害性不大,侮辱性极强
逆天论文标题mamba out纪念牢大
李沐-All models are wrong, but some are useful
用高铁的电挖比特币 算力达到4T 真猛啊!!!
李开复透露「GPT5训练遇到困难,O1模型被迫放出来」OpenAI还有很多私货没有发布
何恺明:科研总是让人感到沮丧的
李沐-学术界数据通常比较干净-工业界的数据一般比较脏
东雪莲:以前的皮真的很好看,可惜画师SB,不然我也不想换
李沐-我们不知道为什么但是有用
大模型被实习生投毒如何防?
吴恩达表示,他看到的最令人兴奋的趋势是,生成式人工智能使人们能够以前所未有的水平创建软件,推动事物发展的速度比以往任何时候都快
【研1基本功 (真的很简单)LoRA 低秩微调】大模型微调基本方法1 —— bonus "Focal loss"
李沐-不能让大模型看太多娱乐内容-不然大模型会满嘴跑火车
诺奖得主的引用次数太可怕了!
从全美Top1计算机院校CMU毕业!!!
学人工智能专业有“钱途”吗?北邮应届生直言:毕业年薪30万轻松拿捏~
李沐-预测未来比完形填空昨天难
【研1基本功 (真的很简单)MoE】混合专家模型—作业:写一个MoELoRA
大模型时代下做科研的四个思路【论文精读·52】
逆天!字节实习生不满资源分配,恶意注入代码随机修改模型训练梯度,多级反转,官方通报
杰出系友专访|@BosonAI李沐:找到强烈的动机
2024,MambaOut,火爆的Mamba结构实际上并不好用!
杰出系友面对面|李沐讲座:大语言模型的实践经验和未来预测
CMU学生自制孙吧数据集 竟然还能发顶会!!
李沐-假如你是卖音响的
微调一个模型需要多少GPU显存?