V
主页
【研1基本功 (真的很简单)LoRA 低秩微调】大模型微调基本方法1 —— bonus "Focal loss"
发布人
代码放在文档里面 https://dwexzknzsh8.feishu.cn/docx/VkYud3H0zoDTrrxNX5lce0S4nDh?from=from_copylink
打开封面
下载高清视频
观看高清视频
视频下载器
当答辩结束,专家让补充相关实验
作者亲自讲解:LoRA 是什么?
我大抵是难毕业了,效果巨烂。Yolov5+deepsort+1DCNN
7500万核小时!波音公司的噪音模拟
计算流体力学,一个模拟500万,你玩的起不
我的硕士论文创新点:
反直觉的数学问题,哪个酒杯占满了50%?
千万不要做数据标注!!!
大模型被实习生投毒如何防?
当你的导师说这个idea可以发一区论文时 #研究生 #科研狗的日常 #真实还原 #搞笑 #毕业论文#大学生
毕业答辩有我导,我离上岸更远了
【研1基本功 别人不教的,那就我来】SSH+Git+Gitee+Vscode 学会了就是代码管理大师
LoRA是什么?| 5分钟讲清楚LoRA的工作原理
大三菜鸡毕设:无需GPU即可实时的高精度动态SLAM[开源]
二战前的科学论文可能90%都只有一个作者
我怎么用Manim给3Blue1Brown做动画,和Ben Sparks一起演示
最牛论文FCN:只更换一个层,却开创了一个时代!
《Whataya Want from Mi》
李沐-大模型训练半年-数据来源不清不白-数据不能公开的原因
从零开始手搓一个LLM(一)把参数缩减到足够单卡训练的NanoGPT
llm面试-langchain
参观南方科技大学,只能说太🐮🍺了
WaveMamba两篇同名撞车今日Arxiv(240805)!掐指一算,Mamba是时候排列组合到小波变换了[破涕为笑]
宇宙级编辑器VSCode你真的会用么?提高生产力的巨量技巧
对于卷积神经网络,硕士博士不需要搞明白原理,只要会应用是这样吗?-pytorch/深度学习/神经网络
饶毅妙揭学术腐败: 国际顶刊竟然可以花钱搞定?网友惊爆学术掮客: 封面论文想发就发?
沉浸式大模型面试,你能扛到第几枪?
胆敢在导师眼皮底下玩游戏的研究生终于毕业了|导师泣不成声…
985南京大学毕业的废物花5天5夜研究一道初中数学题,甚至动用python解题,感觉自己的数学实力回到了高考前的癫疯状态,堪称最有文化的一集。
停更的几个月,我去读博士了
如何使用lora微调llama模型,全网最简单上手的微调notebook
通俗易懂-大模型的关键技术之一:旋转位置编码rope (2)
3分钟搞清楚大模型的Token是什么
人在旅途,录取通知书到家了!
我是如何带本科生科研的?——以师生手撕代码的交流过程为例
哥们还中了一篇CVPR2024——多模态时代让卷积网络再次伟大!
5分钟学会微调大模型Qwen2
什么是大模型量化和蒸馏?
一文讲清楚CUDA
【毕设-大作业02】智能交通系统(原创毕设)-YOLOv10+deepsort