V
主页
预训练数据中添加代码数据 大幅度提升模型性能
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
RLHF训练的门槛被打下来啦, SimPO算法轻松训练出最强8B模型
SCALE挑战英伟达护城河Cuda cuda代码直接编译在AMD上运行
日本团队发明第三种自动驾驶方案 你怎么看?
Flash attention3来了 压榨GPU的性能怪兽 二代基础上再提升2倍
openai o1模型原理分析(二) Q-STaR如何训练CoT
百年没有突破的基础科学,要被ai打破啦,最近kan网络作者和mit物理大牛泰格马克教授一起发现了新物理方程
牛津、剑桥等大学研究登nature封面 用合成数据迭代训练AI 9次大模型崩溃
中科院女博士外滩大会开源 deepfake伪造人像检测模型 防止韩国deepfake事件重演 龙哥分析一波算法原理
爆火的chatTTS合成的声音很中国味,完全分不出来真人和AI啊
中科院和港中大提全模态训练范式 柏拉图表征假说落地研究 比文本训练LLM提升20%性能
cvpr2024最佳论文公布,每篇论文都有大量华人科学家
谷歌推出GameNGen 扩散模型实时生成游戏
谷歌Deepmind团队的AI在IMO中取得银牌 差一分就是金牌 惊呼RL is so back
Mamba再次挑战Transformer 阿联酋开源通用Mamba大模型 性能超越llama3.1,分数水分大
llama3 405B超大杯来了,终于训练完啦,23号发布,版本为llama3.1,3.1的8b和70B 从405B蒸馏得到,看来性能强不少
微软再发模型稀疏推理 Q-sparse 全精度最优稀疏率45.58% 低精度最优稀疏率61.25%
有团队自创分布式优化器 大模型训练通信量 少1万倍是真的吗?
合成数据能训练出更好的模型吗? 拍马屁可以取巧,真本事取不了巧
创业公司建立太空算力中心 25年h100上天训练大模型
openai o1模型背后原理分析(一) 龙哥推荐这3篇论文就行啦
谷歌论文揭秘大模型不会数r个数 关键在于嵌入维度和词表大小关系
pytorch2.4发布 支持intel GPU,CPU推理优化 能把国产芯片支持就更好啦
大神ilya 10个人团队融资10亿刀 以不同于open ai的scaling law攀登agi山峰 iLya吐露三个信息,影响未来AGI
Claude宣布在理解ai模型 内部机制取得重大进展(二)
【Python游戏】教你用20行Python代码,制作一个马里奥游戏,好玩到停不下来!!
github排名第一的项目400K star 可以在上面学习AI和编程 培训机构都不敢提的项目
冒死上传!花18800买来的【MATLAB全套】教程,花费156个小时整理的MATLAB基础版全套视频教程,涵盖核心知识点,全程干货,无废话!-函数绘图|速成
数学大一统理论经历30年证明 9位顶尖数学家包括丘成桐数学中心陈麟大神 800页论文证明几何朗兰兹 数论,函数域,几何代数相互统一 费马大定理的解决就只需要对一
前几天OPENAI内部会议提出5级人工智能 看看第5级智能到什么样子
9.9和9.11哪个大 AI集体翻车 原因与分词器关系不大
阿里巴巴数赛 应用与计算数学赛道 第二题 参考于 北京大学数科院22年的nips论文
最近AI语音项目大火,前有chatTTS,后有字节Seed-TTS,newtonai一键安装
newtonai万能安装器 AI开源项目填个地址一键安装,对不是工程师又喜欢玩AI的朋友是个福音
【课件+代码】李沐大神《动手学深度学习》2024最新视频教程,比啃书高效!比刷剧还爽!(人工智能丨深度学习丨神经网络)
吹爆!目前B站讲的最透彻的MATLAB教程全套完整版,包含所有干货内容。强烈建议收藏
这个transformer.js项目牛逼 直接让你的浏览器运行1000个模型
对神经网络某一层做了小改进,效果却提升显著,可以发论文吗? -人工智能/机器学习/深度学习
吹爆!这绝对是南京大学最出名的LLAMA3教程了没有之一,llama3原理代码精讲与微调量化部署实战,通俗易懂太适合小白了!人工智能|机器学习|深度学习
编程语言排行榜 python大幅领先霸榜多年 java没落到第4 华为仓颉还得加油,争取上榜
龙哥为了答谢粉丝朋友 特意整理一个AI算法鼠标垫