预训练数据中添加代码数据大幅度提升模型性能 - 视频下载 Video Downloader

预训练数据中添加代码数据大幅度提升模型性能

发布人

打开封面下载高清视频观看高清视频视频下载器

RLHF训练的门槛被打下来啦， SimPO算法轻松训练出最强8B模型

SCALE挑战英伟达护城河Cuda cuda代码直接编译在AMD上运行

日本团队发明第三种自动驾驶方案你怎么看？

Flash attention3来了压榨GPU的性能怪兽二代基础上再提升2倍

openai o1模型原理分析（二） Q-STaR如何训练CoT

百年没有突破的基础科学，要被ai打破啦,最近kan网络作者和mit物理大牛泰格马克教授一起发现了新物理方程

牛津、剑桥等大学研究登nature封面用合成数据迭代训练AI 9次大模型崩溃

中科院女博士外滩大会开源 deepfake伪造人像检测模型防止韩国deepfake事件重演龙哥分析一波算法原理

爆火的chatTTS合成的声音很中国味，完全分不出来真人和AI啊

中科院和港中大提全模态训练范式柏拉图表征假说落地研究比文本训练LLM提升20%性能

cvpr2024最佳论文公布，每篇论文都有大量华人科学家

谷歌推出GameNGen 扩散模型实时生成游戏

谷歌Deepmind团队的AI在IMO中取得银牌差一分就是金牌惊呼RL is so back

Mamba再次挑战Transformer 阿联酋开源通用Mamba大模型性能超越llama3.1,分数水分大

llama3 405B超大杯来了，终于训练完啦，23号发布，版本为llama3.1，3.1的8b和70B 从405B蒸馏得到，看来性能强不少

微软再发模型稀疏推理 Q-sparse 全精度最优稀疏率45.58% 低精度最优稀疏率61.25%

有团队自创分布式优化器大模型训练通信量少1万倍是真的吗？

合成数据能训练出更好的模型吗？拍马屁可以取巧，真本事取不了巧

创业公司建立太空算力中心 25年h100上天训练大模型

openai o1模型背后原理分析（一）龙哥推荐这3篇论文就行啦

谷歌论文揭秘大模型不会数r个数关键在于嵌入维度和词表大小关系

pytorch2.4发布支持intel GPU，CPU推理优化能把国产芯片支持就更好啦

大神ilya 10个人团队融资10亿刀以不同于open ai的scaling law攀登agi山峰 iLya吐露三个信息，影响未来AGI

Claude宣布在理解ai模型内部机制取得重大进展（二）

【Python游戏】教你用20行Python代码，制作一个马里奥游戏，好玩到停不下来！！

github排名第一的项目400K star 可以在上面学习AI和编程培训机构都不敢提的项目

冒死上传！花18800买来的【MATLAB全套】教程，花费156个小时整理的MATLAB基础版全套视频教程，涵盖核心知识点，全程干货，无废话！-函数绘图|速成

数学大一统理论经历30年证明 9位顶尖数学家包括丘成桐数学中心陈麟大神 800页论文证明几何朗兰兹数论，函数域，几何代数相互统一费马大定理的解决就只需要对一

前几天OPENAI内部会议提出5级人工智能看看第5级智能到什么样子

9.9和9.11哪个大 AI集体翻车原因与分词器关系不大

阿里巴巴数赛应用与计算数学赛道第二题参考于北京大学数科院22年的nips论文

最近AI语音项目大火，前有chatTTS，后有字节Seed-TTS，newtonai一键安装

newtonai万能安装器 AI开源项目填个地址一键安装,对不是工程师又喜欢玩AI的朋友是个福音

【课件+代码】李沐大神《动手学深度学习》2024最新视频教程，比啃书高效！比刷剧还爽！（人工智能丨深度学习丨神经网络）

吹爆！目前B站讲的最透彻的MATLAB教程全套完整版，包含所有干货内容。强烈建议收藏

这个transformer.js项目牛逼直接让你的浏览器运行1000个模型

对神经网络某一层做了小改进，效果却提升显著，可以发论文吗？ -人工智能/机器学习/深度学习

吹爆！这绝对是南京大学最出名的LLAMA3教程了没有之一，llama3原理代码精讲与微调量化部署实战，通俗易懂太适合小白了！人工智能|机器学习|深度学习

编程语言排行榜 python大幅领先霸榜多年 java没落到第4 华为仓颉还得加油，争取上榜

龙哥为了答谢粉丝朋友特意整理一个AI算法鼠标垫