V
主页
为什么零一万物最近宣传的线性模型复杂度是错的?
发布人
为什么零一万物最近宣传的线性模型复杂度是错的?
打开封面
下载高清视频
观看高清视频
视频下载器
零一万物AI模型系列简评,覆盖高中低端需求,Yi-Vision表现突出
你必须拥有RWKV,以及其他模型为何拉胯,NLP杂谈
What Is Big O Notation
零一万物大模型Yi-Lightning 震撼发布,全球第六,中国第一,超越GPT-4o、Claude 3.5 Sonnet
【13B大模型无用】大家不需要用自己的8G显存跑大模型了,没意义,70B也许成,我试试
RWKV-6论文解读
必赢 or 作死?一个动画讲清楚思维链复杂度
处理器内部的单个位如何保护操作系统的完整性?
RWKV的曙光:用高效计算革新人工智能
组装个双3090服务器,冲击百亿大模型!
24年论文打不过22年的,跑通baseline就能发论文?
村上春树是被假文青吹捧出来的?杨宁老师称一辈子也得不到诺贝尔文学奖
百年没有突破的基础科学,要被ai打破啦,最近kan网络作者和mit物理大牛泰格马克教授一起发现了新物理方程
RWKV:在Transformer时代重塑RNN
《大学生约炮行为研究》cssci 北大核心论文
【李开复博士 创新工场董事长兼CEO】:零一万物大模型和GPT4并列第一
就在大家质疑KAN能否代替MLP时,KAN卷积就已经被实现了!
【动手学习大模型 1/12】LLM 面试和工作的区别,让我们一起 import transformers,了解大模型的基本使用流程 (有较好基础同学不推荐观看)
[ICML 2024] Linearized LLM: 线性注意力自回归解码带来更高效有效的线性大模型
谢赛宁惊呼:扩散模型训练方法,一直错了!!!
暴打ChatGPT,生化环材GPT横空出世
【研2基本功 Score-based Diffusion 1】手搓Diffusion SDE,数学is all you need
AI为什么无法跨越这条线?我们仍不知道其原因
有点恶心,但是一周可以拿5个大模型岗offer
离谱的o1模型,十年编程人泪目了......
为什么好利来的女员工普遍都很漂亮
java之父没有想到jdk更新23,你们还用8。
数学题换个名字就出错?苹果团队大胆开麦:LLM根本不懂推理
关于RWKV的5个谣言
Aria:基于MoE架构的原生多模态大模型
LLM-PySC2:LLM starcraft II learning environment 基于pysc2的大语言模型星际争霸2决策仿真训练环境
nature 重磅论文:用 AI 生成的数据训练 AI,会导致大模型崩溃
大家ICLR2025都收到几片文章要review?如果收到0篇会不会被desk reject呀?
8年前阿法狗的一个“错误”,竟成大模型研究新方向!红杉资本:这可能是AGI的标志
用机械计算器强行除以0,你就会得到意想不到的答案
毕设20行代码实现对话AI,被导师轰出了教室!
刚起高楼就塌了?数据科学可能是第一个被淘汰的专业
实测,之前的行业笑话现在已经被AI攻破。
英伟达新模型引质疑:碾压GPT4o和Sonnet3.5,其他测试却输一大截?
姚顺雨-语言智能体博士答辩 Language Agents: From Next-Token Prediction to Digital Automation