V
主页
Andrej Karpathy:大模型10亿参数就够了,蒸馏技术效果非常好!
发布人
Andrej Karpathy是资深的AI研究员,认为蒸馏技术使得大语言模型可以在很小的规模达到非常好的效果。 来自:No Priors Ep. 80 ,2024年9月
打开封面
下载高清视频
观看高清视频
视频下载器
【精校】“让我们重现GPT-2(1.24亿参数)!”AI大神Andrej Karpathy最新4小时经典教程 【中英】
【珍藏】从头开始用代码构建GPT - 大神Andrej Karpathy 的“神经网络从Zero到Hero 系列”之七
【Andrej Karpathy:从零开始构建 GPT 系列】
【精读AI论文】知识蒸馏
半块RTX4090 玩转70B大语言模型
什么是大模型量化和蒸馏?
【3.5小时精校版】OpenAI 传奇AI科学家Andrej Karpathy深度访谈:AI和生命的意义
独立开发变现周刊(第147期):月收入12万美元的浏览器截图扩展
从生物本科到计算机博士,跨学科学习AI,如何在考虑时间成本的情况下做到高回报
知识蒸馏:小模型向大模型学习
【Andrej Karpathy】中文字幕|Let's build the GPT Tokenizer
RL vs MPC,LeCun:MPC,胜!我不看好强化学习
奥特曼现身斯坦福演讲,GPT-5会让一切努力过时
【中英+笔记】Andrej Karpathy 9月最新对谈,来自OpenAI和特斯拉的大神|No Priors播客|安德烈卡帕西|2024.09.05
【13B大模型无用】大家不需要用自己的8G显存跑大模型了,没意义,70B也许成,我试试
断层式第一,面壁多模态小钢炮2.6轰动AI开源圈
知识蒸馏 |Distilling the Knowledge in a Neural Network
自制神经网络比PyTorch快14倍!手搓纯C++机器学习引擎
沉浸式大模型面试,你能扛到第几枪?
Manim + Cursor:用AI做 3Blue1Brown 风格动画
【精校】AI大神Andrej Karpathy最新九月面对面访谈@NoPriors 【中英字幕】
Mini-Omni:全球首个开源实时交互模型,边说话边思考。
Ilya 透露最新研究方向,让人工智能更稳定
AI闭源平台已成垄断,大脑控制权被夺走,用闭源=租用大脑
号称目前最强开源大模型, 使用了 Reflection-Tuning技术,能够自我纠错。
OpenAI科学家Ilya:简单方法检测AI是否存在意识?!
OpenAI triton分享:Triton概述
采访OpenAI创始成员之一、公司 AI 技术研究员(Andrej Karpathy,相信Transformers 比人类大脑更好,因为它们是更高效的
开源大模型新王炸,超越GPT-4o,能自我纠错!
“我的基因非常不幸,每晚必睡够8小时”
姚顺雨-语言智能体博士答辩 Language Agents: From Next-Token Prediction to Digital Automation
颠覆传统编程,超越Cursor!Claude Dev最强编程AI智能体!支持ollama和GitHub models!一条prompt实现全自动游戏开发!
未来三年最值钱的工作
反向传播登Nature!深度学习还不如浅层网络?
AI不会停滞!大佬预告: 巨变就要来了
LLM如何“自主”调用工具?揭秘Function Calling真相!
支付宝直接充值并订阅ChatGPT和Midjourney的会员!免费白嫖海外多种订阅服务~
GPT-5 稍慢一步,Grok-2 新秀出炉,马斯克:它简直猛如火箭
Anthropic 首席执行官最新访谈:如果扩展定律成真,投入1000亿美元训练的AI模型,将拥有诺贝尔奖得主的智力水平
Claude AI创始人Dario Amodei 大胆预测:下一代千亿参数AI模型智力将媲美诺奖得主,