V
主页
我们一旦不再理解AI的时候 [AlexNet]
发布人
Welch Labs https://www.youtube.com/watch?v=UZDiGooFs54 这个视频讨论了人工智能模型的内部运作,特别以AlexNet和ChatGPT为例。它解释了这些模型虽然使用的数学运算相对简单,却能完成复杂的任务。视频提到,ChatGPT处理输入文本时,会把文本拆分成小片段,转换成向量,然后把这些向量堆叠成一个矩阵。接着,这个矩阵会通过多个变换块进行处理,每个块都在进行矩阵运算。最后,输出会被转换回文本,形成模型的回应。 视频还提到了AlexNet,这是一个专门用于图像识别的模型。AlexNet使用卷积块,这是一种特殊的变换器,来处理以RGB值矩阵表示的图像。视频解释了AlexNet的第一层是如何学习识别基本特征,比如边缘和颜色块的。后面的层会把这些特征组合起来,识别越来越复杂的概念,最终能够识别像“脸”这样的物体,而不需要明确的训练。 视频强调了嵌入空间的概念,在这个空间里,图像或单词被映射到高维空间中的点。相似的概念在这个空间里距离更近。视频演示了如何通过改变嵌入空间中某个点的位置来改变图像的特征,比如年龄或性别。激活图谱被引入作为可视化这些嵌入空间的一种方式,揭示了模型是如何组织和连接不同概念的。 视频还强调了规模在这些模型成功中的重要性。无论是AlexNet还是ChatGPT,都依赖于大量的数据和计算能力。AlexNet有6000万个参数,相比早期模型是一个巨大的飞跃。而ChatGPT则有超过一万亿个参数,代表了规模的进一步大幅提升。视频最后提到,考虑到简单算法的意外成功,预测未来人工智能的进展是非常困难的。它暗示未来的突破可能涉及更大的规模,或者重新发现一些被忽视的旧方法。视频中还包含了一个关于KiwiCo的赞助环节,这是一个教育箱子公司。
打开封面
下载高清视频
观看高清视频
视频下载器
VSCode代码阅读神器正式发布
CPU与GPU的较量:GPU编程第一集
神经网络是如何联想和记忆的?——Hopfield网络讲解
[5分钟深度学习] #02 反向传播算法
Valla.ai:将代码逻辑展示为可视化的流程图
没能力别跳ChatGPT
【官方双语】那么……什么是卷积?
OpenAI科学家Ilya:简单方法检测AI是否存在意识?!
就在大家质疑KAN能否代替MLP时,KAN卷积就已经被实现了!
【官方双语】直观解释注意力机制,Transformer的核心 | 【深度学习第6章】
旋量的奥秘
【官方双语】GPT是什么?直观解释Transformer | 深度学习第5章
【中配】这是一条连续曲线,还是两条?你肯定解释不了... - Morphocular
【官方双语】看到神经网络的公式就头疼?一个视频带你理解神经网络里的数学知识!
微分方程:变化的语言
玻尔兹曼机如何改变机器学习的方向
AI过不了这个坎,我们也不知道为什么
【官方双语】深度学习之神经网络的结构 Part 1 ver 2.0
【官方双语】深度学习之反向传播算法 上/下 Part 3 ver 0.9 beta
吴恩达同步最新AI课,第56讲:Llama 3.2多模态综合开发--Introducing Multimodal Llama 3.2
离谱的o1模型,十年编程人泪目了......
Meta科学家杨立昆:AGI概念完全是无稽之谈!
OpenAI科学家Ilya: 无监督学习被GPT悄无声息地解决了!
很多研究人员都放弃具身智能了
数学视角下的Transformer SDSCon 2024 - 菲利普·里戈莱特
我以为手搓神经网络是句玩笑话,没想到真有人将它在白板上实现了!
【中字】你最喜欢的编程语言反映了你的性格!
《JPS跳点搜索算法》比A*算法快百倍的JPS寻路算法是怎么实现的
这个网站太变态了,直接把大模型可视化了出来!
黄仁勋:计算机时代已成为过去,生命科学将是新方向
【化工考古·硝酸】自古硝酸何其难
获得诺贝尔化学奖的AlphaFold,为何颠覆了生物学界?
十分钟搞明白Adam和AdamW,SGD,Momentum,RMSProp,Adam,AdamW
发明Netron的人真是个天才,能把复杂难懂的代码以图形化的方式展示!
【双语】Latent Space Visualisation PCA, t-SNE, UMAP
【官方双语】直观解释大语言模型如何储存事实 | 【深度学习第7章】
代码编辑器排名
分形柏林噪声
【官方双语】大语言模型怎么用PyTorch实现呢?一步步带你进行词嵌入word embedding代码实现!
物理学家证实,负时间是真实存在的。某种程度上是这样【每日科学新闻】|机翻中字