V
主页
Mamba:颠覆 Transformer 的全新架构?
发布人
探讨话题 1. Mamba和Transformer有什么相同与不同? 2. Mamba相比Transformer的优势在哪里,其能够全面替代Transformer吗? 3. Mamba在各个领域的应用前景如何?如何看待现在基于Mamba的图像、视频等方向的变种? 4. 在把Mamba应用到研究领域的时候,有哪些要注意的地方? 嘉宾: 王琦,上海交通大学人工智能教育部重点实验室博士生,中国科学院大学硕士,《Easy RL:强化学习教程》(GitHub Star 7.9k,国家图书馆收录,人民邮电出版社季度好书,人邮异步社区度畅销新书)作者,百度飞桨AI Studio 《EASY RL 强化学习-案例与实践》课程设计者,开源项目”l李宏毅深度学习教程 leedl-tutorial” 设计者(GitHub Star 9.2k,李宏毅老师推荐),Hugging Face官方强化学习课程译者,人邮优秀作译者,人邮异步社区年度影响力作者,AI TIME成员,Datawhale成员,英特尔边缘计算创新大使,Hugging Face志愿者。主要研究方向为强化学习、计算机视觉。曾获中国研究生数学建模竞赛二等奖、中国大学生计算机设计大赛二等奖、亚太地区大学生数学建模竞赛(APMCM)二等奖、“挑战杯”全国竞赛江苏省选拔赛二等奖和Datawhale致卓奖,发表SCI/EI论文3篇,申请3项国家发明专利。曾在世界人工智能大会(WAIC)、全球人工智能开发者先锋大会(GAIDC)、AI TIME、人民邮电出版社、Datawhale、古月居等媒体/会议上进行相关主题分享。个人主页:https://qiwang067.github.io/。 刘悦,中国科学院大学机器学习与感知实验室直博生,中国科学院大学本科部学士毕业。对主动学习、弱监督、单目或BEV的3D目标检测(户外场景,车辆相关)、场景图生成、图像生成等都有涉猎,目前正在准备VMamba论文,该论文开源代码已有1K+star, arxiv已有20+引用。熟悉C语言,python语言,会编写matlab, html, javascript, golang, cuda, triton等代码,对transformers, diffusers, openmmlab系列等框架/库较为熟悉。github: https://github.com/MzeroMiko。 苍岳洋,清华大学自动化系直博一年级在读,清华大学自动化系学士毕业,博士研究方向为类脑智能,经营Bilibili站账号:Camnuy_AI,账号每周更新AI领域全新论文,涉及AIGC、NLP、CV等多个子领域,其中对于Mamba的讲解视频是目前B站上播放量最高的,目前参与多个国家重点研究项目,负责基于AI的智能控制、数字呈现等方面。 杨毅远,牛津大学计算机系博士生,《Easy-RL:强化学习教程》作者,牛津大学克拉伦登学者。曾获得国家奖学金、北京市优秀毕业生等荣誉。所参与的开源教程、项目全网阅读/参与量数十万,曾受邀在2022年&2023年世界人工智能大会、华为、阿里等做相关分享。 申泽楷,北京交通大学研究生。研究方向为时空数据挖掘。
打开封面
下载高清视频
观看高清视频
视频下载器
由浅入深--最新模型Mamba原理与应用简介
2024最新模型Mamba详解,Transformer已死,你想知道的都在这里了!3小时带你吃透颠覆Transformer的全新视觉架构—Mamba!(深度学习
说人话解释Mamba技术原理 Transformers 又被超越了
Mamba从数学推导到代码的一条龙?看一遍就够了!
2024最热模型Mamba详解,Transformer已死?真的比刷剧爽多了!!---Mamba模型、Mamba代码、Mamba安装、人工智能
2024最新模型Mamba详解,mamba模型及其公式推导及其论文速读,你要的全都有!不愧是火爆的MAMBA,简直太好用了!-北京邮电大学/清华大学
[双字] 如何用<你自己的数据>训练{Mamba}(可替代Transformer的模型)
视觉十分钟|mamba模型讲解(含transformer,RNN,SSM,S4部分)
VM-UNet:基于纯Mamba的医学图像分割模型
从零开始学Mamba(1)Transformer有毛病
Transformer从零详细解读(可能是你见过最通俗易懂的讲解)
杀疯了!2024年最新模型:【Mamba】原理讲解,transformer何去何从?
mamba:超越transformer的全新架构?
AI大讲堂:革了Transformer的小命?专业拆解【Mamba模型】
最新15个Mamba魔改超越transformer,GPU内存消耗减少74%
【中英字幕】国外大佬精讲2024最火模型mamba,不一样的思维带你透彻理解mamba这篇论文和实战落地!-人工智能、大模型
视觉十分钟|vision mamba(Vim)视觉领域新主干
【博士Vlog】2024最新模型Mamba详解,Transformer已死,你想知道的都在这里了!
横空出世的Mamba—要取代Transformer的地位?
论文速读17:Mamba
新颖视觉骨干网络结构,Vision Mamba
19、Transformer模型Encoder原理精讲及其PyTorch逐行实现
颠覆Transformer架构? 新架构Mamba优势是啥?
【博士Vlog】Mamba奠基的工作讲了什么?SSM和HIPPO的重要性有多高?
看了这个视频你才能真正搞懂FlashAttention, S4和Mamba
阿里提出Mamba in Mamba!比现有SOTA提速10倍,相关学术24篇
视觉mamba模型的前生今世和原理
24年最好发论文的方向:Mamba魔改&应用,24篇参考文献来袭!
Mamba和S4解读:架构、并行扫描、内核融合、循环、卷积、数学
23年12月最新研究之Mamba:挑战Transformer长达六年的霸主地位
【汇报】 Mamba模型及其公式推导
What KAN I say? Mamba out! 一分钟讲完KAN & 我的一些想法
Mamba 超超超详细解说 | 1、对 SSM 的透彻理解
Diffusion生成式模型新思路,用时间序列来降噪
论文速读18:Computer Vision with Mamba
揭秘 Attention——Transformer和LLM的关键机制
从编解码和词嵌入开始,一步一步理解Transformer,注意力机制(Attention)的本质是卷积神经网络(CNN)
李沐-除非你是专家否则不建议搞图神经网络
拒了?眞拒了!Mamba out的真相就在这6篇里
【博士Vlog】2024最新模型Mamba详解,Transformer已死,你想知道的都在这里了!