V
主页
京东 11.11 红包
MAMBA and State Space Models explained _ SSM explained
发布人
https://www.youtube.com/watch?v=vrF3MtGwD0Y&t=129s We simply explain and illustrate Mamba, State Space Models (SSMs) and Selective SSMs. SSMs match performance of transformers, but are faster and more memory-efficient than them. This is crucial for long sequences! Outline: 00:00 Mamba to replace Transformers!? 02:04 State Space Models (SSMs) – high level 03:09 State Space Models (SSMs) – more detail 05:45 Discretization step in SSMs 08:14 SSMs are fast! Here is why. 09:55 SSM training: Convolution trick 12:01 Selective SSMs 15:44 MAMBA Architecture 17:57 Mamba results 20:15 Building on Mamba 21:00 Do RNNs have a comeback? 21:42 AICoffeeBreak Merch 📄 Gu, Albert, and Tri Dao. "Mamba: Linear-time sequence modeling with selective state spaces." arXiv preprint arXiv:2312.00752 (2023). https://arxiv.org/abs/2312.00752 📄 MoE-Mamba https://arxiv.org/abs/2401.04081 📄 Vision Mamba https://arxiv.org/abs/2401.09417 📄 MambaByte https://arxiv.org/abs/2401.13660 🕊️ Mamba rejected from ICLR: / 1750526956452577486 📖 Prefix sum (Scan) with Cuda: https://developer.nvidia.com/gpugems/... 📺 Transformer explained: • The Transformer explained by Ms. Coff... Great resources to learn about Mamba: 📙 Mamba: https://jameschen.io/jekyll/update/20... 📕 The Annotated S4: https://srush.github.io/annotated-s4/ 📘 Mamba The Easy Way: https://jackcook.com/2024/02/23/mamba... ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀ 🔥 Optionally, pay us a coffee to help with our Coffee Bean production! ☕ Patreon: / aicoffeebreak Ko-fi: https://ko-fi.com/aicoffeebreak Join this channel to get access to perks: / @aicoffeebreak ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀ 🔗 Links: AICoffeeBreakQuiz: / aicoffeebreak Twitter: / aicoffeebreak Reddit: / aicoffeebreak YouTube: / aicoffeebreak #AICoffeeBreak #MsCoffeeBean #MachineLearning #AI #research Scientific advising by Mara Popescu Video editing: Nils Trost Music 🎵 : Sunny Days – Anno Domini Beats
打开封面
下载高清视频
观看高清视频
视频下载器
【生成式AI導論 2024】第13講:淺談大型語言模型相關的安全性議題 (上) — 亡羊補牢、語言模型的偏見、有多少人用 ChatGPT 寫論文審查意見
真实感爆棚!Flux你太强了!Midjourney估计要胆战心惊了! | AI绘画
【Andrej Karpathy | 2023年11月23日】[1小时讲座]大型语言模型简介
【生成式AI導論 2024】第9講:以大型語言模型打造的AI Agent (14_50 教你怎麼打
【生成式AI導論 2024】第8講:大型語言模型修練史 — 第三階段: 參與實戰,
Andrej Karpathy《从零开始搭建GPT》 |Let s build GPT_ from scratch, in code, spelled out.
【生成式AI導論 2024】第18講:有關影像的生成式AI (下) — 快速導讀經典影像生成方法 (VAE, Flow, Diffusion, GAN) 以及與
【对新手超级友好】三小时深度学习PyTorch快速入门教程,包教包会!!——人工智能|机器学习|深度学习
【手写代码 | Transformer】在 PyTorch 上从头开始编写 Transformer 代码,并提供完整的解释、训练和推理。
YOLOv9: How to Train on Custom Dataset from Scratch with Ultralytics
【李宏毅2023机器学习】機器學習+20230420
弟弟空间
【生成式AI導論 2024】第16講:可以加速所有語言模型生成速度的神奇外掛 — Speculative Decoding
【李宏毅2023机器学习】【生成式AI】讓 AI 村民組成虛擬村莊會發生甚麼事?
北京大学新生舞会|舞裾翩跹 步步生花
5-赌徒输光原理
《听,8000年前的声音》第三幕| 青梨派 第八届“我心中的思政课”全国高校大学生微电影展示活动参赛作品
考研坚持不下去了?听听大帅怎么说
耗时三周,终于整理出来这份CVPR2024可复现论文合集了!有数据集、有代码、有原文,带你啃透今年的CVPR论文!-人工智能、计算机视觉、NLP
【全463集】禁止自学走弯路!回归算法、聚类算法、决策树、随机森林、神经网络、贝叶斯算法、支持向量机等十大机器学习算法一口气学完!
Diffusion models from scratch in PyTorch
【CVPR 2024 Tutorial】Introduction to Classical Point Cloud Backbones
雷军锐评AI雷军
408计算机网络网络层复习(上)
【全网最细】逼自己一周吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,2024最新版,学完即就业!!
【附数据集】10分钟带你入门神经网络Pytorch手写数字识别,整体架构设计、数据集加载、网络结构设计、损失计算与优化、训练代码、发布程序等等 看完就能跑通!
188cm/60kg 女大学生周末日常vlog|在校训练加体测充实的一天
07 ABI和内联汇编
面向毫米波雷达的步态识别 mmwave identification
【官方双语】大语言模型怎么用PyTorch实现呢?一步步带你进行词嵌入word embedding代码实现!
AI终于让水浒角色说出了真心话
2021南京理工大学毕业典礼节选 | 《使命》| 校歌
强推!这绝对是B站最全的(python+机器学习+深度学习)系列教程,草履虫都能学会,学不会你来锤爆我!人工智能/机器学习/深度学习/python/神经网络
真的有人在通过chatgpt学习,你还不学习吗?
【2018 CVPR】FoldingNet: Interpretable Unsupervised Learning on 3D Point Clouds
智障ai
【2021 ICCV】A Closer Look at Rotation-invariant Deep Point Cloud Analysis
【Nina Montagne】三十多岁回到大学📝早上的例行公事,舒适高效的一天☕️
【今日鸡汤zbh】失败就到此为止
真的有大学开了《成年人社会常识课》【看病&医保篇】