V
主页
【前言】大模型的DenseNet时刻:Mamba疯狂涨点5%!
发布人
需要论文/代码的同学可以 关注后看私信或添加以下: https://www.bilibili.com/read/cv21673469
打开封面
下载高清视频
观看高清视频
视频下载器
就说AI代替不了人类
Jamba击败Transformer,全新Mamba魔改完成逆袭!
Mamba2卷土重来!收录ICML2024:与Transformer表现相当,速度提高了2-8倍
【分享好课】不愧是火爆的MAMBA,简直太好用了!2024最新模型Mamba详解,草履虫都能听懂,你要的全都有!-北京邮电大学/清华大学/大模型
从零开始学Mamba(5) S4=SSSS (hard mode)-DPLR
Mamba-2即将一统江湖,统一SSM和注意力机制!卷土重来、再战顶会,顺利拿下了ICML 2024!
AI模型里也存在双胞胎?灵感居然都源自Mamba,但“性能”完全迥异!
从零开始学Mamba(7) Mamba is not a snake!(Theory)
ICML2024丨Mamba杀疯了!transformer到底输在哪了?Mamba精读!—mamba、人工智能论文、深度学习
Mamba-2模型原理解读-1模型
RNN崛起,再创Transformer!谷歌新架构两连发,同等规模强于Mamba,13种Transformer热门改进
5分钟教你用Python在本地编写Chatbot,Powered by PerfXCloud(大模型开发与部署云)
用Mamba设计1.8M参数UNet,比U-Mamba小近100倍,精度依旧完成超车!
下一个视觉任务的顶流!交替块式xLSTM变体性能超越视觉Mamba
下一个视觉任务的顶流!交替块式xLSTM变体性能超越视觉Mamba
Mamba在音频领域的下一城 首个应用音频分类的变体 不再依赖自注意力
全体研究生注意:别再追求模型收敛了!一个Trick让模型更稳定
Transformer取代者终于登场!成本低、速度快、性能强
2024论文最佳创新点!Swin-Unet:基于Transformer的医学图像分割实战,论文详解+源码复现,研究生必看!
医学图像领域学生狂喜:Mamba终于加持U-Net,显著超越SWin-UNet!
再战Transformer!原作者带队的Mamba2一统江湖!性能狂飙8倍,对比70种Mamba魔改
医疗影像识別革命:结合CNN与SSM技术,又和Mamba有关!
强到离谱!解决Transformer的根本缺陷,2024年最热门论文之CoPE位置编码方法:所有大模型都能获得巨大改进!LLM
2024最新模型Mamba详解,mamba模型及其公式推导及其论文速读,你要的全都有!不愧是火爆的MAMBA,简直太好用了!-北京邮电大学/清华大学
黑曼巴来袭!长序列语言模型建模新方案,1.5B/2.8B版本已开源
9种Mamba+CNN融合创新刷新SOTA,准确率高达99.63 %【包含代码】
4060Ti 16G显卡安装Ollama+ChatTTS打造智能语音秘书(突破30秒限制)
权重初始化新方法:大模型权重初始化小模型,训练省时又涨点!
Transformer取代者登场!微软、清华合作推出成本低速度快性能强(论文正文已打包)
解锁Mamba模型的奥秘-李代数和李群的视角
围绕Obsidian,打造AI知识库
【上海交通大学】最新教程--动手学大模型,新手可冲!
【全748集】字节大佬终于把 AI大模型(LLM)讲清楚了!通俗易懂,2024最新内部版,学完即就业!AGI商业化落地创业营,一门非常落地的AI大模型创业课!!
大语言模型虎扑评分,你最常用哪个?Chatgpt4!【虎扑锐评】
在CV界,传统卷积已经彻底输给Transformer了吗?
多模态大模型的文字识别能力之痛,由OCR大模型来缓解!
训练自己的LLM大模型最牛指南来了!这本 <从头开始构建大型语言模型>实在太香了(附PDF)
AI模型的训练过程,就像动植物的生长, 更多是被“培养”而不是“编程”!
大模型人都在学的LLM大模型黑书,豆瓣网评分高达9.9!外网超火的LLM应用书籍来了(附中文版PDF)
谷歌发布全新线性时序预测模型再次反超Transformer