V
主页
京东 11.11 红包
什么是RNN中的“记忆诅咒”?模块化小网络组合登顶,状态空间模型才是最优解
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
深度学习三巨头之-Bengio等新作:注意力可被视为RNN?新模型媲美Transformer,超省内存!
注意力机制魔改新思路: 窗口注意力速度提升210倍,刷新SOTA!10种创新思路
小模型的组合能否实现大模型性能?这篇论文你必须估摸一下!
提升神经网络自身不确定性估计有救了!新策略一键增强模型可靠性
Patch才是时序预测的王道?最新工作超越Transformer取得SOTA
结合创新:Patch+Transformer,计算成本狂降4倍!12种创新思路借鉴
融合Transformer与CNN,实现各任务性能巅峰,17种创新参数直接减少80%
显式考虑异质性不流行了? 神经片状传播才是主流!最有实力的异构图神经网络来袭!
时间序列异常检测新突破:登上Nature,检测准确率飙升!37种创新方法
权重初始化新方法:大模型权重初始化小模型,训练省时又涨点!
目前最强Backbone:北大+港大+腾讯+复旦+蚂蚊联合发布,远超ResNet
高端的大模型往往只需要最朴素的压缩方式:通用提示压缩高达480倍!
Jamba击败Transformer,全新Mamba魔改完成逆袭!
即插即用涨点种器:归一化层全新突破!
最好的结合创新:小波变换+注意力机制,实现100%分类准确率!11种创新手法
13种即插即用模块,涨点发文必备【原文+代码】
小白都能看懂的可解释性综述,基于Transformer LM全方位破译内部工作机制
【AI知识分享】扩散模型入门学习看这一个系列的视频就够了!EDM论文讲解之扩散模型通用框架超详细解读第一回:通用加噪公式,抛开限制,做你自己,扩散模型都是一回事
通用创新点:坐标注意力机制,低成本下表现依旧SOTA!12种主流创新方法汇总
频域方向的更多可能性:利用小波变换的卷积层,更大感受野/改善鲁棒性
Attention永不言败!损失函数+注意力机制再战性能巅峰,10种结合思路!
超全超简单!一口气刷完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM、DBN等八大深度学习神经网络算法!真的比刷剧还爽!
【CVPR 2024】扩散模型如何提高采样速度,减少推理时间?Adobe新作教你即插即用扩散蒸馏
解决马尔可夫决策过程中,“规划”是哪种推理类型?
最新几何Transformer模型登上Nature子刊!预测实现近10倍的速度提升,14种最新思路
因果推断会是下一个AI热潮吗?来看21篇前沿顶会
超越Transformer:时间序列预测新方向霸榜AI项会!10篇必读顶会来了!
参透大模型原理,全新LLM可视化、可交互工具,哪里不会点哪里!
transformer结合强化学习创新:组成端到端导航策略Agent,无需微调直接迁移!
扩散模型+Transformer:你准备好迎接AI图像生成的新纪元了吗?
Nature正刊都在用的LSTM又爆火了!! 最新研究进展看这25篇就够!(原文和源码)
大跌眼镜!神经网络新革命:重新定义科学和工程中的逆问题求解
ResNet最新变体:性能反超Transformer,准确率达98.42%,19种改进方法一览无遗!
即插即用多尺度注意力:只使用了50%的标记数据,平均准确率也达到了95.27%!16种涨点思路
刚上线,星标就达1.4k的神经网络可视化神器,配备最新教程+200篇神经网络必读顶会
Transformer最新进展:性能大幅度超出一众SOTA模型!26种魔改方法
为什么是神经网络可以学会任何东西?10分钟动画演示,附带GNN、RNN、LSTM、GAN、Transformer等八大神经网络算法解读!
医学图像领域学生狂喜:Mamba终于加持U-Net,显著超越SWin-UNet!
注意力机制18种魔改方法全面汇总!包含论文/代码
Transformer如何统一多模态理解和生成? 结合自回归和扩散采样步骤整整少20倍