V
主页
Transformer在线性模型上如何做in context learning
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
【速领原文和代码】谷歌新作|基于k-means的Transformer
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
电子科大最新"深度聚类"全面综述,涵盖260篇Paper!
魔改系Transformer都有哪些?这几个AI资源泰酷辣!
又快又好的Transformer:吞吐量+45%,精度+2%【附原文和代码】
【速领】2022研究综述《工业缺陷检测深度学习方法》
GPT-3剪枝算法来了!无需微调,1750亿参数模型,剪50%还提点#ai#论文 #人工智能 #模型压缩 #调参
只要一块RTX3090,就能跑ChatGPT体量模型的方法来了!已开源
视觉Transformer背后的关键,清华&Meta提出HorNet:用递归门控卷积进行高阶空间和相互作用(原文和代码)
视觉Transform必看的5篇综述#人工智能 #论文 #人工智能论文#Transformer
华为提出时序预测Mixers,取代Transformer,实现效果速度双提升#人工智能 #ai #论文 #时间序列#Transformer
AI顶会大热门:域自适应突破瓶颈,刷新SOTA!性能提高至92.45%
卷不动transformer改进?第三代神经网络-脉冲神经网络了解一下,适配时序、图像各任务,能耗降低54%
TENER:改进Transformer应用在NER任务【NLP-命名实体识别】
麻省理工Nature发表新作,颠覆传统神经网络,19个神经元驾驶一辆车,附原文和代码#人工智能 #论文 #ai #神经网络
大型语言模型综述从T5到GPT-4最全盘点20余位研究者联合撰写
这份时序工作总结你得看起来了!你一定要关注的顶会经典时间序列建模方法
可解释聚类又“炸出圈”啦!把准3个切入点言路开挂,11种创新思路一学就会~
这也太全了!目前为止我在B站看到过最完整最系统的【时间序列预测模型】教程!(LSTM/Informer/ARIMA/Pandas/Transformer)
异常检测发论文新方向,15种创新思路一次看完!
【NeurIPS】2024必将是时空预测爆发的一年!25篇项会一览前沿创新思路
眼观六路 手感八方,机器手识别万物,登Science子刊封面
清华提出雪花反卷积网络,用于点云形状补全与生成,附原文和代码#人工智能 #ai #论文 #卷积神经网络 #点云
VQ(矢量量化)一下子Key:Transformer的复杂度就变成线性了?
超强Trick!如何设计一个比Transformer更强的CNN Backbone
大火的KAN和GP梦幻联动:仅80k参数高达98.5%准确率 开启非线性建模的新大门!
【合集向】Ai+医学方向优质论文714篇,附原文和代码#论文 #人工智能 #人工智能论文
《AI前沿追踪》2022年最值得关注的10篇论文#论文#人工智能#人工智能论文#扩散模型
域泛化爆火!12种前沿创新思路全面汇总
ChatGPT自己会选模型了微软&浙大推出爆文HuggingGPT(附原文和开源项目)
在大语言模型时代里,知识图谱到底过时了吗?
少即是多!谷歌新型注意力伟大无需多言,比常规Transformer内存使用量少47倍!
用于语义分割的高效inceptiontransformer,附原文和代码#论文 #人工智能 #人工智能论文 #语义分割#transformer
【NeurIPS2024】 贝叶斯深度学习新突破:通过超球面能量最小化,大增模型多样性!100%改进不确定性估计
英伟达发布最新魔改注意力:简单模型结构+全局信息聚合,SimplifyFormer延迟降低37%,吞吐量提高44%
谷歌大脑新优化器VeLO:自己调整参数,自适应不同任务,附原文和代码#论文 #人工智能 #优化器 #ai
一探马尔可夫数据上的Transformer 哦!原来恒定深度就够了
最新《机器学习损失函数》综述,详细阐述33个最广泛使用的损失函数的分类和最佳使用场合
可【一键执行】的深度学习模型代码实现合集,且代码少于100行
怎样让不同的扩散模型合作?这篇【Collaborative Diffusion】CVPR2023论文告诉你!