动作识别最新综述来了，包含RNN，3D卷积以及Transformer等算法，涉及近300篇相关论文！ - 视频下载 Video Downloader

动作识别最新综述来了，包含RNN，3D卷积以及Transformer等算法，涉及近300篇相关论文！

发布人

-

打开封面下载高清视频观看高清视频视频下载器

30分钟吃透Transformer架构！pytorch从0实现！ | 代码逐行讲解 | 源码开放 | 高效入门

还得看吴恩达！一口气讲透CNN、RNN、GAN、LSTM、YOLO、transformer等六大深度学习神经网路算法！真的不要太爽~（AI人工智能丨机器学习）

最全的30页Loss函数总结综述来了，包含30多种损失函数，涉及分类，回归，Ranking等！

统治扩散模型的U-Net结构被取代了！谷歌提出基于Transformer的可扩展扩散模型DiT！计算效率和生成效果均超越ADM和LDM！代码刚刚开源！

Human Action Recognition综述来了，近10年160篇论文，涉及RNN和CNN类型的方法，需要的同学快来领取！

全网最火的动作识别是如何做到的？HourglassNet是什么？

最强视觉backbone网络ConvNext v2来了！Meta AI融合了视觉掩码自监督框架，提出新的新的SOTA算法！目前代码和模型已开源！

这才是科研该学！2024公认最通俗易懂的【深度学习】教程，从入门到精通一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM

深度学习CVPR 2024 | InceptionNeXt | 即插即用模块

基于Transformer的GAN网络综述来了！包含近50种GAN在图像和视频生成上的应用方法，涉及160篇论文！

微软总结了视觉Transformer的分类性能，从参数量，计算量等方面对它们进了公平的对比！

深度学习CVPR 2024 | 轻量高效ViT | SHViT

39页视觉问答（VQA）和视觉推理综述论文来了！涉及近30个数据集，50多种经典方法，VQA终于学会了！

【全300集】清华大学2024版Transformer教程！入门到进阶，全程干货讲解！拿走不谢！（神经网络/NLP/深度学习/BERT/大模型/GPT/RNN）

基于Diffusion模型的以文生图综述来了！包含145篇相关论文，涉及Diffusion相关理论和基础介绍！

神马！只用60行Numpy代码手搓出GPT大模型！这老哥简直太牛啦

全新的全卷积视觉骨干网FCViT，超过ConvNext，目前已开源！

【全187集】字节跳动大佬终于把AI大模型（LLM）讲清楚了！通俗易懂，2024最新内部版！拿走不谢，学不会我退出IT圈！

基于Transformer的单目标跟踪35页综述来了，近100篇相关论文，涉及近两年20多种方法！

20年预训练大模型98页百科全书来了！从Bert到ChatGPT，涉及CV，NLP，Graph以及多模态等，史上最全综述！

9位Science院士联名发表人工智能发展长篇综述，涵盖了智能计算的基础理论，智能计算融合的重要应用和挑战！

中山大学学者提出新的视觉Transfomer结构DilateFormer，减少70%计算量的同时性能更优！目前已开源！

LSTM泛滥？transformer太难？A会最新时序模型框架，模型创新快人一步！

鹏城实验室学者提出了一种新的视频语言多模态预训练模型SOTA-VLP，融合了空间时序建模方法，捕获细粒度特征，多项任务取得SOTA！

基于深度学习的时序预测37页综述来了，包含方法和应用的介绍，囊括CNN，RNN以及Attention等近50种主流算法！

新年礼包又来了，自监督综述！从算法，理论和应用三大趋势对目前常见的各种自监督算法进行了整理和回顾，涵盖了360篇自监督相关论文！

一个神级代码复现网站，里面99%的论文都能找到！

如何蒸馏小模型？28页知识蒸馏综述来了，涉及近30蒸馏方案，需要的同学快来领取！

文本引导的虚拟试衣来了，多模态在时尚领域的又一杀器！一键更换模特服装！目前代码模型已开源！

动画讲解「Transformer」，一步一步深入浅出解释Transformer原理！这可能是我看到过最通俗易懂的Transformer教程了吧！-人工智能

比外挂还离谱的【YOLO目标检测】自从用了YOLO玩枪战游戏，再也不用担心看不到人了！超详细YOLO目标物体检测实战教程（实战教程，快速入门！）

阿里提出了一种无需解码头的轻量化语义分割网络，参数量减少30%的同时性能提升4个百分点！

导师强烈安利的模型训练可视化工具，不愧是深度学习最强炼丹伴侣！

最全的图像数据增强综述来了，包含数十种数据增强策略，能够显著提升模型的识别效果和精度！各位CV炼丹师千万别错过！

图灵机得主Hiton极力推荐的谷歌深度学习调参手册及中文翻译版来了，包含30页调参技巧，需要的同学快来领取！

商汤科技提出具有双层路由注意力的视觉Transformer，减少原始ViT计算量的同时性能大幅超过Swin Transformer!已被CVPR 2023接收！

外网爆火的大模型黑书！基于GPT-3、ChatGPT、GPT-4等 Transformer 架构的自然语言处理

史上最全600页NLP圣经来了，由NLP领域的大牛，斯坦福大学 Daniel Jurafsky教授等人共同编写，涵盖NLP原理基础及各种应用！

北大联合华为诺亚提出了一种增强对比学习的新方法ArCL，通过学习更鲁棒的特征，将MOCO等对比学习方法提升1-2个百分点！目前已被ICLR 2023接收！

里斯本大学学者提出检索增强的Image Captioning 方法，可以在预训练图文编码器的基础上进一步提升Caption性能！