CVPR2023 | 韩国延边大学提出从图像到视频Transformer的双路自适应网络，仅使用少量学习参数达到多项视频理解任务SOTA，代码已开源！ - 视频下载 Video Downloader

京东 11.11 红包

CVPR2023 | 韩国延边大学提出从图像到视频Transformer的双路自适应网络，仅使用少量学习参数达到多项视频理解任务SOTA，代码已开源！

发布人

-

打开封面下载高清视频观看高清视频视频下载器

Transformer最通俗讲解（上）

【2024最新】AI大模型入门教程（65集精讲）真正的保姆级零基础入门教程！深度学习基础+大模型相关算法+神经网络，大模型入门必学！

京东提出全球首个面向遥感任务设计的亿级视觉Transformer大模型，基于百万级遥感数据集进行预训练，下游检测，分割等任务性能SOTA，目前模型和代码已开源！

如何让深度强化学习准确的理解和应对不确定性？卡尔曼滤波居然是解药！

CVPR2023 基于掩码的视觉和语言Transformer，能够同时完成以文生图和Image Captioning两种多模态生成任务，且效果非常不错！

Transformer模型原理精讲：Swin、VIT、DETR、BERT四大Transformer核心模型全详解！（深度学习/计算机视觉）

顶会爆款！LSTM魔改效果惊人，AI预测准确率攀升至90%！

统治扩散模型的U-Net结构被取代了！谷歌提出基于Transformer的可扩展扩散模型DiT！计算效率和生成效果均超越ADM和LDM！代码刚刚开源！

AI可解释性综述来了，神经网络的黑盒性质经常被许多学者Diss，而可解释性方法让AI不在是完全黑盒！

CVPR2023 VindLU：有效的视频和语言预训练方案，在多项视频理解任务上取得SOTA水平！

微软提出了一种图像分割，视觉语言大一统模型X-Decoder！open-vocabulary语义分割效果惊艳！多项下游任务性能表现SOTA，目前代码和模型已开源

代码原理讲解|自适应细粒度通道注意力 Mix动态融合 2024一区Top 附赠多个改进点【V1代码讲解023】

基于Transformer的GAN网络综述来了！包含近50种GAN在图像和视频生成上的应用方法，涉及160篇论文！

2024最火的两个模型：Informer+LSTM两大时间序列预测模型，论文精读+代码复现，通俗易懂！——人工智能|AI|机器学习|深度学习

【Huggingface、BERT实战】假如你从10月7号开始学大模型！2024年大模型最强学习路线来啦！跟着这套流程走助你快速拿offer，持续更新中！

单层注意力就能实现高效学习，Transformer混合魔改来袭！图神经网络创新还在延续

122集付费！CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络一口气全部学完！

要基于Pytorch做深度学习，但是我代码水平很低，该如何学习呢？ -人工智能/机器学习/深度学习

CLIP可以直接拿来做文本检测了！腾讯优图提出TCM结构，文本检测能力在多个数据集上均有较大提升！目前以被CVPR2023接收！

神经网络登上Nature神坛！首次被证明具有泛化能力，并且能像人类一样思考！！ -人工智能/机器学习/深度学习

2小时极速复现LLaMA3, 掌握LlaMA就等于掌握9成开源大模型！LLaMA3架构全解与代码复现！

Excel手搓Self-Attention直观理解QKV三矩阵系统学习Transformer

租用云GPU跑通深度学习项目的教程终于来啦！！不能再说不会用了吧！ -人工智能/机器学习/深度学习

Adobe研究院提出了用于视频和音频多模态数据的视听对比学习的自监督策略，在多项视频和音频数据集上达到新SOTA！

商汤科技提出具有双层路由注意力的视觉Transformer，减少原始ViT计算量的同时性能大幅超过Swin Transformer!已被CVPR 2023接收！

华为诺亚提出视觉文档理解多模态预训练模型WuKong-Reader，在百万级文档数据上进行了预训练，多项下游任务效果SOTA！

CVPR2023发表，LayoutDiffusion：用于Layout控制图像生成的新方法，比之前方法取得了更好的生成质量和更多的可控制性！

阿里提出了一种无需解码头的轻量化语义分割网络，参数量减少30%的同时性能提升4个百分点！

字节联合爱丁堡大学提出新的视觉预训练方法MUG，取得新的SOTA！模型和代码均已开源，快来领取！

为什么神经网络可以学习任何东西？首次使用动画讲解，带你吃透神经网络！（CNN卷积神经网络、RNN循环神经网络、GAN生成式对抗网络、人工智能、AI）

LSTM时间序列预测结合Transformer：最具创新的深度学习模型架构！源码复现+模型精讲+论文解读，迪哥带你轻松搞定论文创新点！

上海交大学者提出了第一个用于医学图像诊断的多模态ChatGPT模型，在各种医学诊断任务上取得SOTA！

超强动画，一步一步深入浅出解释Transformer原理！这可能是我看到唯一一个用动画讲解Transformer原理的教程！真的通俗易懂！——人工智能、神经网络

阿里达摩院提出新的视频文本预训练框架，通过预训练，其在视频下游任务取得多项SOTA!

【全568集】清华大佬一周讲完的AI大模型，通俗易懂，2024最新版！7天学完从入门到进阶实战，专为零基础小白研制AI大模型课程，存下吧，很难找全了！！

当医学图像遇上SAM，会产生什么样的火花，基于SAM的医学图像分割finetune框架来了，附代码！

微软总结了视觉Transformer的分类性能，从参数量，计算量等方面对它们进了公平的对比！

2024终于有人把Transformer架构应用及其算法讲清楚了！迪哥精讲BERT、Swin、DETR、VIT四大核心模型，原理讲解+论文解读+代码复现！

CUDA GPU编程 |11小时教程2024版-上集【中英精校】

可以说知道这五个网站就没有找不到的数据集！特别是最后一个简直就是学术利器！-人工智能/深度学习/机器学习/数据集