V
主页
京东 11.11 红包
前沿解读 | 更好的视频表征基础模型
发布人
该研究介绍了一种新的视频掩码算法,即运动引导的掩码算法(MGM)。与传统的随机掩码策略不同,MGM利用运动矢量来指导遮罩在时间上的位置变化。通过在两个大规模视频基准测试中应用MGM,与之前最先进的方法相比,取得了高于1.3%的性能改进。此外,MGM使用更少的训练周期,使视频理解模型的训练效率提高了66%。
打开封面
下载高清视频
观看高清视频
视频下载器
前沿解读 | Make-A-Video 一个从文本生成视频的人工智能系统
前沿解读 | 使用数据集蒸馏更有效地训练机器学习模型
前沿解读 | AlphaGeometry
你绝不能错过的人工智能六大顶级应用
前沿解读 | 新的对比学习方法可以更好地表征数据
AMIE: 用于诊断医学推理和对话的研究人工智能系统
前沿解读 | 新工具、数据集有助于检测大型语言模型中的幻觉
前沿解读 | 图解半监督学习框架FixMatch
前沿解读 | MobileDiffusion:在移动设备上快速生成文本到图像
人工智能、机器学习、深度学习的区别是什么?
前沿解读 |可以处理多图像输入的视觉语言模型
为什么GPU比CPU更适合人工智能计算?
前沿解读 | Whisper 简介
前沿解读 | 通过子概念从弱标签视频中学习
前沿解读:发现系统中何时存在代理
人工智能落地最有前景的三大领域
大型语言模型能否识别并纠正错误
基础生物信息学——使用R语言进行分析(一)
前沿解读 | 用于机械通风控制的机器学习
基础生物信息学——使用R语言进行分析(三)
前沿解读 | 通过人工智能研究推进体育分析
《AI炼丹》
《AI炼丹》
OpenAI | DevDay上宣布的新模型和开发者产品
前沿解读:利用深度学习模型从社区人群的视网膜照片中检测慢性肾病
理解LSTM神经网络
前沿解读 | 通过视频预训练学习玩Minecraft
前沿解读 | 基于深度学习的食管腺癌早期诊断
前沿解读 | 自监督学习中的迁移学习
前沿 | 人工智能是主角,谷歌I/O大会让我们看到了未来!
前沿解读 | 图解句子编码器
CRISPR安全吗?基因组编辑首次获得FDA审查
DeepMind | 塑造先进机器人技术的未来
3分钟读懂基因芯片技术
前沿解读 | MuZero从研究到现实世界的第一步
基础生物信息学——使用R语言进行分析(五)
前沿解读 | 使用稀疏的专家混合拓展视觉
前沿解读 | 基于端到端深度学习的多机构医学影像隐私保护
你的医学图像分类器是否知道它没有见过的内容?
GPT-4发布!关于ChatGPT的5个研究重点