基于深度学习的视频文本的跨模态检索30页综述来了,包含近7年150篇相关论文!
发布人