V
主页
京东 11.11 红包
149期《HRDFuse: Monocular 360°Depth Estimation by Collaboratively Learning Holist》
发布人
HRDFuse: Monocular 360°Depth Estimation by Collaboratively Learning Holistic-with-Regional Depth Distributions 产学科研合作项目团队:香港科技大学 (广州)王林教授团队、腾讯PCG ARC Lab 报告嘉宾:王林,香港科技大学(广州)人工智能学域助理教授及香港科技大学计算机系联署助理教授,并同时担任人工智能学域本科事务主任。王老师博士毕业于韩国科学技术院(KAIST, QS Top 40) 人工智能专业并留校开展博士后研究。王老师主要学术研究方向为基于生物感知驱动的机器视觉、三维视觉、智能系统(XR,机器人)、视觉与人机交互等。近三年在视觉、机器人、人机交互等期刊会议发表高质量论文30余篇,部分研究成果用于工业领域。担任视觉、机器人、人机交互等会议及期刊 CVPR, IEEE TPAMI, IEEE RA-L等程序委员会委员,并任深圳锐思科技专家顾问、广州市元宇宙专家库成员、云从科技项目评审专家库成员等。曾获KAIST博士最高博士研究成果奖、CCF-腾讯犀牛鸟基金学者等荣誉。 论文摘要:由于360° 图像对场景的整体感知,单目 360° 图像的深度估计是一个很受关注的问题。最近,一些方法,例如 OmniFusion,已经应用切线投影 (TP) 来表示 360° 图像并通过 回归预测每一张切线投影切片的深度值,合并这些切片的深度值以获得等距柱状投影 (ERP) 格式的深度图。然而,这些方法存在以下问题:1)合并大量补丁的过程复杂并且困难;2)通过直接回归每个像素的深度值并不能很好的捕捉全面和区域协同的上下文信息。在本文中,我们提出了一个新颖的框架 HRDFuse,它巧妙地结合了卷积神经网络 (CNN) 和转换器的潜力,并通过协同学习分析来自 ERP 的整体上下文信息和来自 TP 的区域结构信息。首先,我们提出了一个空间特征对齐 (SFA) 模块,该模块学习 TP 和 ERP 之间的特征相似性,以将 TP 特征以像素方式聚合成完整的 ERP 特征图。其次,我们提出了一个协作深度分布分类 (CDDC) 模块,该模块学习 ERP 和 TP 深度分布的整体区域直方图,并直方图分布中心的线性组合因此来预测最终的深度值。最后,我们自适应地结合来自 ERP 和 TP 的深度预测以获得最终的深度图。大量实验表明,我们的方法可以预测更平滑和准确的深度结果,同时取得比 SOTA 方法更好的结果。
打开封面
下载高清视频
观看高清视频
视频下载器
太厉害了!终于有人能把OpenCV图像处理+YOLO目标检测讲的这么通俗易懂了!无偿分享学不会你来找我!_计算机视觉/深度学习/OpenCV/YOLO
yolov8多目标跟踪实战:opencv读取视频帧、画图、写入文件、yolov8实时视频跟踪、轨迹绘制_计算机视觉
图像分割、目标检测、特征提取、边缘检测、图像滤波、人脸识别,这绝对是B站最适合入门学习的OpenCV计算机视觉课程!从入门到图像处理实战!人工智能丨深度学习丨
【李宏毅】2024年公认最好的扩散模型【Diffusion Model】教程!全程干货,通俗易懂,看完就跑通!-附带课件
爆肝整理!CVPR2024可复现论文合集,原文/代码/演示全都有!(深度学习/计算机视觉)
麻省理工【算法导论】原著大佬带你一起啃书!全23讲!99%的程序员都会学!(人工智能、深度学习、机器学习、神经网络、pytorch、AI)
170期《Privacy-Preserving Face Recognition Using Trainable Feature Subtraction》
目标检测只能玩YOLO?这三大算法:DETR、MaskRcnn及FasterRcnn同样拥有不小的竞争力,听同济大佬大白话讲学,三天快速上手!
特朗普2024胜选演讲全文
163期《Hokoff: Real Game Dataset from Honor of Kings and its Offline Reinforcemen》
【附源码】毕设有救了!整整50套深度学习项目,算法原理+论文解读,比啃书强太多了!学完就能玩透人工智能!pytorch/机器学习/计算机视觉
每个人都经历过打嗝,但相信百分之九十九的人都不知道打嗝的原理究竟是什么
小波变换+注意力机制,数据处理领域的“王炸”组合,创新性拉满!
【2024最新】大模型入门到进阶全套!一口气学完机器学习、深度学习、神经网络、自然语言处理、计算机视觉和大模型微调等六大人工智能核心技术板块!
169期《YOLO-World Real-Time Open-Vocabulary Object Detection》
斯坦福李飞飞终于把【计算机视觉】给讲明白了!全程16集,草履虫都能听明白!深度学习cs231n公开课【中英字幕】
【视频+教材】原著大佬李沐带你读《动手学习深度学习》真的通俗易懂!深度学习入门必看!(人工智能、机器学习、神经网络、计算机视觉、图像处理、AI)
151期《Rethinking the Learning Paradigm for Dynamic Facial Expression Recognition》
我在B站上大学!【完整版-麻省理工-微积分重点】全18讲!学数学不看的微积分课程,看完顺滑一整年。_人工智能数学基础/机器学习/微积分/麻省理工/高等数学
我愿称之为【计算机视觉入门教程】天花板!12讲从入门到实战,全程通俗易懂,都是干货!!!(计算机视觉图像处理/人工智能)
吹爆!六小时速通,深度学习之图像处理+目标检测+图像分割超全教程来啦!(matlab/计算机视觉/人工智能/深度学习/机器学习/图像处理/计算机视觉)
【YOLOv11】一小时速通版!知名博士逐一解读配置文件以及代码复现,环境安装+推理+自定义数据集搭建与训练,入门到精通!
【yolov8】一小时掌握!从0开始搭建部署YOLOv8,环境安装+推理+自定义数据集搭建与训练,入门到精通!
全网最详细的数据分析算法教程来了!带你一口气学完:Numpy、Pandas、Matplotlib、Seaborn!真的通俗易懂!(人工智能、深度学习、AI)
研究生话题:入门机器学习深度学习需要多久时间?这次终于能搞明白了!
B站强推推荐系统最经典的算法,基于用户的协同过滤推荐算法实现简单在线电影、音乐、图书等推荐系统实战!通俗易懂!人工智能/深度学习/机器学习/推荐算法
强推!全网最系统的自然语言处理全套教程分享,学完可少走99%的弯路! NLP基础/NLP实战项目
CVPR2022|Mask2former:图像分割大一统模型,语义分割、实例分割、全景分割一套搞定!论文解读+源码复现!(深度学习/计算机视觉)
吹爆!迪哥一小时带你吃透YOLOV8目标检测算法,手把手教你搞定检测、分类、追踪等视觉任务!人工智能/机器学习/深度学习/计算机视觉
刷爆!【深度学习-图像分割】图像分割+语义分割Unet原理讲解及项目实战教程!(人工智能、神经网络、机器学习、机器学习算法、Unet论文、Unet医学)
【毕设有救了】Transformer架构应用及其算法从零详细解析(可能是你见过最通俗易懂的讲解),超适合新手小白入门-人工智能/深度学习/机器学习
146期《NeAT: Learning Neural Implicit Surfaces With Arbitrary Topologies From Mul》
YOLO11V2.1增量更新,新增目标追踪运动轨迹,优化推理线程,捕获进程窗口,解压覆盖原文件即可完成更新
深度学习环境配置一套搞定:anaconda+pytorch+pycharm+cuda全详解,带你从0配置环境到跑通代码!
新手狂喜!目标检测领域最适合初学者的YOLO算法教程分享!迪哥带你一口气学完YOLOv1~v10全系列!
179期《Tell Me More! Towards Implicit User Intention Understanding of Language Mo》
2024终于有科研大佬把“你的科研能力从什么时候开始突飞猛进的?”讲清楚啦!
【网络安全】万能密码破,手把手教你从零学习暴力破解,全程实战教学(压缩包/游戏/网站/WiFi)
【教材+源码】李沐大神《动手学深度学习》最新视频教程,深度学习必读圣经!
别一上来就学习各种函数!这才是学习OpenCV的正确方法,迪哥手把手教你快速上手OpenCV图像处理工具!(深度学习/计算机视觉)