CVPR 2023| Lite-Mono:轻量级自监督单目深度估计

发布人

Lite-Mono: A Lightweight CNN and Transformer Architecture for Self-Supervised Monocular Depth Estimation 
code: https://github.com/noahzn/Lite-Mono
paper: https://arxiv.org/pdf/2211.13202.pdf

打开封面下载高清视频观看高清视频视频下载器

CVPR2023|隐式扩散模型用于连续图像超分辨

CVPR 2023|音频驱动共语手势生成

CVPR 2023|第一人称视角视频的3D手部姿势估计和动作识别

CVPR 2023|基于扩散模型的泛化音频驱动的肖像动画

CVPR 2023|A2J-Transformer:3D交互手部姿态估计

CVPR 2023|SDFusion:多模态3D形状补全、重建和生成

CVPR 2023|基于动漫人物画像的风格化单视图3D重建

CVPR 2023|生成辅助视频描述用于文本-视频检索

CVPR 2023|颜色风格迁移

CVPR 2023| 基于上下文视觉学习的多功能模型

CVPR 2024 | 图像恢复 | Adaptive Sparse Transformer

CVPR 2023|PoseFormerV2:利用频域信息改进3D人体姿态估计

CVPR2023|通过帧间注意提取运动和外观用于视频帧插值

CVPR 2023|ScarceNet:动物姿态估计

CVPR 2023|AI视频生成

CVPR 2023|布局到图像生成的可控扩散模型

深度学习轻量级图像恢复网络RAMiT，CVPR2024 Workshop

CVPR 2023|基于文本的图像编辑

CVPR 2023|数字虚拟人生成

图像分割、目标检测、特征提取、边缘检测、图像滤波、人脸识别，这绝对是B站最适合入门学习的OpenCV计算机视觉课程！从入门到图像处理实战！人工智能丨深度学习丨

CVPR 2023|T2M-GPT：基于离散表达从文本生成动作

CVPR 2023|学习多模态扩散模型用于音视频生成

CVPR 2023|时序动作检测

深度学习CVPR2024 | 用于语义分割的频率自适应扩张卷积

CVPR 2023|语义图像编辑

CVPR 2023|脑信号可视化

深度学习 | 通用特征融合模块 | SCI一区2023 | YOLO可替换拼接层| PSFM多尺度图像特征融合模块，所有CV任务通用的高频低频图像特征融合模块

你的科研正处在：垃圾时间，红利时间，负债时间？

【20集完整版】目前B站最完整的论文写作教程，包含所有干货内容！这还没人看，我不更了！

深度学习 | 通用注意力模块 | YOLO |MLLA线性注意力模块，MKLA是MLLA结合KAN二次创新的线性注意力模块，比MLLA性能好，CV所有任务通用

深度学习 | 提供二次创新思路 | PRCV2023 | 全局和局部空间特征融合GLSA即插即用模块，适用于医学图像分割、小目标检测、暗光增强，CV所有任务通用

CVPR'24 | BEVSee：无需相机校准的联合相机和拍摄对象配准

CVPR 2024 | 医学图像分割 | 高效多尺度卷积注意力解码器EMCAD

CVPR 2023|图像超分辨

太厉害了已跪！终于有人能把OpenCV图像处理讲的这么通俗易懂了，现在计算机视觉opencv全套分享给大家。

举双手建议医学生结合AI发论文就死磕这4个宝藏学习工具！非常非常有用！-医学/医疗/医学图像/神经网络/深度学习

这绝对是2024年最好的计算机视觉教程，上海交大博士24小时带你快速入门，完全吃透计算机视觉任务！（深度学习/人工智能/OpenCV）

InternVL作者详解CVPR Oral 论文

CVPR 2023|从演示视频到目标图像的功能性区域定位

新模型加持，OAK深度相机的室外点云质量有多好？

CVPR 2023| Lite-Mono:轻量级自监督单目深度估计

CVPR2023|隐式扩散模型用于连续图像超分辨

CVPR 2023|音频驱动共语手势生成

CVPR 2023|第一人称视角视频的3D手部姿势估计和动作识别

CVPR 2023|基于扩散模型的泛化音频驱动的肖像动画

CVPR 2023|A2J-Transformer:3D交互手部姿态估计

CVPR 2023|SDFusion:多模态3D形状补全、重建和生成

CVPR 2023|基于动漫人物画像的风格化单视图3D重建

CVPR 2023|生成辅助视频描述用于文本-视频检索

CVPR 2023|颜色风格迁移

CVPR 2023| 基于上下文视觉学习的多功能模型

CVPR 2024 | 图像恢复 | Adaptive Sparse Transformer

CVPR 2023|PoseFormerV2:利用频域信息改进3D人体姿态估计

CVPR2023|通过帧间注意提取运动和外观用于视频帧插值

CVPR 2023|ScarceNet:动物姿态估计

CVPR 2023|AI视频生成

CVPR 2023|布局到图像生成的可控扩散模型

深度学习轻量级图像恢复网络RAMiT，CVPR2024 Workshop

CVPR 2023|基于文本的图像编辑

CVPR 2023|数字虚拟人生成

图像分割、目标检测、特征提取、边缘检测、图像滤波、人脸识别，这绝对是B站最适合入门学习的OpenCV计算机视觉课程！从入门到图像处理实战！人工智能丨深度学习丨

CVPR 2023|T2M-GPT：基于离散表达从文本生成动作

CVPR 2023|学习多模态扩散模型用于音视频生成

CVPR 2023|时序动作检测

深度学习CVPR2024 | 用于语义分割的频率自适应扩张卷积

CVPR 2023|语义图像编辑

CVPR 2023|脑信号可视化

深度学习 | 通用特征融合模块 | SCI一区2023 | YOLO可替换拼接层| PSFM多尺度图像特征融合模块，所有CV任务通用的高频低频图像特征融合模块

你的科研正处在：垃圾时间，红利时间，负债时间？

【20集完整版】目前B站最完整的论文写作教程，包含所有干货内容！这还没人看，我不更了！

深度学习 | 通用注意力模块 | YOLO |MLLA线性注意力模块，MKLA是MLLA结合KAN二次创新的线性注意力模块，比MLLA性能好，CV所有任务通用

深度学习 | 提供二次创新思路 | PRCV2023 | 全局和局部空间特征融合GLSA即插即用模块，适用于医学图像分割、小目标检测、暗光增强，CV所有任务通用

CVPR'24 | BEVSee： 无需相机校准的联合相机 和拍摄对象配准

CVPR 2024 | 医学图像分割 | 高效多尺度卷积注意力解码器EMCAD

CVPR 2023|图像超分辨

太厉害了 已跪！终于有人能把OpenCV图像处理讲的这么通俗易懂了，现在计算机视觉opencv全套分享给大家。

举双手建议医学生结合AI发论文就死磕这4个宝藏学习工具！非常非常有用！-医学/医疗/医学图像/神经网络/深度学习

这绝对是2024年最好的计算机视觉教程，上海交大博士24小时带你快速入门，完全吃透计算机视觉任务！（深度学习/人工智能/OpenCV）

InternVL作者详解CVPR Oral 论文

CVPR 2023|从演示视频到目标图像的功能性区域定位

新模型加持，OAK深度相机的室外点云质量有多好？

CVPR'24 | BEVSee：无需相机校准的联合相机和拍摄对象配准

太厉害了已跪！终于有人能把OpenCV图像处理讲的这么通俗易懂了，现在计算机视觉opencv全套分享给大家。