CVPR 2023|SDFusion:多模态3D形状补全、重建和生成

发布人

SDFusion: Multimodal 3D Shape Completion, Reconstruction, and Generation 
code: https://github.com/yccyenchicheng/SDFusion
project: https://yccyenchicheng.github.io/SDFusion
paper: https://arxiv.org/pdf/2212.04493.pdf

打开封面下载高清视频观看高清视频视频下载器

CVPR 2023|基于动漫人物画像的风格化单视图3D重建

CVPR 2023|布局到图像生成的可控扩散模型

CVPR 2023|学习多模态扩散模型用于音视频生成

CVPR 2023|生成辅助视频描述用于文本-视频检索

CVPR 2023|基于扩散模型的泛化音频驱动的肖像动画

CVPR 2023|数字虚拟人生成

CVPR 2023|T2M-GPT：基于离散表达从文本生成动作

【论文导读】多模态大语言模型综述（四）评估

CVPR 2023|颜色风格迁移

CVPR 2023| 基于上下文视觉学习的多功能模型

多模态大模型 MiniCPM-V 2.6「实时视频理解」首次上端！

CVPR 2023|A2J-Transformer:3D交互手部姿态估计

InternVL作者详解CVPR Oral 论文

CVPR 2023|图像超分辨

CVPR 2023|ScarceNet:动物姿态估计

【脑客中国·科研】第155位讲者 | 王杰：多模态磁共振成像与脑科学

CVPR 2023|PoseFormerV2:利用频域信息改进3D人体姿态估计

跨模态细粒度高清检索项目

CVPR 2023| Lite-Mono:轻量级自监督单目深度估计

深度学习最热方向！今年最全的多模态大模型综述来啦！-神经网络/大模型/LLM

【3D人脸】2024 3D人脸重建算法排行榜，没想到第一名竟是它

多模态模型+Sam2 CV视频物体处理更上新台阶, Sam2会是多模态领域的Chatgpt吗？

CVPR2023|通过帧间注意提取运动和外观用于视频帧插值

【多模态+知识图谱】半天居然就跟着博士从零构建知识图谱！基于知识图谱的六大项目实战！医药问答系统、知识抽取、推荐系统、Neo4j数据库、大模型

讲座 | 三维场景中的具身多模态感知与交互——上海人工智能实验室研究员王泰

CVPR 2024 | 图像恢复 | Adaptive Sparse Transformer

CVPR 2023|HOLODIFFUSION 3D扩散模型

舒服了把多模态大模型MiniCPM用在ComfyUI里实现超强读图能力让flux提前用上ipadapter

吴恩达《使用Gemini进行大型多模态模型提示|Large Multimodal Model Prompting with Gemini》（豆包翻译

CVPR 2023|脑信号可视化

CVPR 2023|语义图像编辑

CVPR 2023|掩码图像建模

【多模态大模型高峰论坛】高新波教授：人工智能大模型的风险挑战与发展趋势

如何最快速写一篇论文？手把手教你！多模态无人机检测

CVPR 2023|第一人称视角视频的3D手部姿势估计和动作识别

【论文导读】视觉语言地学大模型综述（一）导论

讲座 | 面向多模态大模型的具身智能平台LEGENT——清华大学THUNLP lab在读博士胡锦毅

Metaf发布，LMMs王者登场！Transformer和Diffusion强势融合，促进语言模型和图像生成大一统

1分钟内快速完成学术润色，全网最简易论文润色教程来啦！

CVPR 2024 | 医学图像分割 | 高效多尺度卷积注意力解码器EMCAD

CVPR 2023|SDFusion:多模态3D形状补全、重建和生成

CVPR 2023|基于动漫人物画像的风格化单视图3D重建

CVPR 2023|布局到图像生成的可控扩散模型

CVPR 2023|学习多模态扩散模型用于音视频生成

CVPR 2023|生成辅助视频描述用于文本-视频检索

CVPR 2023|基于扩散模型的泛化音频驱动的肖像动画

CVPR 2023|数字虚拟人生成

CVPR 2023|T2M-GPT：基于离散表达从文本生成动作

【论文导读】多模态大语言模型综述（四）评估

CVPR 2023|颜色风格迁移

CVPR 2023| 基于上下文视觉学习的多功能模型

多模态大模型 MiniCPM-V 2.6「实时视频理解」首次上端！

CVPR 2023|A2J-Transformer:3D交互手部姿态估计

InternVL作者详解CVPR Oral 论文

CVPR 2023|图像超分辨

CVPR 2023|ScarceNet:动物姿态估计

【脑客中国·科研】第155位讲者 | 王杰：多模态磁共振成像与脑科学

CVPR 2023|PoseFormerV2:利用频域信息改进3D人体姿态估计

跨模态细粒度高清检索项目

CVPR 2023| Lite-Mono:轻量级自监督单目深度估计

深度学习最热方向！今年最全的多模态大模型综述来啦！-神经网络/大模型/LLM

【3D人脸】2024 3D人脸重建算法排行榜，没想到第一名竟是它

多模态模型+Sam2 CV视频物体处理 更上新台阶, Sam2会是多模态领域的Chatgpt吗？

CVPR2023|通过帧间注意提取运动和外观用于视频帧插值

【多模态+知识图谱】半天居然就跟着博士从零构建知识图谱！基于知识图谱的六大项目实战！医药问答系统、知识抽取、推荐系统、Neo4j数据库、大模型

讲座 | 三维场景中的具身多模态感知与交互——上海人工智能实验室研究员王泰

CVPR 2024 | 图像恢复 | Adaptive Sparse Transformer

CVPR 2023|HOLODIFFUSION 3D扩散模型

舒服了把多模态大模型MiniCPM用在ComfyUI里实现超强读图能力让flux提前用上ipadapter

吴恩达《使用Gemini进行大型多模态模型提示|Large Multimodal Model Prompting with Gemini》（豆包翻译

CVPR 2023|脑信号可视化

CVPR 2023|语义图像编辑

CVPR 2023|掩码图像建模

【多模态大模型高峰论坛】高新波教授：人工智能大模型的风险挑战与发展趋势

如何最快速写一篇论文？手把手教你！多模态无人机检测

CVPR 2023|第一人称视角视频的3D手部姿势估计和动作识别

【论文导读】视觉语言地学大模型综述（一）导论

讲座 | 面向多模态大模型的具身智能平台LEGENT——清华大学THUNLP lab在读博士胡锦毅

Metaf发布，LMMs王者登场！Transformer和Diffusion强势融合，促进语言模型和图像生成大一统

1分钟内快速完成学术润色，全网最简易论文润色教程来啦！

CVPR 2024 | 医学图像分割 | 高效多尺度卷积注意力解码器EMCAD

多模态模型+Sam2 CV视频物体处理更上新台阶, Sam2会是多模态领域的Chatgpt吗？