V
主页
京东 11.11 红包
牛津等发布!文本驱动的3D高斯泼溅编辑
发布人
我们提出了一种文本驱动的方法GaussCtrl来编辑由3D高斯泼溅( 3DGS )重建的3D场景。该方法首先使用3DGS渲染一组图像,并使用基于输入提示的预训练2D扩散模型( controlnet网络)对其进行编辑,然后使用controlnet网络对3D模型进行优化。我们的主要贡献是多视图一致编辑,这使得在更新三维模型时,可以将所有图像编辑在一起,而不是像以前的工作那样迭代地编辑一幅图像。它实现了更快的编辑速度以及更高的视觉质量。这是由两个条件实现的:( a )深度条件编辑,通过利用自然一致的深度图来实现多视图图像之间的几何一致性。( b )基于注意力的潜在代码对齐,通过图像潜在表示之间的自注意力和跨视图注意力,将编辑图像的外观统一到几个参考视图中。实验表明,我们的方法比之前最先进的方法实现了更快的编辑和更好的视觉结果。 文章名称:【GaussCtrl: Multi-View Consistent Text-Driven 3D Gaussian Splatting Editing】 文章链接:http://arxiv.org/abs/2403.08733 项目主页: https://gaussctrl.active.vision/
打开封面
下载高清视频
观看高清视频
视频下载器
华科、华为联合开源!实时动态场景4D高斯泼溅,最高 82fps!
牛津自然拼读第一册26个字母
清华等联合开源!动态 3D 高斯超高保真头部重建
【2024最新】AI大模型入门教程(65集精讲)真正的保姆级零基础入门教程!深度学习基础+大模型相关算法+神经网络,大模型入门必学!
【直播回放】SLAM公司汇总
【直播回放】SLAM常见面试问题浅析
加大洛杉矶分校与浙大等联合开源”物理高斯:用于生成动力学的物理集成三维高斯”
最新款梦幻组合—半人马机器人
【线下讲座】邹镇洪:科研小白如何入门自动驾驶?
【直播回放】多传感器融合方案介绍
01-NeRF与SLAM结合的早期探索
有意思!模仿动物的四足机器人,ETHZ发布!IROS2022
从头开始教你用VSCode开发Python程序!
角点的提取、跟踪与筛选
2024最火的两个模型:Informer+LSTM两大时间序列预测模型,论文精读+代码复现,通俗易懂!——人工智能|AI|机器学习|深度学习
【直播回放】做研究如何寻找创新点?
公主被改造成为液体机器人#改造#机械飞升
【直播回放】用于3D激光雷达SLAM闭环检测的词袋模型 BoW3D
SLAM初学者常问的几个问题
多色来了!预售开启!
最新发布|真实环境下,自动驾驶汽车的感知与定位!
【直播回放】视觉几何三维重建学习心得分享及作业讲解
香港科技大学博士生分享:室外场景下的快速鲁棒点云全局配准(上)
牛津开学Vlog | 反焦虑🦋和朋友猫着过周末~(by@牛津kate朱朱,牛津朱朱kate,禁止转载)
【直播回放】武汉大学开源SLAM详解!低成本轮式机器人定位算法 Wheel-INS
中科院与华南理工联合发布!NeRF与特征匹配相结合进行位姿估计
蔚蓝档案 空崎日奈礼服版 完整制作涂装过程
11款神经网络科研绘图可视化工具,高效绘图太省事了!原来神经网络图这么简单就能画出来!
【牛津英语短语动词】 English Phrasal Verbs EP53
摩比斯汽车-超级智能的高级驾驶员辅助系统
MIT发布!实时任务驱动的开集3D场景图
视频换图?全程高能,可应用于AR和视频编辑!港中大等即将开源,SIGGRAPH2022!
【直播回放】SLAM学习入门经验分享
第2级【1-5级全】Oxford Phonics World 牛津自然拼读世界-配套精讲课程【1-5级别 329课 视频】精品
清华深研院、哈工深发布!Lidar视觉紧耦合实时相对定位
【开源】CVPR 2022|帅哥变美女,二哈变萌宠?南洋理工新发布无监督图像迁移,纵享丝滑!
整活了!实时三维位姿估计!
IROS 24 复旦大学发布! Polaris 基于Syn2Real视觉基础和大语言模型的开放式交互机器人操作
ICRA22 CMU机器人所讲座 | 面向长期自主性的MetaSLAM
1.4 ORB-SLAM2算法框架详解