V
主页
GARField: Group Anything with Radiance Fields
发布人
【加群】 一起来刷arxiv,请加vx: pwbot02(请备注:b站arxiv) 【论文标题】 GARField: Group Anything with Radiance Fields 【论文简述】 这篇论文介绍了Group Anything with Radiance Fields (GARField)方法,该方法利用拍摄图像输入将3D场景分解为一系列具有语义意义的组群。作者通过优化一个与尺度相关的3D亲和力特征场,实现了对于物理尺度下的组群模糊性的处理。该方法通过粗粒度到细粒度的层次结构,使用尺度一致性来融合不同视角下的冲突掩码,从而优化得到这个场景。通过这个场景,可以推导出一系列可能的组群层次结构,并且可以通过自动构建树状结构或用户交互来实现。实验结果表明,GARField方法在实际场景中能够有效地提取出多个层次的组群,包括对象的聚类、对象以及各种子部分。相比于输入的Segment Anything (SAM)掩码,GARField方法能够更好地表示多视角一致的组群并且生成更高保真度的组群。GARField的层次化组群技术在3D资源提取或动态场景理解等领域具有潜在的应用价值。 【论文链接】 https://arxiv.org/abs/2401.09419
打开封面
下载高清视频
观看高清视频
视频下载器
Farzi Data: Autoregressive Data Distillation
基于GPT-4V的视频理解系统MM-VID
Llemma: An Open Language Model For Mathematics
OpenWebMath: An Open Dataset of High-Quality Mathematical Web Text
Retrieval meets Long Context Large Language Models
Improving Summarization with Human Edits
Kosmos-G: Generating Images in Context with Multimodal Large Language Models
FreeControl:实现任意文本到图像扩散模型的无训练空间控制
高斯涂抹文本生成三维模型
Can Large Language Models be Good Path Planners? A Benchmark and Investigation o
基于GPT-4的类人机器人自主运动生成
销轴连接校核-仿真分析
可控动态3D肖像重建技术
生成高质量的长视频:SEINE视频扩散模型
基于高斯混合掩码的视觉变换器在小数据集上的提升
基于上下文调整的检索增强生成方法
Implicit Diffusion: Efficient Optimization through Stochastic Sampling
基于语言、任务和指标的人工智能模型的一致性分析
Interactive Task Planning with Language Models
Offline Actor-Critic Reinforcement Learning Scales to Large Models
Aligning Text-to-Image Diffusion Models with Reward Backpropagation
PALP: Prompt Aligned Personalization of Text-to-Image Models
Learning to Learn Faster from Human Feedback with Language Model Predictive Cont
Controllable Music Production with Diffusion Models and Guidance Gradients
DragVideo: 交互式拖拽式视频编辑
Language Models can be Logical Solvers
基于图神经网络的常数时间复杂度几何距离查询
Paper Reading Group基于知识增强的语言表示模型
浅层前馈神经网络模拟注意机制的有效性分析
解释性语言模型特征发现
多语言大型语言模型训练数据集CulturaX
In-Context Learning Creates Task Vectors
最小编辑代码修复算法
TRACE: A Comprehensive Benchmark for Continual Learning in Large Language Models
Progressive3D: Progressively Local Editing for Text-to-3D Content Creation with
Memory Augmented Language Models through Mixture of Word Experts
微量多语言数据提升多语言指令跟随能力
基于多头后验的预训练模型评估方法
Large Language Model Cascades with Mixture of Thoughts Representations for Cost-
PaperWeekly x 清华大学:计算未来轻沙龙——揭秘AutoML技术