GARField: Group Anything with Radiance Fields

发布人

【加群】 一起来刷arxiv，请加vx: pwbot02(请备注：b站arxiv) 
【论文标题】 GARField: Group Anything with Radiance Fields
【论文简述】 这篇论文介绍了Group Anything with Radiance Fields (GARField)方法，该方法利用拍摄图像输入将3D场景分解为一系列具有语义意义的组群。作者通过优化一个与尺度相关的3D亲和力特征场，实现了对于物理尺度下的组群模糊性的处理。该方法通过粗粒度到细粒度的层次结构，使用尺度一致性来融合不同视角下的冲突掩码，从而优化得到这个场景。通过这个场景，可以推导出一系列可能的组群层次结构，并且可以通过自动构建树状结构或用户交互来实现。实验结果表明，GARField方法在实际场景中能够有效地提取出多个层次的组群，包括对象的聚类、对象以及各种子部分。相比于输入的Segment Anything (SAM)掩码，GARField方法能够更好地表示多视角一致的组群并且生成更高保真度的组群。GARField的层次化组群技术在3D资源提取或动态场景理解等领域具有潜在的应用价值。
【论文链接】 https://arxiv.org/abs/2401.09419

打开封面下载高清视频观看高清视频视频下载器

GARField: Group Anything with Radiance Fields

Farzi Data: Autoregressive Data Distillation

基于GPT-4V的视频理解系统MM-VID

Llemma: An Open Language Model For Mathematics

OpenWebMath: An Open Dataset of High-Quality Mathematical Web Text

Retrieval meets Long Context Large Language Models

Improving Summarization with Human Edits

Kosmos-G: Generating Images in Context with Multimodal Large Language Models

FreeControl：实现任意文本到图像扩散模型的无训练空间控制

高斯涂抹文本生成三维模型

Can Large Language Models be Good Path Planners? A Benchmark and Investigation o

基于GPT-4的类人机器人自主运动生成

销轴连接校核-仿真分析

可控动态3D肖像重建技术

生成高质量的长视频：SEINE视频扩散模型

基于高斯混合掩码的视觉变换器在小数据集上的提升

基于上下文调整的检索增强生成方法

Implicit Diffusion: Efficient Optimization through Stochastic Sampling

基于语言、任务和指标的人工智能模型的一致性分析

Interactive Task Planning with Language Models

Offline Actor-Critic Reinforcement Learning Scales to Large Models

Aligning Text-to-Image Diffusion Models with Reward Backpropagation

PALP: Prompt Aligned Personalization of Text-to-Image Models

Learning to Learn Faster from Human Feedback with Language Model Predictive Cont

Controllable Music Production with Diffusion Models and Guidance Gradients

DragVideo: 交互式拖拽式视频编辑

Language Models can be Logical Solvers

基于图神经网络的常数时间复杂度几何距离查询

Paper Reading Group基于知识增强的语言表示模型

浅层前馈神经网络模拟注意机制的有效性分析

解释性语言模型特征发现

多语言大型语言模型训练数据集CulturaX

In-Context Learning Creates Task Vectors

最小编辑代码修复算法

TRACE: A Comprehensive Benchmark for Continual Learning in Large Language Models

Progressive3D: Progressively Local Editing for Text-to-3D Content Creation with

Memory Augmented Language Models through Mixture of Word Experts

微量多语言数据提升多语言指令跟随能力

基于多头后验的预训练模型评估方法

Large Language Model Cascades with Mixture of Thoughts Representations for Cost-

PaperWeekly x 清华大学：计算未来轻沙龙——揭秘AutoML技术