属于科研人们的暑假来了～今日Arxiv发文量显著下降；腾讯优图推出开源多多模态大语言模型VITA！视频、图像、文本、音频通通拿下（今日Arxiv 240812） - 视频下载 Video Downloader

属于科研人们的暑假来了～今日Arxiv发文量显著下降；腾讯优图推出开源多多模态大语言模型VITA！视频、图像、文本、音频通通拿下（今日Arxiv 240812）

发布人

今日Arxiv发文量显著下降，属于科研人们的暑假来了～腾讯优图推出开源多多模态大语言模型VITA！视频、图像、文本、音频通通拿下（今日Arxiv 240812）2024年8月12日Arxiv cs.CV发文量约49余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，阅读预计花费3分钟时间。

打开封面下载高清视频观看高清视频视频下载器

腾讯提出精准实例定位与细节生成方法IFAdapter（今日Arxiv 9月13日）2024年9月13日Arxiv cs.CV发文量约107余篇，减论Agent

HiPrompt：使用分层提示和噪声分解生成高分辨率图像，无需微调！（今日Arxiv 9月5日）2024年9月5日Arxiv cs.CV发文量约95余篇

清华大学提出全新Diffusion采样器DC-Solver：更高更快更强（今日Arxiv 9月6日）2024年9月6日Arxiv cs.CV发文量约81余篇

董老师团队提出底层视觉通用模型GenLV（今日Arxiv 8月19日）2024年8月19日Arxiv cs.CV发文量约75余篇

MedTrinity-25M：超大规模的多模态医学数据集今日Arxiv发布！包含超过2500万个图像-ROI-描述三元组！2024年8月7日

MMFuser：南大提出多模态大语言模型视觉表征增强模块（今日Arxiv 10月16日）2024年10月16日Arxiv cs.CV发文量约126余篇

2024年7月26日Arxiv cs.CV发文量约95篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省43分钟浏览Arxiv的时间。

苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART（今日Arxiv 10月8日）2024年10月8日Arxiv cs.CV发文量约186余篇

WaveMamba两篇同名撞车今日Arxiv（240805）！掐指一算，Mamba是时候排列组合到小波变换了[破涕为笑]

清华鲁老师团队提出实时分割一切3D（今日Arxiv 8月22日）2024年8月22日Arxiv cs.CV发文量约110余篇，减论Agent通过算法为您推荐

中山大学提出ParGo：弥合视觉Encoder和LLM的表征GAP（今日Arxiv 8月26日）2024年8月26日Arxiv cs.CV发文量约84余篇

西安交大提出无需训练的开放词汇遥感语义分割方法（今日Arxiv 10月3日）2024年10月3日Arxiv cs.CV发文量约105余篇，减论Agent

2024年8月1日Arxiv cs.CV发文量约90余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省40分钟浏览Arxiv的时间。

港中文提出Rectified Diffusion：更低成本，更优性能（今日Arxiv 10月11日）2024年10月11日Arxiv cs.CV发文量约147篇

2024年7月30日Arxiv cs.CV发文量约160余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省68分钟浏览Arxiv的时间

3分钟极减阅读Arxiv（20240724）

卢老师团队提出基于SAM的显著目标检测网络（今日Arxiv 8月9日）！2024年8月9日Arxiv cs.CV发文量约68余篇。

2024年8月6日Arxiv cs.CV今日亮点：白老师团队发力2Billion大模型，Mini-Monkey与InternVL2掰手腕！

VLM-Grounder：港中文提出基于2D图像的零样本3D定位（今日Arxiv 10月18日）2024年10月18日Arxiv cs.CV发文量约130余篇

复旦提出时序对比解码减少VideoLLM事件幻觉（今日Arxiv 9月26日）2024年9月26日Arxiv cs.CV发文量约120余篇，减论Agent

北大王选计算所提出无需训练的视频时序定位方法（今日Arxiv 8月30日）2024年8月30日Arxiv cs.CV发文量约96余篇，减论Agent

清华大学提出拉普拉斯混合姿态估计模型LaPose（今日Arxiv 9月25日）2024年9月25日Arxiv cs.CV发文量约128余篇，减论Agent

北理北航提出SPG解决点云语义分割类别不平衡问题（今日Arxiv 8月21日）2024年8月21日Arxiv cs.CV发文量约113余篇，减论Agent推荐

清华提出条件对比对齐爆炸提升自回归视觉生成模型性能（今日Arxiv 10月15日）2024年10月15日Arxiv cs.CV发文量约242余篇，减论Agent

清华大学提出大模型Agent开放平台LEGENT（今日Arxiv 8月20日）2024年8月20日Arxiv cs.CV发文量约242余篇

2024年7月29日Arxiv cs.CV发文量约60余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省26分钟浏览Arxiv的时间。

高老师团队提出GeoFormer新型点云补全方法（今日Arxiv 8月14日）2024年8月14日Arxiv cs.CV发文量约85余篇

浙大章老师团队提出高保真3D室内表面重建方法（今日Arxiv 8月23日）2024年8月23日Arxiv cs.CV发文量约86余篇，减论Agent为您推荐

【10月29日Arxiv】浙大提出OmniSep全模态声音分离框架；2024年10月29日arXiv cs.CV发文量约191余篇，减论Agent

华中科大提出R-CoT生成高质量几何推理数据（今日Arxiv 程序员节）2024年10月24日Arxiv cs.CV发文量约85余篇，减论Agent

Framer：浙大提出交互式点轨迹帧插值算法（今日Arxiv 10月25日）2024年10月25日Arxiv cs.CV发文量约92余篇，减论Agent

【减论系列专栏：从分布到生成（二）】计算机如何采样出一张服从特定分布的图像（VAE篇）？本集从基础的“样本映射”，无任何概率理论地推导出了VAE架构。

小红书发布StoryMaker：保持多角色一致性！（今日Arxiv 9月20日）2024年9月20日Arxiv cs.CV发文量约93余篇，减论Agent推荐

Qwen2-VL重棒发布！（今日ArxIv 9月19日）2024年9月19日Arxiv cs.CV发文量约97余篇，减论Agent通过算法为您推荐

【11.7-arXiv】北邮清华提出评估MLLM流视频理解能力基准StreamingBench！2024年11月7日arXiv cs.CV发文量约75余篇

2024年7月31日Arxiv cs.CV发文量约70余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省30分钟浏览Arxiv的时间

南洋理工提出Disco4D：单张图像解耦精细化服装人体（今日Arxiv 9月27日）2024年9月27日Arxiv cs.CV发文量约133余篇，减论Agent

【11.13-arXiv】西北工大提出3D聚焦多实例点云配准网络！2024年11月13日arXiv cs.CV发文量约87余篇，减论Agent通过算法为您推荐

减论祝各位园丁教师节快乐！您辛苦了～（还要抽空来看今日Arxiv 9月10日哟）2024年9月10日Arxiv cs.CV发文量约224余篇，减论Agent

厦大提出基于物理定律驱动的单图像生成4D内容方法（今日Arxiv 9月12日）2024年9月12日Arxiv cs.CV发文量约100余篇，减论Agent推荐