北京智源重磅发布Emu3：统一生成和感知的多模态大模型（今日Arxiv 9月30日）2024年9月30日Arxiv cs.CV发文量约105余篇，减论Agent

发布人

北京智源重磅发布Emu3：统一生成和感知的多模态大模型（今日Arxiv 9月30日）2024年9月30日Arxiv cs.CV发文量约105余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省48分钟浏览Arxiv的时间。

打开封面下载高清视频观看高清视频视频下载器

西安交大提出无需训练的开放词汇遥感语义分割方法（今日Arxiv 10月3日）2024年10月3日Arxiv cs.CV发文量约105余篇，减论Agent

2024年8月1日Arxiv cs.CV发文量约90余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省40分钟浏览Arxiv的时间。

2024年7月30日Arxiv cs.CV发文量约160余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省68分钟浏览Arxiv的时间

卢老师团队提出基于SAM的显著目标检测网络（今日Arxiv 8月9日）！2024年8月9日Arxiv cs.CV发文量约68余篇。

节省37分钟！2024年7月25日Arxiv cs.CV发文量约80余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考。

清华大学提出全新Diffusion采样器DC-Solver：更高更快更强（今日Arxiv 9月6日）2024年9月6日Arxiv cs.CV发文量约81余篇

清华鲁老师团队提出实时分割一切3D（今日Arxiv 8月22日）2024年8月22日Arxiv cs.CV发文量约110余篇，减论Agent通过算法为您推荐

贾老师团队重磅发布ControlNeXt（今日Arxiv 8月13日）

MMFuser：南大提出多模态大语言模型视觉表征增强模块（今日Arxiv 10月16日）2024年10月16日Arxiv cs.CV发文量约126余篇

北大王选计算所提出无需训练的视频时序定位方法（今日Arxiv 8月30日）2024年8月30日Arxiv cs.CV发文量约96余篇，减论Agent

清华提出条件对比对齐爆炸提升自回归视觉生成模型性能（今日Arxiv 10月15日）2024年10月15日Arxiv cs.CV发文量约242余篇，减论Agent

WaveMamba两篇同名撞车今日Arxiv（240805）！掐指一算，Mamba是时候排列组合到小波变换了[破涕为笑]

减论祝各位园丁教师节快乐！您辛苦了～（还要抽空来看今日Arxiv 9月10日哟）2024年9月10日Arxiv cs.CV发文量约224余篇，减论Agent

北大提出深度伪造视频检测新方法：视频混合增广+时空适配器微调（今日Arxiv 9月2日）2024年9月2日Arxiv cs.CV发文量约71余篇，减论Agent

SRFormerV2！侯老师团队提出置换注意力解锁高性能超分辨能力（今日Arxiv 8月15日）2024年8月15日Arxiv cs.CV发文量约75余篇

复旦提出时序对比解码减少VideoLLM事件幻觉（今日Arxiv 9月26日）2024年9月26日Arxiv cs.CV发文量约120余篇，减论Agent

苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART（今日Arxiv 10月8日）2024年10月8日Arxiv cs.CV发文量约186余篇

2024年7月29日Arxiv cs.CV发文量约60余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省26分钟浏览Arxiv的时间。

2024年7月26日Arxiv cs.CV发文量约95篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省43分钟浏览Arxiv的时间。

清华大学提出VERIFIED自动视频文本标注流（今日Arxiv 10月14日）2024年10月14日Arxiv cs.CV发文量约93余篇，减论Agent

清华大学提出大模型Agent开放平台LEGENT（今日Arxiv 8月20日）2024年8月20日Arxiv cs.CV发文量约242余篇

【11.15-arXiv】FAIR团队提出纯注意力迁移蒸馏方法！2024年11月15日arXiv cs.CV发文量约85余篇，减论Agent通过算法为您推荐

中山大学提出ParGo：弥合视觉Encoder和LLM的表征GAP（今日Arxiv 8月26日）2024年8月26日Arxiv cs.CV发文量约84余篇

我教你python不是让你刷QQ会员改成2099年到期啊

上海AI Lab重磅发布GMAI-MMBench多模态医疗基准（今日Arxiv 8月8日）！

【11.7-arXiv】北邮清华提出评估MLLM流视频理解能力基准StreamingBench！2024年11月7日arXiv cs.CV发文量约75余篇

3分钟极减阅读Arxiv（20240724）

浙大章老师团队提出高保真3D室内表面重建方法（今日Arxiv 8月23日）2024年8月23日Arxiv cs.CV发文量约86余篇，减论Agent为您推荐

【11.21-arXiv】南洋理工推出VBench++视频生成模型评估基准！2024年11月21日arXiv cs.CV发文量约103余篇，减论Agent推荐！

【11.4-arXiv】字节跳动提出随机自回归RAR，生成效率提升恺明MAR方法20倍以上，性能更优！2024年11月4日arXiv cs.CV发文量约85余篇

英伟达重磅发布NVLM多模态大型语言模型，即将开源！（今日Arxiv 9月18日）2024年9月18日Arxiv cs.CV发文量约95余篇，减论Agent

【11.13-arXiv】西北工大提出3D聚焦多实例点云配准网络！2024年11月13日arXiv cs.CV发文量约87余篇，减论Agent通过算法为您推荐

2024年8月6日Arxiv cs.CV今日亮点：白老师团队发力2Billion大模型，Mini-Monkey与InternVL2掰手腕！

Framer：浙大提出交互式点轨迹帧插值算法（今日Arxiv 10月25日）2024年10月25日Arxiv cs.CV发文量约92余篇，减论Agent

【减论系列专栏】从分布到生成（一）：什么是图像的分布？本集我们通过与最简单的伯努利分布的类比，尝试回答如下问题：当我们在说图像分布的时候，我们在说什么？

70年老算法Dijkstra被证明普遍最优斩获顶会FOCS 2024最佳论文

【10.30-arXiv】华中科大提出Senna自主驾驶系统；2024年10月30日arXiv cs.CV发文量约115余篇，减论Agent通过算法为您推荐

南开大学采用掩码建模策略提出一体化盲图像复原方法（今日Arxiv 10月2日）2024年10月2日Arxiv cs.CV发文量约95余篇，减论Agent

丝滑转场！川大提出无需训练的视频过渡生成方法TVG（今日Arxiv 8月27日）2024年8月27日Arxiv cs.CV发文量约182余篇，减论Agent

【10月29日Arxiv】浙大提出OmniSep全模态声音分离框架；2024年10月29日arXiv cs.CV发文量约191余篇，减论Agent

北京智源重磅发布Emu3：统一生成和感知的多模态大模型（今日Arxiv 9月30日）2024年9月30日Arxiv cs.CV发文量约105余篇，减论Agent

西安交大提出无需训练的开放词汇遥感语义分割方法（今日Arxiv 10月3日）2024年10月3日Arxiv cs.CV发文量约105余篇，减论Agent

2024年8月1日Arxiv cs.CV发文量约90余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省40分钟浏览Arxiv的时间。

2024年7月30日Arxiv cs.CV发文量约160余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省68分钟浏览Arxiv的时间

卢老师团队提出基于SAM的显著目标检测网络（今日Arxiv 8月9日）！2024年8月9日Arxiv cs.CV发文量约68余篇。

节省37分钟！2024年7月25日Arxiv cs.CV发文量约80余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考。

清华大学提出全新Diffusion采样器DC-Solver：更高更快更强（今日Arxiv 9月6日）2024年9月6日Arxiv cs.CV发文量约81余篇

清华鲁老师团队提出实时分割一切3D（今日Arxiv 8月22日）2024年8月22日Arxiv cs.CV发文量约110余篇，减论Agent通过算法为您推荐

贾老师团队重磅发布ControlNeXt（今日Arxiv 8月13日）

MMFuser：南大提出多模态大语言模型视觉表征增强模块（今日Arxiv 10月16日）2024年10月16日Arxiv cs.CV发文量约126余篇

北大王选计算所提出无需训练的视频时序定位方法（今日Arxiv 8月30日）2024年8月30日Arxiv cs.CV发文量约96余篇，减论Agent

清华提出条件对比对齐爆炸提升自回归视觉生成模型性能（今日Arxiv 10月15日）2024年10月15日Arxiv cs.CV发文量约242余篇，减论Agent

WaveMamba两篇同名撞车今日Arxiv（240805）！掐指一算，Mamba是时候排列组合到小波变换了[破涕为笑]

减论祝各位园丁教师节快乐！您辛苦了～（还要抽空来看今日Arxiv 9月10日哟）2024年9月10日Arxiv cs.CV发文量约224余篇，减论Agent

北大提出深度伪造视频检测新方法：视频混合增广+时空适配器微调（今日Arxiv 9月2日）2024年9月2日Arxiv cs.CV发文量约71余篇，减论Agent

SRFormerV2！侯老师团队提出置换注意力解锁高性能超分辨能力（今日Arxiv 8月15日）2024年8月15日Arxiv cs.CV发文量约75余篇

复旦提出时序对比解码减少VideoLLM事件幻觉（今日Arxiv 9月26日）2024年9月26日Arxiv cs.CV发文量约120余篇，减论Agent

苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART（今日Arxiv 10月8日）2024年10月8日Arxiv cs.CV发文量约186余篇

2024年7月29日Arxiv cs.CV发文量约60余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省26分钟浏览Arxiv的时间。

2024年7月26日Arxiv cs.CV发文量约95篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省43分钟浏览Arxiv的时间。

清华大学提出VERIFIED自动视频文本标注流（今日Arxiv 10月14日）2024年10月14日Arxiv cs.CV发文量约93余篇，减论Agent

清华大学提出大模型Agent开放平台LEGENT（今日Arxiv 8月20日）2024年8月20日Arxiv cs.CV发文量约242余篇

【11.15-arXiv】FAIR团队提出纯注意力迁移蒸馏方法！2024年11月15日arXiv cs.CV发文量约85余篇，减论Agent通过算法为您推荐

中山大学提出ParGo：弥合视觉Encoder和LLM的表征GAP（今日Arxiv 8月26日）2024年8月26日Arxiv cs.CV发文量约84余篇

我教你python不是让你刷QQ会员改成2099年到期啊

上海AI Lab重磅发布GMAI-MMBench多模态医疗基准（今日Arxiv 8月8日）！

【11.7-arXiv】北邮清华提出评估MLLM流视频理解能力基准StreamingBench！2024年11月7日arXiv cs.CV发文量约75余篇

3分钟极减阅读Arxiv（20240724）

浙大章老师团队提出高保真3D室内表面重建方法（今日Arxiv 8月23日）2024年8月23日Arxiv cs.CV发文量约86余篇，减论Agent为您推荐

【11.21-arXiv】南洋理工推出VBench++视频生成模型评估基准！2024年11月21日arXiv cs.CV发文量约103余篇，减论Agent推荐！

【11.4-arXiv】字节跳动提出随机自回归RAR，生成效率提升恺明MAR方法20倍以上，性能更优！2024年11月4日arXiv cs.CV发文量约85余篇

英伟达重磅发布NVLM多模态大型语言模型，即将开源！（今日Arxiv 9月18日）2024年9月18日Arxiv cs.CV发文量约95余篇，减论Agent

【11.13-arXiv】西北工大提出3D聚焦多实例点云配准网络！2024年11月13日arXiv cs.CV发文量约87余篇，减论Agent通过算法为您推荐

2024年8月6日Arxiv cs.CV今日亮点：白老师团队发力2Billion大模型，Mini-Monkey与InternVL2掰手腕！

Framer：浙大提出交互式点轨迹帧插值算法（今日Arxiv 10月25日）2024年10月25日Arxiv cs.CV发文量约92余篇，减论Agent

【减论系列专栏】从分布到生成（一）：什么是图像的分布？本集我们通过与最简单的伯努利分布的类比，尝试回答如下问题：当我们在说图像分布的时候，我们在说什么？

70年老算法Dijkstra被证明普遍最优 斩获顶会FOCS 2024最佳论文

【10.30-arXiv】华中科大提出Senna自主驾驶系统；2024年10月30日arXiv cs.CV发文量约115余篇，减论Agent通过算法为您推荐

南开大学采用掩码建模策略提出一体化盲图像复原方法（今日Arxiv 10月2日）2024年10月2日Arxiv cs.CV发文量约95余篇，减论Agent

丝滑转场！川大提出无需训练的视频过渡生成方法TVG（今日Arxiv 8月27日）2024年8月27日Arxiv cs.CV发文量约182余篇，减论Agent

【10月29日Arxiv】浙大提出OmniSep全模态声音分离框架；2024年10月29日arXiv cs.CV发文量约191余篇，减论Agent

70年老算法Dijkstra被证明普遍最优斩获顶会FOCS 2024最佳论文