北大提出金字塔流匹配算法用于高效视频生成（今日Arxiv 10月10日）2024年10月10日Arxiv cs.CV发文量约226余篇，减论Agent

发布人

北大提出金字塔流匹配算法用于高效视频生成（今日Arxiv 10月10日）2024年10月10日Arxiv cs.CV发文量约226余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省103分钟浏览Arxiv的时间。

打开封面下载高清视频观看高清视频视频下载器

港中文提出Rectified Diffusion：更低成本，更优性能（今日Arxiv 10月11日）2024年10月11日Arxiv cs.CV发文量约147篇

北京智源重磅发布Emu3：统一生成和感知的多模态大模型（今日Arxiv 9月30日）2024年9月30日Arxiv cs.CV发文量约105余篇，减论Agent

腾讯提出精准实例定位与细节生成方法IFAdapter（今日Arxiv 9月13日）2024年9月13日Arxiv cs.CV发文量约107余篇，减论Agent

清华鲁老师团队提出实时分割一切3D（今日Arxiv 8月22日）2024年8月22日Arxiv cs.CV发文量约110余篇，减论Agent通过算法为您推荐

高老师团队提出GeoFormer新型点云补全方法（今日Arxiv 8月14日）2024年8月14日Arxiv cs.CV发文量约85余篇

清华大学提出拉普拉斯混合姿态估计模型LaPose（今日Arxiv 9月25日）2024年9月25日Arxiv cs.CV发文量约128余篇，减论Agent

2024年8月1日Arxiv cs.CV发文量约90余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省40分钟浏览Arxiv的时间。

苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART（今日Arxiv 10月8日）2024年10月8日Arxiv cs.CV发文量约186余篇

西安交大提出无需训练的开放词汇遥感语义分割方法（今日Arxiv 10月3日）2024年10月3日Arxiv cs.CV发文量约105余篇，减论Agent

复旦提出时序对比解码减少VideoLLM事件幻觉（今日Arxiv 9月26日）2024年9月26日Arxiv cs.CV发文量约120余篇，减论Agent

3分钟极减阅读Arxiv（20240724）

北大王选计算所提出无需训练的视频时序定位方法（今日Arxiv 8月30日）2024年8月30日Arxiv cs.CV发文量约96余篇，减论Agent

2024年7月29日Arxiv cs.CV发文量约60余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省26分钟浏览Arxiv的时间。

北大提出深度伪造视频检测新方法：视频混合增广+时空适配器微调（今日Arxiv 9月2日）2024年9月2日Arxiv cs.CV发文量约71余篇，减论Agent

英伟达重磅发布NVLM多模态大型语言模型，即将开源！（今日Arxiv 9月18日）2024年9月18日Arxiv cs.CV发文量约95余篇，减论Agent

南洋理工提出Disco4D：单张图像解耦精细化服装人体（今日Arxiv 9月27日）2024年9月27日Arxiv cs.CV发文量约133余篇，减论Agent

OmniBench：揭示大语言模型全方位理解能力局限性（今日Arxiv 9月24日）2024年9月24日Arxiv cs.CV发文量约182余篇，减论Agent

S-Lab提出用于视频指令跟随的高质量合成数据集LLaVA-Video-178K（今日Arxiv 10月4日）

中科大提出肖像视频编辑神器PortraitGen（今日Arxiv 9月23日）2024年9月23日Arxiv cs.CV发文量约102余篇，减论Agent

3分钟极减阅读Arxiv（20240711）

贾老师团队重磅发布ControlNeXt（今日Arxiv 8月13日）

【减论系列专栏：从分布到生成（二）】计算机如何采样出一张服从特定分布的图像（VAE篇）？本集从基础的“样本映射”，无任何概率理论地推导出了VAE架构。

清华大学提出大模型Agent开放平台LEGENT（今日Arxiv 8月20日）2024年8月20日Arxiv cs.CV发文量约242余篇

清华大学提出全新Diffusion采样器DC-Solver：更高更快更强（今日Arxiv 9月6日）2024年9月6日Arxiv cs.CV发文量约81余篇

卢老师团队提出基于SAM的显著目标检测网络（今日Arxiv 8月9日）！2024年8月9日Arxiv cs.CV发文量约68余篇。

厦大提出基于物理定律驱动的单图像生成4D内容方法（今日Arxiv 9月12日）2024年9月12日Arxiv cs.CV发文量约100余篇，减论Agent推荐

【中英】10月10日，谷歌（Google）CEO桑达尔·皮查伊（Sundar Pichai）访谈：AI其与火、电等基础创新相当｜大卫·鲁宾斯坦秀｜

2024年7月31日Arxiv cs.CV发文量约70余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省30分钟浏览Arxiv的时间

【8分钟极减专栏：从分布到生成（三）】GAN可以不是对抗？什么？GAN可以理解为一个非对抗过程？鉴别器D本质上可以理解为一个广义的图像分布函数？欲知速看！

卫星图像到街景合成！上海AILab提出CrossViewDiff（今日Arxiv 8月28日）2024年8月28日Arxiv cs.CV发文量约92余篇

【8min极减专栏：从分布到生成（四）】直观理解GAN的不稳定性问题

2024年7月26日Arxiv cs.CV发文量约95篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省43分钟浏览Arxiv的时间。

小红书发布StoryMaker：保持多角色一致性！（今日Arxiv 9月20日）2024年9月20日Arxiv cs.CV发文量约93余篇，减论Agent推荐

2024年7月30日Arxiv cs.CV发文量约160余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省68分钟浏览Arxiv的时间

中山大学提出ParGo：弥合视觉Encoder和LLM的表征GAP（今日Arxiv 8月26日）2024年8月26日Arxiv cs.CV发文量约84余篇

【全集188集】深度学习必看圣经！李沐大神《动手学深度学习》最新版全套视频教程分享，比啃书高效！看完直接跑通！（深度学习/神经网络/计算机视觉）

3分钟极减阅读Arxiv（20240715）

3分钟极减阅读Arxiv（20240716）

【减论系列专栏】从分布到生成（一）：什么是图像的分布？本集我们通过与最简单的伯努利分布的类比，尝试回答如下问题：当我们在说图像分布的时候，我们在说什么？

5分钟极减阅读何恺明团队最新自回归图像生成工作～从All-Token Diffusion到Per-Token Diffusion的范式转变。

北大提出金字塔流匹配算法用于高效视频生成（今日Arxiv 10月10日）2024年10月10日Arxiv cs.CV发文量约226余篇，减论Agent

港中文提出Rectified Diffusion：更低成本，更优性能（今日Arxiv 10月11日）2024年10月11日Arxiv cs.CV发文量约147篇

北京智源重磅发布Emu3：统一生成和感知的多模态大模型（今日Arxiv 9月30日）2024年9月30日Arxiv cs.CV发文量约105余篇，减论Agent

腾讯提出精准实例定位与细节生成方法IFAdapter（今日Arxiv 9月13日）2024年9月13日Arxiv cs.CV发文量约107余篇，减论Agent

清华鲁老师团队提出实时分割一切3D（今日Arxiv 8月22日）2024年8月22日Arxiv cs.CV发文量约110余篇，减论Agent通过算法为您推荐

高老师团队提出GeoFormer新型点云补全方法（今日Arxiv 8月14日）2024年8月14日Arxiv cs.CV发文量约85余篇

清华大学提出拉普拉斯混合姿态估计模型LaPose（今日Arxiv 9月25日）2024年9月25日Arxiv cs.CV发文量约128余篇，减论Agent

2024年8月1日Arxiv cs.CV发文量约90余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省40分钟浏览Arxiv的时间。

苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART（今日Arxiv 10月8日）2024年10月8日Arxiv cs.CV发文量约186余篇

西安交大提出无需训练的开放词汇遥感语义分割方法（今日Arxiv 10月3日）2024年10月3日Arxiv cs.CV发文量约105余篇，减论Agent

复旦提出时序对比解码减少VideoLLM事件幻觉（今日Arxiv 9月26日）2024年9月26日Arxiv cs.CV发文量约120余篇，减论Agent

3分钟极减阅读Arxiv（20240724）

北大王选计算所提出无需训练的视频时序定位方法（今日Arxiv 8月30日）2024年8月30日Arxiv cs.CV发文量约96余篇，减论Agent

2024年7月29日Arxiv cs.CV发文量约60余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省26分钟浏览Arxiv的时间。

北大提出深度伪造视频检测新方法：视频混合增广+时空适配器微调（今日Arxiv 9月2日）2024年9月2日Arxiv cs.CV发文量约71余篇，减论Agent

英伟达重磅发布NVLM多模态大型语言模型，即将开源！（今日Arxiv 9月18日）2024年9月18日Arxiv cs.CV发文量约95余篇，减论Agent

南洋理工提出Disco4D：单张图像解耦精细化服装人体（今日Arxiv 9月27日）2024年9月27日Arxiv cs.CV发文量约133余篇，减论Agent

OmniBench：揭示大语言模型全方位理解能力局限性（今日Arxiv 9月24日）2024年9月24日Arxiv cs.CV发文量约182余篇，减论Agent

S-Lab提出用于视频指令跟随的高质量合成数据集LLaVA-Video-178K（今日Arxiv 10月4日）

中科大提出肖像视频编辑神器PortraitGen（今日Arxiv 9月23日）2024年9月23日Arxiv cs.CV发文量约102余篇，减论Agent

3分钟极减阅读Arxiv（20240711）

贾老师团队重磅发布ControlNeXt（今日Arxiv 8月13日）

【减论系列专栏：从分布到生成（二）】计算机如何采样出一张服从特定分布的图像（VAE篇）？ 本集从基础的“样本映射”，无任何概率理论地推导出了VAE架构。

清华大学提出大模型Agent开放平台LEGENT（今日Arxiv 8月20日）2024年8月20日Arxiv cs.CV发文量约242余篇

清华大学提出全新Diffusion采样器DC-Solver：更高更快更强（今日Arxiv 9月6日）2024年9月6日Arxiv cs.CV发文量约81余篇

卢老师团队提出基于SAM的显著目标检测网络（今日Arxiv 8月9日）！2024年8月9日Arxiv cs.CV发文量约68余篇。

厦大提出基于物理定律驱动的单图像生成4D内容方法（今日Arxiv 9月12日）2024年9月12日Arxiv cs.CV发文量约100余篇，减论Agent推荐

【中英】10月10日，谷歌（Google）CEO桑达尔·皮查伊（Sundar Pichai）访谈：AI其与火、电等基础创新相当｜大卫·鲁宾斯坦秀｜

2024年7月31日Arxiv cs.CV发文量约70余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省30分钟浏览Arxiv的时间

【8分钟极减专栏：从分布到生成（三）】GAN可以不是对抗？什么？GAN可以理解为一个非对抗过程？鉴别器D本质上可以理解为一个广义的图像分布函数？欲知速看！

卫星图像到街景合成！上海AILab提出CrossViewDiff（今日Arxiv 8月28日）2024年8月28日Arxiv cs.CV发文量约92余篇

【8min极减专栏：从分布到生成（四）】直观理解GAN的不稳定性问题

2024年7月26日Arxiv cs.CV发文量约95篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省43分钟浏览Arxiv的时间。

小红书发布StoryMaker：保持多角色一致性！（今日Arxiv 9月20日）2024年9月20日Arxiv cs.CV发文量约93余篇，减论Agent推荐

2024年7月30日Arxiv cs.CV发文量约160余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省68分钟浏览Arxiv的时间

中山大学提出ParGo：弥合视觉Encoder和LLM的表征GAP（今日Arxiv 8月26日）2024年8月26日Arxiv cs.CV发文量约84余篇

【全集188集】深度学习必看圣经！李沐大神《动手学深度学习》最新版全套视频教程分享，比啃书高效！看完直接跑通！（深度学习/神经网络/计算机视觉）

3分钟极减阅读Arxiv（20240715）

3分钟极减阅读Arxiv（20240716）

【减论系列专栏】从分布到生成（一）：什么是图像的分布？本集我们通过与最简单的伯努利分布的类比，尝试回答如下问题：当我们在说图像分布的时候，我们在说什么？

5分钟极减阅读何恺明团队最新自回归图像生成工作～从All-Token Diffusion到Per-Token Diffusion的范式转变。

【减论系列专栏：从分布到生成（二）】计算机如何采样出一张服从特定分布的图像（VAE篇）？本集从基础的“样本映射”，无任何概率理论地推导出了VAE架构。