【11.8-arXiv】浙大提出大规模图像到视频生成数据集TIP-I2V！2024年11月8日arXiv cs.CV发文量约100余篇，减论Agent为您推荐

发布人

【11.8-arXiv】浙大提出大规模图像到视频生成数据集TIP-I2V！2024年11月8日arXiv cs.CV发文量约100余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省44分钟浏览arXiv的时间。

打开封面下载高清视频观看高清视频视频下载器

【11.11-arXiv】腾讯AILab提出单图生成高质量3D角色！2024年11月11日arXiv cs.CV发文量约69余篇，减论Agent通过算法为您推荐

【11.4-arXiv】字节跳动提出随机自回归RAR，生成效率提升恺明MAR方法20倍以上，性能更优！2024年11月4日arXiv cs.CV发文量约85余篇

【11.14-arXiv】阿里发布EgoVid-5M，含500万高质量第一人称视频！2024年11月14日arXiv cs.CV发文量约68余篇，减论Agent

【11.12-arXiv】南大提出精准布局文生图模型RAG！2024年11月12日arXiv cs.CV发文量约164余篇，减论Agent通过算法为您推荐

【10.31-arXiv】中科院自动化所发布大规模车道级卫星数据集OpenSatMap；2024年10月31日arXiv cs.CV发文量约112余篇

2024年7月26日Arxiv cs.CV发文量约95篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省43分钟浏览Arxiv的时间。

【减论系列专栏：从分布到生成（二）】计算机如何采样出一张服从特定分布的图像（VAE篇）？本集从基础的“样本映射”，无任何概率理论地推导出了VAE架构。

卢老师团队提出基于SAM的显著目标检测网络（今日Arxiv 8月9日）！2024年8月9日Arxiv cs.CV发文量约68余篇。

【11.13-arXiv】西北工大提出3D聚焦多实例点云配准网络！2024年11月13日arXiv cs.CV发文量约87余篇，减论Agent通过算法为您推荐

【11.1-arXiv】北大提出低秩专家混合方法提升以人为中心的图像生成能力；2024年11月1日arXiv cs.CV发文量约110余篇，减论Agent

Mini-InternVL：上海AI Lab提出轻量级多模态大语言模型（今日Arxiv 10月22日）2024年10月22日Arxiv cs.CV发文量约200

【11.15-arXiv】FAIR团队提出纯注意力迁移蒸馏方法！2024年11月15日arXiv cs.CV发文量约85余篇，减论Agent通过算法为您推荐

2024年7月30日Arxiv cs.CV发文量约160余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省68分钟浏览Arxiv的时间

英伟达重磅发布NVLM多模态大型语言模型，即将开源！（今日Arxiv 9月18日）2024年9月18日Arxiv cs.CV发文量约95余篇，减论Agent

小红书发布StoryMaker：保持多角色一致性！（今日Arxiv 9月20日）2024年9月20日Arxiv cs.CV发文量约93余篇，减论Agent推荐

SRFormerV2！侯老师团队提出置换注意力解锁高性能超分辨能力（今日Arxiv 8月15日）2024年8月15日Arxiv cs.CV发文量约75余篇

复旦提出时序对比解码减少VideoLLM事件幻觉（今日Arxiv 9月26日）2024年9月26日Arxiv cs.CV发文量约120余篇，减论Agent

【11.18-arXiv】东南大学提出NumPro改进视频时段内容理解！2024年11月18日arXiv cs.CV发文量约99余篇，减论Agent为您推荐

澳大利亚国立、南开团队推动结肠镜检查多模态研究（今日Arxiv 10月23日）2024年10月23日Arxiv cs.CV发文量约86余篇，减论Agent

北京智源重磅发布Emu3：统一生成和感知的多模态大模型（今日Arxiv 9月30日）2024年9月30日Arxiv cs.CV发文量约105余篇，减论Agent

浙大提出基于能量的视觉语言导航策略（今日Arxiv 10月21日）2024年10月21日Arxiv cs.CV发文量约80余篇，减论Agent通过算法为您推荐

南开大学采用掩码建模策略提出一体化盲图像复原方法（今日Arxiv 10月2日）2024年10月2日Arxiv cs.CV发文量约95余篇，减论Agent

SENet一作率队提出袋鼠多模态大模型，支持长视频输入（今日Arxiv 8月29日）2024年8月29日Arxiv cs.CV发文量约103余篇，减论Agent

北理北航提出SPG解决点云语义分割类别不平衡问题（今日Arxiv 8月21日）2024年8月21日Arxiv cs.CV发文量约113余篇，减论Agent推荐

2024年7月29日Arxiv cs.CV发文量约60余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省26分钟浏览Arxiv的时间。

清华大学提出VERIFIED自动视频文本标注流（今日Arxiv 10月14日）2024年10月14日Arxiv cs.CV发文量约93余篇，减论Agent

MC-Bench：浙大提出多语境视觉基础任务数据集（今日Arxiv 10月17日）2024年10月17日Arxiv cs.CV发文量约96余篇，减论Agent

北大王选计算所提出无需训练的视频时序定位方法（今日Arxiv 8月30日）2024年8月30日Arxiv cs.CV发文量约96余篇，减论Agent

中山大学提出ParGo：弥合视觉Encoder和LLM的表征GAP（今日Arxiv 8月26日）2024年8月26日Arxiv cs.CV发文量约84余篇

大型语言模型能理解符号图形程序吗？（今日Arxiv 8月16日）2024年8月16日Arxiv cs.CV发文量约73余篇

Qwen2-VL重棒发布！（今日ArxIv 9月19日）2024年9月19日Arxiv cs.CV发文量约97余篇，减论Agent通过算法为您推荐

【8分钟极减专栏：从分布到生成（三）】GAN可以不是对抗？什么？GAN可以理解为一个非对抗过程？鉴别器D本质上可以理解为一个广义的图像分布函数？欲知速看！

南洋理工提出Disco4D：单张图像解耦精细化服装人体（今日Arxiv 9月27日）2024年9月27日Arxiv cs.CV发文量约133余篇，减论Agent

MMFuser：南大提出多模态大语言模型视觉表征增强模块（今日Arxiv 10月16日）2024年10月16日Arxiv cs.CV发文量约126余篇

【11.7-arXiv】北邮清华提出评估MLLM流视频理解能力基准StreamingBench！2024年11月7日arXiv cs.CV发文量约75余篇

节省37分钟！2024年7月25日Arxiv cs.CV发文量约80余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考。

减论祝各位园丁教师节快乐！您辛苦了～（还要抽空来看今日Arxiv 9月10日哟）2024年9月10日Arxiv cs.CV发文量约224余篇，减论Agent

苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART（今日Arxiv 10月8日）2024年10月8日Arxiv cs.CV发文量约186余篇

3分钟极减阅读Arxiv（20240724）

清华大学提出大模型Agent开放平台LEGENT（今日Arxiv 8月20日）2024年8月20日Arxiv cs.CV发文量约242余篇

【11.8-arXiv】浙大提出大规模图像到视频生成数据集TIP-I2V！2024年11月8日arXiv cs.CV发文量约100余篇，减论Agent为您推荐

【11.11-arXiv】腾讯AILab提出单图生成高质量3D角色！2024年11月11日arXiv cs.CV发文量约69余篇，减论Agent通过算法为您推荐

【11.4-arXiv】字节跳动提出随机自回归RAR，生成效率提升恺明MAR方法20倍以上，性能更优！2024年11月4日arXiv cs.CV发文量约85余篇

【11.14-arXiv】阿里发布EgoVid-5M，含500万高质量第一人称视频！2024年11月14日arXiv cs.CV发文量约68余篇，减论Agent

【11.12-arXiv】南大提出精准布局文生图模型RAG！2024年11月12日arXiv cs.CV发文量约164余篇，减论Agent通过算法为您推荐

【10.31-arXiv】中科院自动化所发布大规模车道级卫星数据集OpenSatMap；2024年10月31日arXiv cs.CV发文量约112余篇

2024年7月26日Arxiv cs.CV发文量约95篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省43分钟浏览Arxiv的时间。

【减论系列专栏：从分布到生成（二）】计算机如何采样出一张服从特定分布的图像（VAE篇）？ 本集从基础的“样本映射”，无任何概率理论地推导出了VAE架构。

卢老师团队提出基于SAM的显著目标检测网络（今日Arxiv 8月9日）！2024年8月9日Arxiv cs.CV发文量约68余篇。

【11.13-arXiv】西北工大提出3D聚焦多实例点云配准网络！2024年11月13日arXiv cs.CV发文量约87余篇，减论Agent通过算法为您推荐

【11.1-arXiv】北大提出低秩专家混合方法提升以人为中心的图像生成能力；2024年11月1日arXiv cs.CV发文量约110余篇，减论Agent

Mini-InternVL：上海AI Lab提出轻量级多模态大语言模型（今日Arxiv 10月22日）2024年10月22日Arxiv cs.CV发文量约200

【11.15-arXiv】FAIR团队提出纯注意力迁移蒸馏方法！2024年11月15日arXiv cs.CV发文量约85余篇，减论Agent通过算法为您推荐

2024年7月30日Arxiv cs.CV发文量约160余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省68分钟浏览Arxiv的时间

英伟达重磅发布NVLM多模态大型语言模型，即将开源！（今日Arxiv 9月18日）2024年9月18日Arxiv cs.CV发文量约95余篇，减论Agent

小红书发布StoryMaker：保持多角色一致性！（今日Arxiv 9月20日）2024年9月20日Arxiv cs.CV发文量约93余篇，减论Agent推荐

SRFormerV2！侯老师团队提出置换注意力解锁高性能超分辨能力（今日Arxiv 8月15日）2024年8月15日Arxiv cs.CV发文量约75余篇

复旦提出时序对比解码减少VideoLLM事件幻觉（今日Arxiv 9月26日）2024年9月26日Arxiv cs.CV发文量约120余篇，减论Agent

【11.18-arXiv】东南大学提出NumPro改进视频时段内容理解！2024年11月18日arXiv cs.CV发文量约99余篇，减论Agent为您推荐

澳大利亚国立、南开团队推动结肠镜检查多模态研究（今日Arxiv 10月23日）2024年10月23日Arxiv cs.CV发文量约86余篇，减论Agent

北京智源重磅发布Emu3：统一生成和感知的多模态大模型（今日Arxiv 9月30日）2024年9月30日Arxiv cs.CV发文量约105余篇，减论Agent

浙大提出基于能量的视觉语言导航策略（今日Arxiv 10月21日）2024年10月21日Arxiv cs.CV发文量约80余篇，减论Agent通过算法为您推荐

南开大学采用掩码建模策略提出一体化盲图像复原方法（今日Arxiv 10月2日）2024年10月2日Arxiv cs.CV发文量约95余篇，减论Agent

SENet一作率队提出袋鼠多模态大模型，支持长视频输入（今日Arxiv 8月29日）2024年8月29日Arxiv cs.CV发文量约103余篇，减论Agent

北理北航提出SPG解决点云语义分割类别不平衡问题（今日Arxiv 8月21日）2024年8月21日Arxiv cs.CV发文量约113余篇，减论Agent推荐

2024年7月29日Arxiv cs.CV发文量约60余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省26分钟浏览Arxiv的时间。

清华大学提出VERIFIED自动视频文本标注流（今日Arxiv 10月14日）2024年10月14日Arxiv cs.CV发文量约93余篇，减论Agent

MC-Bench：浙大提出多语境视觉基础任务数据集（今日Arxiv 10月17日）2024年10月17日Arxiv cs.CV发文量约96余篇，减论Agent

北大王选计算所提出无需训练的视频时序定位方法（今日Arxiv 8月30日）2024年8月30日Arxiv cs.CV发文量约96余篇，减论Agent

中山大学提出ParGo：弥合视觉Encoder和LLM的表征GAP（今日Arxiv 8月26日）2024年8月26日Arxiv cs.CV发文量约84余篇

大型语言模型能理解符号图形程序吗？（今日Arxiv 8月16日）2024年8月16日Arxiv cs.CV发文量约73余篇

Qwen2-VL重棒发布！（今日ArxIv 9月19日）2024年9月19日Arxiv cs.CV发文量约97余篇，减论Agent通过算法为您推荐

【8分钟极减专栏：从分布到生成（三）】GAN可以不是对抗？什么？GAN可以理解为一个非对抗过程？鉴别器D本质上可以理解为一个广义的图像分布函数？欲知速看！

南洋理工提出Disco4D：单张图像解耦精细化服装人体（今日Arxiv 9月27日）2024年9月27日Arxiv cs.CV发文量约133余篇，减论Agent

MMFuser：南大提出多模态大语言模型视觉表征增强模块（今日Arxiv 10月16日）2024年10月16日Arxiv cs.CV发文量约126余篇

【11.7-arXiv】北邮清华提出评估MLLM流视频理解能力基准StreamingBench！2024年11月7日arXiv cs.CV发文量约75余篇

节省37分钟！2024年7月25日Arxiv cs.CV发文量约80余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考。

减论祝各位园丁教师节快乐！您辛苦了～（还要抽空来看今日Arxiv 9月10日哟）2024年9月10日Arxiv cs.CV发文量约224余篇，减论Agent

苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART（今日Arxiv 10月8日）2024年10月8日Arxiv cs.CV发文量约186余篇

3分钟极减阅读Arxiv（20240724）

清华大学提出大模型Agent开放平台LEGENT（今日Arxiv 8月20日）2024年8月20日Arxiv cs.CV发文量约242余篇

【减论系列专栏：从分布到生成（二）】计算机如何采样出一张服从特定分布的图像（VAE篇）？本集从基础的“样本映射”，无任何概率理论地推导出了VAE架构。