【11.5-arXiv】浙大提出不依赖深度范围先验的多视角立体框架；2024年11月5日arXiv cs.CV发文量约200余篇，减论Agent通过算法为您推荐

发布人

【11.5-arXiv】浙大提出不依赖深度范围先验的多视角立体框架；2024年11月5日arXiv cs.CV发文量约200余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省92分钟浏览arXiv的时间。

打开封面下载高清视频观看高清视频视频下载器

【11.4-arXiv】字节跳动提出随机自回归RAR，生成效率提升恺明MAR方法20倍以上，性能更优！2024年11月4日arXiv cs.CV发文量约85余篇

北京智源重磅发布Emu3：统一生成和感知的多模态大模型（今日Arxiv 9月30日）2024年9月30日Arxiv cs.CV发文量约105余篇，减论Agent

2024年7月26日Arxiv cs.CV发文量约95篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省43分钟浏览Arxiv的时间。

【11.11-arXiv】腾讯AILab提出单图生成高质量3D角色！2024年11月11日arXiv cs.CV发文量约69余篇，减论Agent通过算法为您推荐

2024年7月30日Arxiv cs.CV发文量约160余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省68分钟浏览Arxiv的时间

【11.12-arXiv】南大提出精准布局文生图模型RAG！2024年11月12日arXiv cs.CV发文量约164余篇，减论Agent通过算法为您推荐

2024年7月29日Arxiv cs.CV发文量约60余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省26分钟浏览Arxiv的时间。

【11.14-arXiv】阿里发布EgoVid-5M，含500万高质量第一人称视频！2024年11月14日arXiv cs.CV发文量约68余篇，减论Agent

卢老师团队提出基于SAM的显著目标检测网络（今日Arxiv 8月9日）！2024年8月9日Arxiv cs.CV发文量约68余篇。

MedTrinity-25M：超大规模的多模态医学数据集今日Arxiv发布！包含超过2500万个图像-ROI-描述三元组！2024年8月7日

WaveMamba两篇同名撞车今日Arxiv（240805）！掐指一算，Mamba是时候排列组合到小波变换了[破涕为笑]

节省37分钟！2024年7月25日Arxiv cs.CV发文量约80余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考。

小红书发布StoryMaker：保持多角色一致性！（今日Arxiv 9月20日）2024年9月20日Arxiv cs.CV发文量约93余篇，减论Agent推荐

2024年7月31日Arxiv cs.CV发文量约70余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省30分钟浏览Arxiv的时间

MMFuser：南大提出多模态大语言模型视觉表征增强模块（今日Arxiv 10月16日）2024年10月16日Arxiv cs.CV发文量约126余篇

南开大学采用掩码建模策略提出一体化盲图像复原方法（今日Arxiv 10月2日）2024年10月2日Arxiv cs.CV发文量约95余篇，减论Agent

中山大学提出ParGo：弥合视觉Encoder和LLM的表征GAP（今日Arxiv 8月26日）2024年8月26日Arxiv cs.CV发文量约84余篇

西安交大提出无需训练的开放词汇遥感语义分割方法（今日Arxiv 10月3日）2024年10月3日Arxiv cs.CV发文量约105余篇，减论Agent

Mini-InternVL：上海AI Lab提出轻量级多模态大语言模型（今日Arxiv 10月22日）2024年10月22日Arxiv cs.CV发文量约200

北理北航提出SPG解决点云语义分割类别不平衡问题（今日Arxiv 8月21日）2024年8月21日Arxiv cs.CV发文量约113余篇，减论Agent推荐

清华大学提出全新Diffusion采样器DC-Solver：更高更快更强（今日Arxiv 9月6日）2024年9月6日Arxiv cs.CV发文量约81余篇

清华提出条件对比对齐爆炸提升自回归视觉生成模型性能（今日Arxiv 10月15日）2024年10月15日Arxiv cs.CV发文量约242余篇，减论Agent

Grounded-VideoLLM！加州大学提出视频细粒度时间定位模型（今日Arxiv 10月7日）2024年10月7日Arxiv cs.CV发文量约90余篇

【11.8-arXiv】浙大提出大规模图像到视频生成数据集TIP-I2V！2024年11月8日arXiv cs.CV发文量约100余篇，减论Agent为您推荐

【10.30-arXiv】华中科大提出Senna自主驾驶系统；2024年10月30日arXiv cs.CV发文量约115余篇，减论Agent通过算法为您推荐

浙大提出单目视频恢复三维人体运动新方法（今日Arxiv 9月11日）2024年9月11日Arxiv cs.CV发文量约100余篇，减论Agent通过算法为您推荐

北大提出金字塔流匹配算法用于高效视频生成（今日Arxiv 10月10日）2024年10月10日Arxiv cs.CV发文量约226余篇，减论Agent

苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART（今日Arxiv 10月8日）2024年10月8日Arxiv cs.CV发文量约186余篇

Framer：浙大提出交互式点轨迹帧插值算法（今日Arxiv 10月25日）2024年10月25日Arxiv cs.CV发文量约92余篇，减论Agent

清华大学提出拉普拉斯混合姿态估计模型LaPose（今日Arxiv 9月25日）2024年9月25日Arxiv cs.CV发文量约128余篇，减论Agent

北大提出深度伪造视频检测新方法：视频混合增广+时空适配器微调（今日Arxiv 9月2日）2024年9月2日Arxiv cs.CV发文量约71余篇，减论Agent

原理代码讲解|双向Mamba特征提取 2024 长短特征预测 Mamba模型改进【V1代码讲解046 047】

【10.31-arXiv】中科院自动化所发布大规模车道级卫星数据集OpenSatMap；2024年10月31日arXiv cs.CV发文量约112余篇

清华大学提出大模型Agent开放平台LEGENT（今日Arxiv 8月20日）2024年8月20日Arxiv cs.CV发文量约242余篇

属于科研人们的暑假来了～今日Arxiv发文量显著下降；腾讯优图推出开源多多模态大语言模型VITA！视频、图像、文本、音频通通拿下（今日Arxiv 240812）

3分钟极减阅读Arxiv（20240711）

HiPrompt：使用分层提示和噪声分解生成高分辨率图像，无需微调！（今日Arxiv 9月5日）2024年9月5日Arxiv cs.CV发文量约95余篇

【减论系列专栏：从分布到生成（二）】计算机如何采样出一张服从特定分布的图像（VAE篇）？本集从基础的“样本映射”，无任何概率理论地推导出了VAE架构。

5分钟极减阅读何恺明团队最新自回归图像生成工作～从All-Token Diffusion到Per-Token Diffusion的范式转变。

Qwen2-VL重棒发布！（今日ArxIv 9月19日）2024年9月19日Arxiv cs.CV发文量约97余篇，减论Agent通过算法为您推荐

【11.5-arXiv】浙大提出不依赖深度范围先验的多视角立体框架；2024年11月5日arXiv cs.CV发文量约200余篇，减论Agent通过算法为您推荐

【11.4-arXiv】字节跳动提出随机自回归RAR，生成效率提升恺明MAR方法20倍以上，性能更优！2024年11月4日arXiv cs.CV发文量约85余篇

北京智源重磅发布Emu3：统一生成和感知的多模态大模型（今日Arxiv 9月30日）2024年9月30日Arxiv cs.CV发文量约105余篇，减论Agent

2024年7月26日Arxiv cs.CV发文量约95篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省43分钟浏览Arxiv的时间。

【11.11-arXiv】腾讯AILab提出单图生成高质量3D角色！2024年11月11日arXiv cs.CV发文量约69余篇，减论Agent通过算法为您推荐

2024年7月30日Arxiv cs.CV发文量约160余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省68分钟浏览Arxiv的时间

【11.12-arXiv】南大提出精准布局文生图模型RAG！2024年11月12日arXiv cs.CV发文量约164余篇，减论Agent通过算法为您推荐

2024年7月29日Arxiv cs.CV发文量约60余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省26分钟浏览Arxiv的时间。

【11.14-arXiv】阿里发布EgoVid-5M，含500万高质量第一人称视频！2024年11月14日arXiv cs.CV发文量约68余篇，减论Agent

卢老师团队提出基于SAM的显著目标检测网络（今日Arxiv 8月9日）！2024年8月9日Arxiv cs.CV发文量约68余篇。

MedTrinity-25M：超大规模的多模态医学数据集今日Arxiv发布！包含超过2500万个图像-ROI-描述三元组！2024年8月7日

WaveMamba两篇同名撞车今日Arxiv（240805）！掐指一算，Mamba是时候排列组合到小波变换了[破涕为笑]

节省37分钟！2024年7月25日Arxiv cs.CV发文量约80余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考。

小红书发布StoryMaker：保持多角色一致性！（今日Arxiv 9月20日）2024年9月20日Arxiv cs.CV发文量约93余篇，减论Agent推荐

2024年7月31日Arxiv cs.CV发文量约70余篇，减论Agent通过算法为您推荐并自动化整理为卡片供您参考，预计为您节省30分钟浏览Arxiv的时间

MMFuser：南大提出多模态大语言模型视觉表征增强模块（今日Arxiv 10月16日）2024年10月16日Arxiv cs.CV发文量约126余篇

南开大学采用掩码建模策略提出一体化盲图像复原方法（今日Arxiv 10月2日）2024年10月2日Arxiv cs.CV发文量约95余篇，减论Agent

中山大学提出ParGo：弥合视觉Encoder和LLM的表征GAP（今日Arxiv 8月26日）2024年8月26日Arxiv cs.CV发文量约84余篇

西安交大提出无需训练的开放词汇遥感语义分割方法（今日Arxiv 10月3日）2024年10月3日Arxiv cs.CV发文量约105余篇，减论Agent

Mini-InternVL：上海AI Lab提出轻量级多模态大语言模型（今日Arxiv 10月22日）2024年10月22日Arxiv cs.CV发文量约200

北理北航提出SPG解决点云语义分割类别不平衡问题（今日Arxiv 8月21日）2024年8月21日Arxiv cs.CV发文量约113余篇，减论Agent推荐

清华大学提出全新Diffusion采样器DC-Solver：更高更快更强（今日Arxiv 9月6日）2024年9月6日Arxiv cs.CV发文量约81余篇

清华提出条件对比对齐爆炸提升自回归视觉生成模型性能（今日Arxiv 10月15日）2024年10月15日Arxiv cs.CV发文量约242余篇，减论Agent

Grounded-VideoLLM！加州大学提出视频细粒度时间定位模型（今日Arxiv 10月7日）2024年10月7日Arxiv cs.CV发文量约90余篇

【11.8-arXiv】浙大提出大规模图像到视频生成数据集TIP-I2V！2024年11月8日arXiv cs.CV发文量约100余篇，减论Agent为您推荐

【10.30-arXiv】华中科大提出Senna自主驾驶系统；2024年10月30日arXiv cs.CV发文量约115余篇，减论Agent通过算法为您推荐

浙大提出单目视频恢复三维人体运动新方法（今日Arxiv 9月11日）2024年9月11日Arxiv cs.CV发文量约100余篇，减论Agent通过算法为您推荐

北大提出金字塔流匹配算法用于高效视频生成（今日Arxiv 10月10日）2024年10月10日Arxiv cs.CV发文量约226余篇，减论Agent

苏黎世联邦理工学院提出文本驱动运动控制扩散模型DART（今日Arxiv 10月8日）2024年10月8日Arxiv cs.CV发文量约186余篇

Framer：浙大提出交互式点轨迹帧插值算法（今日Arxiv 10月25日）2024年10月25日Arxiv cs.CV发文量约92余篇，减论Agent

清华大学提出拉普拉斯混合姿态估计模型LaPose（今日Arxiv 9月25日）2024年9月25日Arxiv cs.CV发文量约128余篇，减论Agent

北大提出深度伪造视频检测新方法：视频混合增广+时空适配器微调（今日Arxiv 9月2日）2024年9月2日Arxiv cs.CV发文量约71余篇，减论Agent

原理代码讲解|双向Mamba特征提取 2024 长短特征预测 Mamba模型改进【V1代码讲解046 047】

【10.31-arXiv】中科院自动化所发布大规模车道级卫星数据集OpenSatMap；2024年10月31日arXiv cs.CV发文量约112余篇

清华大学提出大模型Agent开放平台LEGENT（今日Arxiv 8月20日）2024年8月20日Arxiv cs.CV发文量约242余篇

属于科研人们的暑假来了～今日Arxiv发文量显著下降；腾讯优图推出开源多多模态大语言模型VITA！视频、图像、文本、音频通通拿下（今日Arxiv 240812）

3分钟极减阅读Arxiv（20240711）

HiPrompt：使用分层提示和噪声分解生成高分辨率图像，无需微调！（今日Arxiv 9月5日）2024年9月5日Arxiv cs.CV发文量约95余篇

【减论系列专栏：从分布到生成（二）】计算机如何采样出一张服从特定分布的图像（VAE篇）？ 本集从基础的“样本映射”，无任何概率理论地推导出了VAE架构。

5分钟极减阅读何恺明团队最新自回归图像生成工作～从All-Token Diffusion到Per-Token Diffusion的范式转变。

Qwen2-VL重棒发布！（今日ArxIv 9月19日）2024年9月19日Arxiv cs.CV发文量约97余篇，减论Agent通过算法为您推荐

【减论系列专栏：从分布到生成（二）】计算机如何采样出一张服从特定分布的图像（VAE篇）？本集从基础的“样本映射”，无任何概率理论地推导出了VAE架构。