V
主页
【小红书 InstantX】InstantStyle 论文讲解,效果炸裂
发布人
InstantStyle论文解读。
打开封面
下载高清视频
观看高清视频
视频下载器
什么?扩散模型diffusion model可以在unity实时控制角色运动了?
ComfyUI 一键风格转移 InstantStyle IPadapter V2 工作流下载安装设置教程
伤害性不大,侮辱性极强
[好文分享] Mini-Gemini: Mining the Potential of MVLM
【腾讯ARC Lab+南开程明明】PhotoMaker 论文讲解
Neural Network Diffusion论文解读,新国大新作,DIffusion都能生成神经网络参数了?
奇葩问题把李沐大神整不会了
多模态图像生成最新工作 Muse: Text-To-Image Generation via Masked Generative Transformers
【布尔艺术&PaperABC】 ICLR23 谷歌,Image editing工作。Prompt-to-Prompt。
【北大-腾讯最新工作】T2I-Adapter 更加可控的文本生成图像
【北大,字节】自回归图像生成模型 Visual Autoregressive Model(VAR), 通过Next-Scale预测方式实现图像生成
【TUM,Meta】ViewDiff:借助预训练文生图模型,生成3D一致的场景图像
哥们中了一篇CVPR2024,做了一个完整版视频记录
统计学习理论,一款适合零成本搞深度学习的大冤种的方向,懂你导师更懂你
【南京大学 等】STAG4D:时空锚定的4D资产生成
【清华大学】Make-your-3D:高效一致的主题驱动3D内容生成
【北大微软 可控图像生成最新工作】Unified Multi-Modal Latent Diffusion for Joint Subject and Text
小红书95后团队推出InstantStyle项目,刷新风格迁移的新方法,只要一张参考图,就可以把任何视频、图片按此风格重新渲染
生成模型的新SOTA?Visual Autoregressive Modeling. 及VQ-VAE, VQ-GAN, VQ-DDPM介绍
【字节 伯克利】MagicMe,人物视频定制化最新工作,效果优秀!
【NTU, 上海Lab等】ComboVerse:从图像生成组合式3D资产
【腾讯】IP-Adapter论文解读,拿捏图生图,人脸更不在话下。
CVPR22 Oral, GLIP: Grounded Language-Image Pre-training
【阿里,港中深等】VideoMV: 微调预训练视频生成模型,生成3D一致多视角图片
【InstantID论文解析】小红书+北大爆火的项目InstantID,连LeCun都点赞!
作者亲自讲解:LoRA 是什么?
一个视频看懂score-based模型的底层原理
[论文简析]Visual Autoregressive Modeling: ...via Next-Scale Prediction[2404.02905]
CV大神谢赛宁大作 Sora的底层架构模型 DiT论文解读
【3D AIGC论文串讲】单视图3D重建-从单视图中预测3D模型
17-C 标准库设计与实现 (_start; offsetof; printf; environ; malloc/free) [南京大学2024操作系统]
推荐系统公开课——8小时完整版,讲解工业界真实的推荐系统
为什么还是有很多傻der源源不断地涌入计算机视觉?
硕士生去搞计算机视觉,是纯纯的脑瘫行为!
科研生活分享01 简约桌面