InstantFamily 多人物控制生成，零样本多角色ID图像生成的掩码注意力框架 - 视频下载 Video Downloader

InstantFamily 多人物控制生成，零样本多角色ID图像生成的掩码注意力框架

发布人

InstantFamily 多人物控制生成，零样本多角色ID图像生成的掩码注意力框架
由SK电讯企业发布的InstantFamily项目，实现零样本多人物ID图像生成，利用预训练的人脸识别模型的全局和局部特征同时与文本条件相结合。
论文：https://arxiv.org/pdf/2404.19427

打开封面下载高清视频观看高清视频视频下载器

3分钟带你快速了解注意力（Attention）机制！图文详解，一目了然！

UDiffText，扩散模型文本控制精准生成

Luma Dream Machine 官方推荐的演示

viggle.ai 通过文字描述驱动静态图高质量视频生成，且具有较高的完成度

AnimateDiffV3开源！支持草图，多帧画面控制

基于MMLAB的计算机视觉入门到实战教程（图像分类、图像分割、图像检测、图像生成）

StreamMultiDiffusion 根据指定色块和语义即可创建超宽画幅艺术品，已开源！

究极全面！YOLO目标检测竟被讲的如此简单！（完整版）YOLOv1-v10，从基础入门到项目实战，草履虫都能听懂！

百度UniVG AI视频生成模型，论文评估效果很好，期待开源一测究竟！

MagicVideo-V2 字节视频生成，多阶段高美感视频生成，为开源，持续关注

DreamTalk 基于扩散模型的虚拟人项目，会唱歌的虚拟人

AI视频生成 neverends

PIA AI生成视频，头像3D动画，特效生成，免费体验！

Luma 官方介绍DreamMachine视频生成模型，说了一下它的特点和擅长的内容

腾讯 MOFA-Video: 可控制图转视频

【Github热门】Pytorch源码模板：十万行代码整理，让你轻松掌握骨干网、注意力、Loss等关键技术！入门即精通不是梦！

ZeST：零样本材质迁移，使用单张图进行图片材质迁移，已开源！

替代Sora的视频生成Ai来了，可以跟快手「可灵」打PK了

pixelsdance超震撼微电影

Luma AI新增关键帧生成视频功能免费开放使用

AniClipart 剪贴画动画生成模型，基于文本到视频先验引导的运动序列框架

目前B站讲的最透彻的3D点云全套教程，包含点云配准、点云分割、点云补全及PointNet算法等核心知识！强烈建议收藏！

KREA.AI视频生成功能正式上线添加图片关键帧即可完成变换视频完全免费效果流畅 KREA多图生视频使用教程

阿里联合高校推出的flashface肖像迁移模型，面部细节，即将开源！

医学图像分割实战：基于UNet++模型实现医学细胞图像分割，原理详解+代码精讲，看完就能跑通！（深度学习/计算机视觉）

重磅炸弹！Stable Diffusion 3 终于开源了！实测屌打 Midjourney，一句话生成任何你想要的图片，附本地安装教程！ | 零度解说

绝了，A+B竟然可以这么卷！多尺度特征融合+注意力机制，新SOTA准确率高达99%！

AI医学图像分割必会实战：基于深度学习的肝脏肿瘤分割实战，原理详解+项目实战，究极通俗易懂！

强推！我居然只花了1小时就学会了【优化算法】遗传算法、蚁群算法、模拟退火算法、粒子群优化算法一次吃透！真的太简单易懂了！（人工智能、神经网络、机器学习）

【毕设有救了】这也太全了！猫狗识别，气温预测，车道线检测，花卉图像识别，新闻文本分类，OCR文档扫描等六大深度学习毕设项目一口气学完！【附带数据集】

Luma Dream Machine 混剪

CRM 清华和人民大学3D生成开源！使用卷积重建模型将单图像转换为 3D 纹理网格

AtomoVideo 阿里高保真图像到视频（I2V）生成框架

研究生论文自救，深度学习发paper必备的65个即插即用缝合模块！附下载【注意力机制模块/卷积模块/特征融合/mamba模块】

V-Express 单图片虚拟人视频生成，南大和腾讯ailab已开源！

Follow-your-click 港科大等高效联合提出，通过简短提示点击进行开放域区域图像动画生成

Morph Studio：免费AI视频生成工具实战

不愧是GitHub大佬！半天就教会了我YOLO、SSD、FasterRCNN、FastRCNN、SPPNet、RCNN等六大目标检测算法！深度学习/体检测

AnyText 阿里最新多语言图片文本生成和编辑，开箱体验！

StabilityAI 继SD3发布后又一新功能视频编辑，画面元素修改或移除，并生成视频