DiffusionGPT 字节最新开源文本到图像生成系统，输入绘图想法即可！ - 视频下载 Video Downloader

DiffusionGPT 字节最新开源文本到图像生成系统，输入绘图想法即可！

发布人

字节开源的DiffusionGPT，利用大型语言模型（LLM）高效接受各种类型的提示输入并集成领域专家模型进行输出。
代码：https://github.com/DiffusionGPT/DiffusionGPT?tab=readme-ov-file
首页：https://diffusiongpt.github.io/
体验：https://huggingface.co/spaces/DiffusionGPT/DiffusionGPT
需要LLM的key
包括四个步骤：提示解析、构建和搜索模型的思想树、人工反馈的模型选择和生图的执行。

打开封面下载高清视频观看高清视频视频下载器

vividTalk 最新虚拟人合成项目，效果超sadtalker

YOLOv8+双目立体匹配，实时观测微小动物三维运动轨迹！

百度UniVG AI视频生成模型，论文评估效果很好，期待开源一测究竟！

UDiffText，扩散模型文本控制精准生成

StoryDiffusion 字节发布角色一致性图像和长视频生成的方法

AI太疯狂，一键生成CAD模型，设计师和工程师都笑了

MagicVideo-V2 字节视频生成，多阶段高美感视频生成，为开源，持续关注

CoTracker，Meta最新开源目标追踪模型，处理遮挡等场景

M2UGen多模态音乐理解和生成开源！音乐问答，通过文本、图像、视频和音频生成音乐、音乐编辑

PhotoMaker：腾讯开源逼真的肖像生成，超高保真度，支持风格迁移，肖像生成等！

Meta AI 推出Movie Gen 视频技术，具有超强的视频生成和编辑能力

现在的针孔摄像头，到底能小到什么程度，究竟有多清晰？

AnyText 阿里最新多语言图片文本生成和编辑，开箱体验！

强推！不愧是李飞飞，一口把深度学习、计算机视觉、神经网络、图像处理、图像分割、目标检测、物体识别给讲透了，新手小白秒上手！-人工智能/计算机视觉

即将开源的AI 3D模型生成

HandRefiner修复扩散模型生成过程中手异常问题，已开源！

10月5日【最新pikpak网盘会员】敏感资源秒播不和谐，不限速会员账号无限白嫖持续稳定分享中~-

强推！GAN生成对抗网络原理解读+论文讲解+代码复现被同济大佬由浅入深讲明白了！—人工智能_深度学习

Drawing Spin Up 一个让简笔画动起来的开源项目，相比较meta发布的项目立体感更强。

好多个你数字人分身

PIXART 华为用于4K文本到图像生成的扩散Transformer的弱到强训练

StreamingT2V 最长2分钟视频生成，开源了！

10月补档【亲测可用~ 】李跳跳最新版到底有多猛？10月最新18000+条规则，只有用过的才知道它的强大！使用体验简直天差地别！

IC-Light Controlnet作者最新开源，文本条件和参考图重新光照模型，开箱体验！

Flow Matching——流匹配

InstantFamily 多人物控制生成，零样本多角色ID图像生成的掩码注意力框架

国内最新开源视频生成，开箱体验！

字节 Seed-Music：统一音乐生成框架

不管忘记了多久的密码，学会这招即可轻松找回

仿生机器人女友它水灵灵的来了

AnyDoor 阿里图片区域替换技术，开源了！实现虚拟换衣，页面元素替换！

基于MMyolo框架的YOLOv5+Deepsort的鸡蛋检测系统 | 多区域可选定多目标跟踪应用代码开源

五分钟开发一个AI炒股智能体！

绅士＆老司机福利，超强磁力下载及搜索，老司机福利神器，内置超多功能，搞定种子磁力下载！

力作！切入点太好啦，何恺明谢赛宁解剖扩散模型，新作刚刚出！！

CTRL-Adapter一项用于视频生成领域的controlnet框架开源！

字节最新3d技术ImageDream

一句话就能轻松制作大片儿！这个AI生成视频大模型太牛了！

结合Transformer的YOLOv8多模态融合可见光+红外光(RGB+IR)双输入完美复现论文【附代码】

RPG-DiffusionMaster 使用多模态LLM进行区域控制精准生成，应对更复杂提示词，已开源！