V
主页
DiffusionGPT 字节最新开源文本到图像生成系统,输入绘图想法即可!
发布人
字节开源的DiffusionGPT,利用大型语言模型(LLM)高效接受各种类型的提示输入并集成领域专家模型进行输出。 代码:https://github.com/DiffusionGPT/DiffusionGPT?tab=readme-ov-file 首页:https://diffusiongpt.github.io/ 体验:https://huggingface.co/spaces/DiffusionGPT/DiffusionGPT 需要LLM的key 包括四个步骤:提示解析、构建和搜索模型的思想树、人工反馈的模型选择和生图的执行。
打开封面
下载高清视频
观看高清视频
视频下载器
vividTalk 最新虚拟人合成项目,效果超sadtalker
YOLOv8+双目立体匹配,实时观测微小动物三维运动轨迹!
百度UniVG AI视频生成模型,论文评估效果很好,期待开源一测究竟!
UDiffText,扩散模型文本控制精准生成
StoryDiffusion 字节发布角色一致性图像和长视频生成的方法
AI太疯狂,一键生成CAD模型,设计师和工程师都笑了
MagicVideo-V2 字节视频生成,多阶段高美感视频生成,为开源,持续关注
CoTracker,Meta最新开源目标追踪模型,处理遮挡等场景
M2UGen多模态音乐理解和生成开源!音乐问答,通过文本、图像、视频和音频生成音乐、音乐编辑
PhotoMaker:腾讯开源逼真的肖像生成,超高保真度,支持风格迁移,肖像生成等!
Meta AI 推出Movie Gen 视频技术,具有超强的视频生成和编辑能力
现在的针孔摄像头,到底能小到什么程度,究竟有多清晰?
AnyText 阿里最新多语言图片文本生成和编辑,开箱体验!
强推!不愧是李飞飞,一口把深度学习、计算机视觉、神经网络、图像处理、图像分割、目标检测、物体识别给讲透了,新手小白秒上手!-人工智能/计算机视觉
即将开源的AI 3D模型生成
HandRefiner修复扩散模型生成过程中手异常问题,已开源!
10月5日 【最新pikpak网盘会员】敏感资源秒播不和谐,不限速会员账号无限白嫖持续稳定分享中~-
强推!GAN生成对抗网络原理解读+论文讲解+代码复现被同济大佬由浅入深讲明白了!—人工智能_深度学习
Drawing Spin Up 一个让简笔画动起来的开源项目,相比较meta发布的项目立体感更强。
好多个你数字人分身
PIXART 华为用于4K文本到图像生成的扩散Transformer的弱到强训练
StreamingT2V 最长2分钟视频生成,开源了!
10月补档【亲测可用~ 】李跳跳最新版到底有多猛?10月最新18000+条规则,只有用过的才知道它的强大!使用体验简直天差地别!
IC-Light Controlnet作者最新开源,文本条件和参考图重新光照模型,开箱体验!
Flow Matching——流匹配
InstantFamily 多人物控制生成,零样本多角色ID图像生成的掩码注意力框架
国内最新开源视频生成,开箱体验!
字节 Seed-Music:统一音乐生成框架
不管忘记了多久的密码,学会这招即可轻松找回
仿生机器人女友它水灵灵的来了
AnyDoor 阿里图片区域替换技术,开源了!实现虚拟换衣,页面元素替换!
基于MMyolo框架的YOLOv5+Deepsort的鸡蛋检测系统 | 多区域可选定多目标跟踪应用 代码开源
五分钟开发一个AI炒股智能体!
绅士&老司机福利,超强磁力下载及搜索,老司机福利神器,内置超多功能,搞定种子磁力下载!
力作!切入点太好啦,何恺明谢赛宁解剖扩散模型,新作刚刚出!!
CTRL-Adapter一项用于视频生成领域的controlnet框架开源!
字节最新3d技术ImageDream
一句话就能轻松制作大片儿!这个AI生成视频大模型太牛了!
结合Transformer的YOLOv8多模态 融合可见光+红外光(RGB+IR)双输入 完美复现论文【附代码】
RPG-DiffusionMaster 使用多模态LLM进行区域控制精准生成,应对更复杂提示词,已开源!