V
主页
字节 Hyper-Flux 2 秒出一张图
发布人
🎬 智谱 CogVideoX-5B 正式发布 🖼 字节 Hyper-Flux:2 秒一张图 ✨ 谷歌 Gemini:推出 3 种实验模型 ✨ 马斯克 Grok 发布更新
打开封面
下载高清视频
观看高清视频
视频下载器
微软 Designer:终于面向所有人开放
StreamingSVD: 开源丝滑长视频生成
迪士尼双足机器人: 公布设计和控制方法
ComfyUI:Omost 的开源实现
字节 LLaVA-NeXT: 使 LLM 同时理解多个图片
腾讯 Follow-Your-Canvas:扩图技术视频版
世界首富也有青涩、紧张、小人物的过往
使用 ComfyUI + Elevenlabs 生成 AI 水视频演示
Tripo 2.0:可能是最强 3D 模型生成服务?
1995 年,埃隆·马斯克无力支付维修费用,因此他用垃圾场里的零件修理了汽车的几乎所有部件。这是他更换破损的侧窗玻璃。当时谁能知道这个小男孩将来会改变世界呢?
字节 LSLM:边听边说语音模型
快手 LivePortrait数字人头技术,生成速度 12.8 毫秒
阿里 CosyVoice:更新 TTS 更逼真自然
LLaMA-Omni:语音交互新模型
字节 Depth Anything V2:深度检测模型更新
阿里通义千问 Qwen2.5 基础模型大派对
ControlNeXt:更高效的类 ControlNet 可控技术
fish-speech v1.2 我愿称它是最强开源中文 TTS 和音色克隆
AI马斯克深夜直播万人在线打赏....
Luma Dream Machine 混剪
腾讯 MOFA-Video: 可控制图转视频
腾讯 PhotoMaker v2:更好的可控性和角色一致性
我愿再称小札为赛博佛祖!可以预知,很快就会有相关的 ControlNet 预处理器出现了!
ControNet作者了不起!创新AI生图最新模型
外国友人有福了,可灵开启国际版 | 阿里的一个虚拟试穿项目,可以将任何东西或衣服穿到模特身上【简介附地址】
ComfyUI 高级实时数字人脸表情编辑
面壁 MiniCPM-V 2.6:最强开源端侧多模态 LLM
最强配图生成工具 Napkin AI 现已支持中文
LumaAI DreamMachine v1.5 即将发布
腾讯 MimicMotion: 现在可以使用了!
Omages:又一个 3D 生成模型
I2VEdit: 使用图像编辑整个视频
北大 Open-Sora Plan:发布 v1.2.0 版本
字节 Seed-Music:统一音乐生成框架
Runway:Gen-3 Alpha 文生视频现已开放
GIMM-VFI:视频插帧技术
Figma: 重新设计的 AI 功能
外行人体验了一把AI 3D建模 被Tripo惊艳到了
使用 Flux schnell 探索 CLIP 文本
2024年7月12日 一觉醒来 AI 发生了什么