字节 Hyper-Flux 2 秒出一张图

发布人

🎬 智谱 CogVideoX-5B 正式发布
🖼 字节 Hyper-Flux：2 秒一张图
✨ 谷歌 Gemini：推出 3 种实验模型
✨ 马斯克 Grok 发布更新

打开封面下载高清视频观看高清视频视频下载器

微软 Designer：终于面向所有人开放

StreamingSVD: 开源丝滑长视频生成

迪士尼双足机器人: 公布设计和控制方法

ComfyUI：Omost 的开源实现

字节 LLaVA-NeXT: 使 LLM 同时理解多个图片

腾讯 Follow-Your-Canvas：扩图技术视频版

世界首富也有青涩、紧张、小人物的过往

使用 ComfyUI + Elevenlabs 生成 AI 水视频演示

Tripo 2.0：可能是最强 3D 模型生成服务？

1995 年，埃隆·马斯克无力支付维修费用，因此他用垃圾场里的零件修理了汽车的几乎所有部件。这是他更换破损的侧窗玻璃。当时谁能知道这个小男孩将来会改变世界呢？

字节 LSLM：边听边说语音模型

快手 LivePortrait数字人头技术，生成速度 12.8 毫秒

阿里 CosyVoice：更新 TTS 更逼真自然

LLaMA-Omni：语音交互新模型

字节 Depth Anything V2：深度检测模型更新

阿里通义千问 Qwen2.5 基础模型大派对

ControlNeXt：更高效的类 ControlNet 可控技术

fish-speech v1.2 我愿称它是最强开源中文 TTS 和音色克隆

AI马斯克深夜直播万人在线打赏....

Luma Dream Machine 混剪

腾讯 MOFA-Video: 可控制图转视频

腾讯 PhotoMaker v2：更好的可控性和角色一致性

我愿再称小札为赛博佛祖！可以预知，很快就会有相关的 ControlNet 预处理器出现了！

ControNet作者了不起！创新AI生图最新模型

外国友人有福了，可灵开启国际版 | 阿里的一个虚拟试穿项目，可以将任何东西或衣服穿到模特身上【简介附地址】

ComfyUI 高级实时数字人脸表情编辑

面壁 MiniCPM-V 2.6：最强开源端侧多模态 LLM

最强配图生成工具 Napkin AI 现已支持中文

LumaAI DreamMachine v1.5 即将发布

腾讯 MimicMotion: 现在可以使用了！

Omages：又一个 3D 生成模型

I2VEdit: 使用图像编辑整个视频

北大 Open-Sora Plan：发布 v1.2.0 版本

字节 Seed-Music：统一音乐生成框架

Runway：Gen-3 Alpha 文生视频现已开放

GIMM-VFI：视频插帧技术

Figma: 重新设计的 AI 功能

外行人体验了一把AI 3D建模被Tripo惊艳到了

使用 Flux schnell 探索 CLIP 文本

2024年7月12日一觉醒来 AI 发生了什么

字节 Hyper-Flux 2 秒出一张图

微软 Designer：终于面向所有人开放

StreamingSVD: 开源丝滑长视频生成

迪士尼双足机器人: 公布设计和控制方法

ComfyUI：Omost 的开源实现

字节 LLaVA-NeXT: 使 LLM 同时理解多个图片

腾讯 Follow-Your-Canvas：扩图技术视频版

世界首富也有青涩、紧张、小人物的过往

使用 ComfyUI + Elevenlabs 生成 AI 水视频演示

Tripo 2.0：可能是最强 3D 模型生成服务？

1995 年，埃隆·马斯克无力支付维修费用，因此他用垃圾场里的零件修理了汽车的几乎所有部件。这是他更换破损的侧窗玻璃。当时谁能知道这个小男孩将来会改变世界呢？

字节 LSLM：边听边说语音模型

快手 LivePortrait数字人头技术，生成速度 12.8 毫秒

阿里 CosyVoice：更新 TTS 更逼真自然

LLaMA-Omni：语音交互新模型

字节 Depth Anything V2：深度检测模型更新

阿里通义千问 Qwen2.5 基础模型大派对

ControlNeXt：更高效的类 ControlNet 可控技术

fish-speech v1.2 我愿称它是最强开源中文 TTS 和音色克隆

AI马斯克深夜直播万人在线打赏....

Luma Dream Machine 混剪

腾讯 MOFA-Video: 可控制图转视频

腾讯 PhotoMaker v2：更好的可控性和角色一致性

我愿再称小札为赛博佛祖！可以预知，很快就会有相关的 ControlNet 预处理器出现了！

ControNet作者了不起！创新AI生图最新模型

外国友人有福了，可灵开启国际版 | 阿里的一个虚拟试穿项目，可以将任何东西或衣服穿到模特身上【简介附地址】

ComfyUI 高级实时数字人脸表情编辑

面壁 MiniCPM-V 2.6：最强开源端侧多模态 LLM

最强配图生成工具 Napkin AI 现已支持中文

LumaAI DreamMachine v1.5 即将发布

腾讯 MimicMotion: 现在可以使用了！

Omages：又一个 3D 生成模型

I2VEdit: 使用图像编辑整个视频

北大 Open-Sora Plan：发布 v1.2.0 版本

字节 Seed-Music：统一音乐生成框架

Runway：Gen-3 Alpha 文生视频现已开放

GIMM-VFI：视频插帧技术

Figma: 重新设计的 AI 功能

外行人体验了一把AI 3D建模 被Tripo惊艳到了

使用 Flux schnell 探索 CLIP 文本

2024年7月12日 一觉醒来 AI 发生了什么

外行人体验了一把AI 3D建模被Tripo惊艳到了

2024年7月12日一觉醒来 AI 发生了什么