V
主页
京东 11.11 红包
阿里 CosyVoice:更新 TTS 更逼真自然
发布人
https://x.com/TONGYI_SpeechAI/status/1818905151249563890 阿里巴巴 SpeechAI 团队发文宣布新的 [CosyVoice 更新](https://x.com/TONGYI_SpeechAI/status/1818905151249563890),这是 [FunAudioLLM](https://sanhua.himrr.com/news/f98c7809-de00-46ec-8d82-58ffceb56e99) 中的自然情感语音生成模块,该更新可以生成与特定特征匹配的语音,比如性别、年龄和个性等。还可以模仿人类的各种声音,包括笑声、咳嗽和呼吸等,还可以为语音添加情感和风格。
打开封面
下载高清视频
观看高清视频
视频下载器
更懂中国风的大模型来了!阿里通义万相AI生视频震撼上线
F5-TTS语音模型,零样本声音克隆,情绪复刻,文字转语音,TTS,E2-tts,SWivid开源,支持N卡和纯CPU
PIKA AI 发布 4 种全新视频特效
语音合成天花板!字节多语言 TTS 模型
Tex4D:3D 模型引导视频生成的未来
fish-speech v1.2 我愿称它是最强开源中文 TTS 和音色克隆
Unique3D:图生 3D 模型
PIKA AI 1.5:逼真物理特效视频生成官方宣传片
CharacterGen:又一个单图生 3D 模型
T2V-Turbo-v2:重登 VBench 榜首的开源视频生成模型
Vozo AI 视频编辑器
fish-speech v1.2:最强可用开源中文 TTS 演示
FAI Fuzer:电商利器,一键生成背景
F5-TTS -上海交大最新零样本语音克隆,文本生成语音模型 本地一键整合包下载
MindSearch:开源的 AI 搜索引擎框架
StreamingSVD: 开源丝滑长视频生成
开源项目本地部署,文本转语音、语音克隆(F5-TTS),效果感觉不错。
Suno AI: Covers 翻唱任何声音
【CosyVoice】一键包 阿里开源音频克隆 25HZ新模型 3s极速复刻
快手可灵 AI Animate Anyone 玩法
新 ChatGPT 语音声音泄露
2024/7/23 三花AI新鲜事儿-- 超越 GPT-4o,LLaMA3.1 405B提前泄露!(放简介)
第一个支持一亿上下文的模型 LTM-2-Mini
3秒声音极速克隆CosyVoice整合包下载,流畅自然的文字转语音模型
美图秀秀:AI 视频制作工具 Moki
Text-to-CAD:文生 CAD 模型
面壁 MiniCPM-V 2.6:最强开源端侧多模态 LLM
电商利器 FAI Fuzer 一键生成背景【找地址去 三花AI】
智谱清影 CogVideoX-5B: 开源视频生成模型
FacePoke:拖拽式人脸表情编辑,X 上火爆
MOTIA:开源视频版扩图技术
Perplexity Page:将搜索转为网页展示
马斯克 Flux 只是过渡,即将推出自研文生图;通用 FLUX ControlNet 模型;Runway 向所有人开放【地址在三花AI自取】
Cinemo: 开源图片生视频
每日一分钟AI快讯【附地址】
这么看 DeepSeek 真的良心!写缓存都不要钱!【地址在三花AI自取】
Mistra 推出世界顶级边缘计算小模型
手办模型;Midjourney危!FLUX.1 全新开源模型;谷歌 Gemini 超越 GPT-4o; 360 AI 助手【地址放简介】
Whisper Timestamped:在浏览器中运行的语音转录
快手 LivePortrait数字人头技术,生成速度 12.8 毫秒