V
主页
阿里 CosyVoice:更新 TTS 更逼真自然
发布人
https://x.com/TONGYI_SpeechAI/status/1818905151249563890 阿里巴巴 SpeechAI 团队发文宣布新的 [CosyVoice 更新](https://x.com/TONGYI_SpeechAI/status/1818905151249563890),这是 [FunAudioLLM](https://sanhua.himrr.com/news/f98c7809-de00-46ec-8d82-58ffceb56e99) 中的自然情感语音生成模块,该更新可以生成与特定特征匹配的语音,比如性别、年龄和个性等。还可以模仿人类的各种声音,包括笑声、咳嗽和呼吸等,还可以为语音添加情感和风格。
打开封面
下载高清视频
观看高清视频
视频下载器
PIKA AI 1.5:逼真物理特效视频生成
又突破语音合成天花板了?阿里开源最强多语言 TTS 模型
【AI虚拟伙伴】对接本地CosyVoice语音合成教程 cosyvoice_simple_api开源
CosyVoice全新升级11月版舒适自然的声音克隆没有任何大佐和卡顿中文最强的声音克隆整合包来啦
OpenAI 更新 ChatGPT Mac 客户端,支持连接开发工具
阿里 MIMO:AI 视频人物替换与动画生成
GLM-4-Voice一键包,端到端AI语音大模型,TTS,文本转语音,指令式语音定制,大模型语音对话,至少需要20G显存,智谱AI开源
Meta AI 推出 CoTracker3:实现丝滑的像素级目标追踪
清华 MotionCLR:AI 动作编辑模型
Haiper v1.5:新版视频模型更新
GIMM-VFI:视频插帧技术
【GLM-4-Voice】一键包 智谱开源实时语音对话项目 可控制 情感、语调、语速、方言等
LLaMA-Omni:语音交互新模型
PIKA AI 1.5:逼真物理特效视频生成官方宣传片
谷歌 Gemini IOS APP 上线:聊天、识图、画图一应俱全
Cartesia 推出 Voice Changer:变声器模型
MagicDance逼真舞蹈视频
TTS开源新王:MaskGCT!音色克隆语音生成能力神中神!借助AI配音,GPT-SoVITS、CosyVoice和F5-TTS四王同台PK。
腾讯 MimicMotion: 现在可以使用了!
深度声音克隆!本地配置F5-TTS最新版,支持E2-TTS!ngrok内网穿透让Colab也能运行!支持英文声音克隆!含本地部署+云端部署+API接口
Suno 发布 V4 版本:提升音频质量与创意歌词
Ai音频4-T8又来整活了!王炸!最牛逼语音TTS项目MaskGCT!难装到哭了,终于做好了整合包,大家是不是应该一键那啥?!-T8 Comfyui教程
SpeechGPT2 类 GPT-4o 语音对话模型
新 ChatGPT 语音声音泄露
Runway 推出 Gen-3 Alpha Turbo 高级运镜功能
Meta 推出 Spirit LM:首个自由混合文本和语音的多模态模型
FAI Fuzer:电商利器,一键生成背景
Cinemo: 开源图片生视频
2024/7/23 三花AI新鲜事儿-- 超越 GPT-4o,LLaMA3.1 405B提前泄露!(放简介)
微软edge_tts访问不了,403错误码,Azure_tts可以平替,单账号单地区每月免费5个小时的音频时长,继续白嫖微软
Anthropic Claude:新功能更新
简易AI语音对口型同步生成器- Talking Avatar AI
ChronoDepth:视频深度信息
Mochi:仅需 20G 显存的低成本运行方案
浦语·灵笔 2.5:对标 GPT-4o 的多模态模型
阿里 Mobile-Agent-v2:基于大模型的安卓鸿蒙自动化工具
Canvas 推出 Dream Lab:AI 赋能排版创作新体验
F5-TTS教程,关于推理音频底噪和吞字问题,优化推理稳定性,超长文本推理,resemble_enhance音频增强降噪,文字转语音,TTS,上海交大开源
Suno AI: Covers 翻唱任何声音
Tex4D:3D 模型引导视频生成的未来