阿里开源FunAudioLLM：SenseVoice语言识别和CosyVoic语音克隆均已开源

发布人

阿里巴巴近期发布了一项引人注目的开源语音大模型项目FunAudioLLM，该项目包含了两个核心模型：SenseVoice和CosyVoice。

打开封面下载高清视频观看高清视频视频下载器

GPT-SoVITS-V2,0902,并行推理提高速度,字幕同步,接口使用,TTS,声音克隆,文字转语音,花佬开源,ChasonJiang贡献PR

CosyVoice整合包(Windows)0819,修复LLVM ERROR,音色融合,暴露切分逻辑参数,字幕同步生成,文字转语音,阿里开源

目前开源界最好用的音色克隆项目，帮大家体验过了，效果不错

第二代GPT-SoVITS 更大更强！只需1分钟语音，完美声音克隆！在线一键使用，支持中日英韩粤语

GPT-SoVITS-V2,参考音频使用,接口api调用,接入大模型,接入开源阅读3.0,TTS,声音克隆,文字转语音,花佬开源

CosyVoice解压即用N卡整合包来啦无需任何环境解压就能用一键复刻声音文本转语音

ESP32+SenseVoice+Qwen72B打造你的AI聊天伴侣！

Hugging Face开源全新的文本转语音模型Parler-TTS，能使用文本提示控制语音风格

GPT-SoVITS最新版8月12日版来啦手把手教你声音克隆整合包免费无任何套路无限使用

【Qwen2-VL】一键包千问2视觉语言大模型开源 2B、7B以及72B

抖音数字人无人直播，声音克隆无需训练秒生成，形象无需训练秒切换。电脑配置要求极低！全民电商无人直播时代已来临

MotionClone: AI视频动作克隆框架并可使用文本提示生成新动作

比LoRA快50倍的微调方法，LISA使用一张显卡就可以超越全参调优

AI对口型肖像视频生成框架 Hallo，不仅效果好，动作丰富质量高，还是完全开源的

Mistral发布首个基于Mamba的开源大语言模型Codestral 7B

教程：使用豆包，完成声音克隆。并结合GPT SoVITS，无限复制

又可以白嫖了 Hugging Face推出免费GPU服务ZeroGPU，可以免费使用多个40G的A100

Sora的又一个开源替代EasyAnimate，可生成768分辨率的高清视频，还可以进行微调

AI配音2.4.0！支持文本内容一键转语音！新增快捷键功能，快速配置多角色、多情感，大大提高生产力！

谷歌发布新一代大语言模型Gemma 2，重新设计了整体架构有9B和27B两种版本

3秒克隆任意声音，2024最强配音软件，GPT-SoVITS-V2版，快来看看

字节跳动推出Seed-TTS：利用扩散变换器技术，提供细腻丰富的语音表现力和强大的零样本学习能力，跨语言和情感调控能力爆表

MimicMotion：人像动态视频生成框架，一张图片就可以生成小姐姐跳舞的视频

微软宣布Microsoft 365的用户优先访问GPT4 Turbo并取消对话限制

复刻童年女神的声音，使用GPT-SoVITS

DeepMind推出全新游戏AI SIMA：自然语言指令自动执行600多种动作玩复杂3D游戏

AI声音克隆OpenVoice一键整合包，支持多国语言，能很好地克隆出音色、音调！

喂饭级！免费声音克隆神器CosyVoice本地部署教程 | 最能打的免费声音克隆AI，轻松克隆一切

使用MaxKB从零开始搭建知识库问答系统

免费商用！混元文生图大模型全面开源，不仅包括训练的全部过程和文档，附带的插件还可以使用一张图生成定制的专属的模型

LivePortrait：让照片人物表情动起来的开源图生视频模型，不使用SD，10秒钟就能生成人物表情动画

DesignEdit 无需训练的开源图像分图层处理编辑框架

给大家推荐一个声音克隆软件，win电脑一键安装，使用非常简单 #声音克隆

开源AI语音模型再次进化！

进化洲数字人工具一键包116版，交叉对话模式

可能是目前最好的个人端AI听书组合了！AI配音+TTS Server+开源阅读，支持多情感、多角色，内网穿透（域名固定），密码访问！便捷的模型管理功能。

ChatGPT已更新新版本，使用最新的GPT-4o模型，跑分重回第一

《Python 机器学习》作者发布新书《Build a Large Language Model (From Scratch)》讲解如何从头开始构建大型语言模型

语音合成启动器2.0版，歌词字幕播放，多角色配音合成

本地数字人无限批量生成软件分享

阿里开源FunAudioLLM：SenseVoice语言识别和CosyVoic语音克隆均已开源

GPT-SoVITS-V2,0902,并行推理提高速度,字幕同步,接口使用,TTS,声音克隆,文字转语音,花佬开源,ChasonJiang贡献PR

CosyVoice整合包(Windows)0819,修复LLVM ERROR,音色融合,暴露切分逻辑参数,字幕同步生成,文字转语音,阿里开源

目前开源界最好用的音色克隆项目，帮大家体验过了，效果不错

第二代GPT-SoVITS 更大更强！只需1分钟语音，完美声音克隆！在线一键使用，支持中日英韩粤语

GPT-SoVITS-V2,参考音频使用,接口api调用,接入大模型,接入开源阅读3.0,TTS,声音克隆,文字转语音,花佬开源

CosyVoice解压即用N卡整合包来啦无需任何环境解压就能用一键复刻声音文本转语音

ESP32+SenseVoice+Qwen72B打造你的AI聊天伴侣！

Hugging Face开源全新的文本转语音模型Parler-TTS，能使用文本提示控制语音风格

GPT-SoVITS最新版8月12日版来啦手把手教你声音克隆整合包免费无任何套路无限使用

【Qwen2-VL】一键包 千问2视觉语言大模型开源 2B、7B以及72B

抖音数字人无人直播，声音克隆无需训练秒生成，形象无需训练秒切换。电脑配置要求极低！全民电商无人直播时代已来临

MotionClone: AI视频动作克隆框架并可使用文本提示生成新动作

比LoRA快50倍的微调方法，LISA使用一张显卡就可以超越全参调优

AI对口型肖像视频生成框架 Hallo，不仅效果好，动作丰富质量高，还是完全开源的

Mistral发布首个基于Mamba的开源大语言模型Codestral 7B

教程：使用豆包，完成声音克隆。并结合GPT SoVITS，无限复制

又可以白嫖了 Hugging Face推出免费GPU服务ZeroGPU，可以免费使用多个40G的A100

Sora的又一个开源替代EasyAnimate，可生成768分辨率的高清视频，还可以进行微调

AI配音2.4.0！支持文本内容一键转语音！新增快捷键功能，快速配置多角色、多情感，大大提高生产力！

谷歌发布新一代大语言模型Gemma 2，重新设计了整体架构有9B和27B两种版本

3秒克隆任意声音，2024最强配音软件，GPT-SoVITS-V2版，快来看看

字节跳动推出Seed-TTS：利用扩散变换器技术，提供细腻丰富的语音表现力和强大的零样本学习能力，跨语言和情感调控能力爆表

MimicMotion：人像动态视频生成框架，一张图片就可以生成小姐姐跳舞的视频

微软宣布Microsoft 365的用户优先访问GPT4 Turbo并取消对话限制

复刻童年女神的声音，使用GPT-SoVITS

DeepMind推出全新游戏AI SIMA：自然语言指令自动执行600多种动作玩复杂3D游戏

AI声音克隆OpenVoice一键整合包，支持多国语言，能很好地克隆出音色、音调！

喂饭级！免费声音克隆神器CosyVoice本地部署教程 | 最能打的免费声音克隆AI，轻松克隆一切

使用MaxKB从零开始搭建知识库问答系统

免费商用！混元文生图大模型全面开源，不仅包括训练的全部过程和文档，附带的插件还可以使用一张图生成定制的专属的模型

LivePortrait：让照片人物表情动起来的开源图生视频模型，不使用SD，10秒钟就能生成人物表情动画

DesignEdit 无需训练的开源图像分图层处理编辑框架

给大家推荐一个声音克隆软件，win电脑一键安装，使用非常简单 #声音克隆

开源AI语音模型再次进化！

进化洲数字人工具一键包116版，交叉对话模式

可能是目前最好的个人端AI听书组合了！AI配音+TTS Server+开源阅读，支持多情感、多角色，内网穿透（域名固定），密码访问！便捷的模型管理功能。

ChatGPT已更新新版本，使用最新的GPT-4o模型，跑分重回第一

《Python 机器学习》作者发布新书《Build a Large Language Model (From Scratch)》讲解如何从头开始构建大型语言模型

语音合成启动器2.0版，歌词字幕播放，多角色配音合成

本地数字人无限批量生成软件分享

【Qwen2-VL】一键包千问2视觉语言大模型开源 2B、7B以及72B