V
主页
阿里开源FunAudioLLM:SenseVoice语言识别和CosyVoic语音克隆均已开源
发布人
阿里巴巴近期发布了一项引人注目的开源语音大模型项目FunAudioLLM,该项目包含了两个核心模型:SenseVoice和CosyVoice。
打开封面
下载高清视频
观看高清视频
视频下载器
GPT-SoVITS-V2,0902,并行推理提高速度,字幕同步,接口使用,TTS,声音克隆,文字转语音,花佬开源,ChasonJiang贡献PR
CosyVoice整合包(Windows)0819,修复LLVM ERROR,音色融合,暴露切分逻辑参数,字幕同步生成,文字转语音,阿里开源
目前开源界最好用的音色克隆项目,帮大家体验过了,效果不错
第二代GPT-SoVITS 更大更强!只需1分钟语音,完美声音克隆!在线一键使用,支持中日英韩粤语
GPT-SoVITS-V2,参考音频使用,接口api调用,接入大模型,接入开源阅读3.0,TTS,声音克隆,文字转语音,花佬开源
CosyVoice解压即用N卡整合包来啦无需任何环境解压就能用一键复刻声音文本转语音
ESP32+SenseVoice+Qwen72B打造你的AI聊天伴侣!
Hugging Face开源全新的文本转语音模型Parler-TTS,能使用文本提示控制语音风格
GPT-SoVITS最新版8月12日版来啦手把手教你声音克隆整合包免费无任何套路无限使用
【Qwen2-VL】一键包 千问2视觉语言大模型开源 2B、7B以及72B
抖音数字人无人直播,声音克隆无需训练秒生成,形象无需训练秒切换。电脑配置要求极低!全民电商无人直播时代已来临
MotionClone: AI视频动作克隆框架并可使用文本提示生成新动作
比LoRA快50倍的微调方法,LISA使用一张显卡就可以超越全参调优
AI对口型肖像视频生成框架 Hallo,不仅效果好,动作丰富质量高,还是完全开源的
Mistral发布首个基于Mamba的开源大语言模型Codestral 7B
教程:使用豆包,完成声音克隆。并结合GPT SoVITS,无限复制
又可以白嫖了 Hugging Face推出免费GPU服务ZeroGPU,可以免费使用多个40G的A100
Sora的又一个开源替代EasyAnimate,可生成768分辨率的高清视频,还可以进行微调
AI配音2.4.0!支持文本内容一键转语音!新增快捷键功能,快速配置多角色、多情感,大大提高生产力!
谷歌发布新一代大语言模型Gemma 2,重新设计了整体架构有9B和27B两种版本
3秒克隆任意声音,2024最强配音软件,GPT-SoVITS-V2版,快来看看
字节跳动推出Seed-TTS:利用扩散变换器技术,提供细腻丰富的语音表现力和强大的零样本学习能力,跨语言和情感调控能力爆表
MimicMotion:人像动态视频生成框架,一张图片就可以生成小姐姐跳舞的视频
微软宣布Microsoft 365的用户优先访问GPT4 Turbo并取消对话限制
复刻童年女神的声音,使用GPT-SoVITS
DeepMind推出全新游戏AI SIMA:自然语言指令自动执行600多种动作玩复杂3D游戏
AI声音克隆OpenVoice一键整合包,支持多国语言,能很好地克隆出音色、音调!
喂饭级!免费声音克隆神器CosyVoice本地部署教程 | 最能打的免费声音克隆AI,轻松克隆一切
使用MaxKB从零开始搭建知识库问答系统
免费商用!混元文生图大模型全面开源,不仅包括训练的全部过程和文档,附带的插件还可以使用一张图生成定制的专属的模型
LivePortrait:让照片人物表情动起来的开源图生视频模型,不使用SD,10秒钟就能生成人物表情动画
DesignEdit 无需训练的开源图像分图层处理编辑框架
给大家推荐一个声音克隆软件,win电脑一键安装,使用非常简单 #声音克隆
开源AI语音模型再次进化!
进化洲数字人工具一键包116版,交叉对话模式
可能是目前最好的个人端AI听书组合了!AI配音+TTS Server+开源阅读,支持多情感、多角色,内网穿透(域名固定),密码访问!便捷的模型管理功能。
ChatGPT已更新新版本,使用最新的GPT-4o模型,跑分重回第一
《Python 机器学习》作者发布新书《Build a Large Language Model (From Scratch)》讲解如何从头开始构建大型语言模型
语音合成启动器2.0版,歌词字幕播放,多角色配音合成
本地数字人无限批量生成软件分享