AudioSep：从音频中分离出特定声音（人声、笑声、噪音、乐器等）使用教程，及本地一键整合包下载

发布人

本地一键整合包下载：https://deepface.cc/thread-249-1-1.html
AudioSep是一种 AI 模型，可以使用自然语言查询进行声音分离。这一创新性的模型由Audio-AGI开发，使用户能够通过简单的语言描述来分离各种声音源。

比如在嘈杂的人流车流中说话的录音中，可以分别提取干净的人声说话声音和嘈杂的人流车流噪声。可以根据需求分离，保留人声或者噪声。甚至可以单独提取声音中的笑声。除此之外，还能提取伴奏声音里指定的乐器声音，比如一段钢琴和吉他合奏曲目，需要单独分离钢琴曲，就可以用这个项目来实现。
但缺点是目前不支持歌曲的人声和伴奏分离，如果有类似需求，可以尝试用 UVR5 来分离，这个工具恰好弥补了UVR5的不足，两者相辅相成，AI语音项目里的两个神器。
做AI语音训练的人都知道，一段干净的纯人声是多么的重要，一个声音模型的好坏，就取决于人声素材的纯净与否，这个工具的出现，大大解决了分离声音素材噪声的问题，相信在这个工具的加持下，训练的声音模型会有本质的提升。

打开封面下载高清视频观看高清视频视频下载器

AudioSep：从音频中分离出特定声音（人声、笑声、噪音、乐器等）使用教程，及本地一键整合包下载

腾讯开源PhotoMaker V2版，一张图，一键生成任何人、任何风格，高保真人像写真，无需训练lora模型 本地一键整合包下载

Video Background Remover - AI视频抠像、视频一键换背景软件 本地一键整合包下载

Diffree - AI一键P图、一键换衣，告别P图困扰，只需要输入一段文字就能轻松玩转P图的神器 本地一键整合包下载

Hallo2 - 复旦、百度联手推出全新AI数字人模型 可生成4K超高清+1小时超长视频 本地一键整合包下载

免费的AI一键视频翻译、配音工具，持一键视频翻译并配音 Linly-Dubbing本地一键整合包下载

AI一键分离人声，轻松提取高清伴奏，居然还有降噪功能！

In-Context-LoRA 助力淘汰不思进取的设计师？ ComfyUI_Demucs 简单复现音频人声分离

惊人创新！EchoMimic 让照片变出声视频，AI数字人视频一键生成，可用于AI数字人生成，EchoMimic 本地一键整合包下载

RoopUnleashed 4.1.1新版升级，新增子样本放大功能，人脸生成清晰度大幅度提升，本地一键整合包下载

F5-TTS V4版，接入千问大模型，支持实时语音克隆对话。上海交大最新零样本语音克隆，文本转语音 本地一键整合包下载

一句话P图神器，打打字就能轻松P图。OmniGen 8Bit量化版,8G显存可玩，全能型图像生成模型,简单提示实现图像生成与精细编辑 本地一键整合包下载

腾讯开源头像生成视频模型 V-Express，一张图片一键生成口播说话视频，音频驱动数字人项目 本地一键整合包下载

听歌识曲用这一个神器就够了！成功率直接提高200% | LALAL.AI音乐分离器

AI一键智能制作生成证件照工具 - HivisionIDPhoto 本地一键整合包下载

AI生成语音成精了，ChatTTS，迄今为止模仿人类最像的开源文本转语音工具使用教程，新增保存固定音色功能，附本地一键整合下载

鼠标涂一涂，点一点，小白也能成为P图高手。MimicBrush使用教程附本地一键整合包下载

FunClip V2版 - AI全自动视频剪辑神器，阿里达摩院出品 本地一键整合包下载

audiocraft - 免费文本转音乐、AI音乐生成、AI音乐创作工具，Facebook开源，本地一键整合包下载

F5-TTS -上海交大最新零样本语音克隆，文本生成语音模型 本地一键整合包下载

GOT-OCR-2-GUI - 一个强大的AI文本识别模型 OCR文字识别 图片文字识别 本地一键整合包下载

MaskGCT - 媲美真人的语音克隆大模型，零样本语音克隆，文本转语音大模型 本地一键整合包下载

PMRF-老照片重生神器，高质量人像超清修复、人脸逼真高清修复 老照片修复 本地一键整合包下载

ReSyncer：百度联手清华打造的高质量数字人、对口型、视频音频同步神器，期待精彩的表现

FoleyCrafter黑科技：视频自动配音，让无声视频瞬间逼真配音。FoleyCrafter本地一键整合包下载

MuseTalk - 一键创建高质量数字人（对口型）工具，附一键整合包

F5-TTS V4版，模型微调训练教程 - 接入千问大模型，支持实时语音克隆对话。上海交大最新零样本语音克隆，文本转语音 本地一键整合包下载

AI一键换脸软件 FaceFusion3.0重磅升级，新增年龄修改、人脸编辑功能，全新架构，更强的人脸检测。

HelloMeme -一个实用人脸表情迁移模型，一张照片生成表情丰富的动图/视频 本地一键整合包下载

一键免费创建批量数字人软件，及数字人牙齿和面部模糊修复方案，附软件本地一键整合包下载

“Anydoor”任意门，可实现隔空换物，一键换衣等功能（附anydoor一键包下载）

一键换脸软件RoopUnleashed4.0更新，实时直播加入遮罩功能，遮罩处理能力大幅度提升

小白轻松学换脸，FaceFusion一键换脸教程，快来创作你的第一个换脸作品吧，附FaceFusion一键包

Pyramid Flow V2版 - 8G显存玩的文本生成视频项目 快手联合北大、北邮开发的文生视频AI模型 支持384P@24fps 本地一键整合包下载

一张照片生成多风格人像写真 - 阿里开源”妙鸭相机“，最新版FaceChain FACT 本地一键整合包下载

AdvancedLivePortrait - 一张照片生成生动任意表情图片/视频，精准操控眼睛和嘴唇动作 表情包制作 本地一键整合包下载

AI一键音频转文字、音频转字幕工具，视频生成字幕、语音转文本，OpenAI开源语音识别神器Whisper本地一键整合包下载

表情包制作神器 - LivePortrait V4版：一张图生成丰富的表情动画，新增图片驱动图片，更精准地控制你的眼睛、嘴巴、人脸转动方向等

LivePortrait：一张照片生成生动动画视频，精准操控眼睛和嘴唇动作 本地一键整合包下载

这个刚刚上线的AI人声分离神器，彻底惊到我了

VR视频也能一键换脸了，Roop-Unleashed 使用VR视频换脸教程

腾讯开源PhotoMaker V2版，一张图，一键生成任何人、任何风格，高保真人像写真，无需训练lora模型本地一键整合包下载

Video Background Remover - AI视频抠像、视频一键换背景软件本地一键整合包下载

Diffree - AI一键P图、一键换衣，告别P图困扰，只需要输入一段文字就能轻松玩转P图的神器本地一键整合包下载

Hallo2 - 复旦、百度联手推出全新AI数字人模型可生成4K超高清+1小时超长视频本地一键整合包下载

F5-TTS V4版，接入千问大模型，支持实时语音克隆对话。上海交大最新零样本语音克隆，文本转语音本地一键整合包下载

一句话P图神器，打打字就能轻松P图。OmniGen 8Bit量化版,8G显存可玩，全能型图像生成模型,简单提示实现图像生成与精细编辑本地一键整合包下载

腾讯开源头像生成视频模型 V-Express，一张图片一键生成口播说话视频，音频驱动数字人项目本地一键整合包下载

FunClip V2版 - AI全自动视频剪辑神器，阿里达摩院出品本地一键整合包下载

F5-TTS -上海交大最新零样本语音克隆，文本生成语音模型本地一键整合包下载

GOT-OCR-2-GUI - 一个强大的AI文本识别模型 OCR文字识别图片文字识别本地一键整合包下载

MaskGCT - 媲美真人的语音克隆大模型，零样本语音克隆，文本转语音大模型本地一键整合包下载

PMRF-老照片重生神器，高质量人像超清修复、人脸逼真高清修复老照片修复本地一键整合包下载

F5-TTS V4版，模型微调训练教程 - 接入千问大模型，支持实时语音克隆对话。上海交大最新零样本语音克隆，文本转语音本地一键整合包下载

HelloMeme -一个实用人脸表情迁移模型，一张照片生成表情丰富的动图/视频本地一键整合包下载

Pyramid Flow V2版 - 8G显存玩的文本生成视频项目快手联合北大、北邮开发的文生视频AI模型支持384P@24fps 本地一键整合包下载

AdvancedLivePortrait - 一张照片生成生动任意表情图片/视频，精准操控眼睛和嘴唇动作表情包制作本地一键整合包下载

LivePortrait：一张照片生成生动动画视频，精准操控眼睛和嘴唇动作本地一键整合包下载