V
主页
AudioSep:从音频中分离出特定声音(人声、笑声、噪音、乐器等)使用教程,及本地一键整合包下载
发布人
本地一键整合包下载:https://deepface.cc/thread-249-1-1.html AudioSep是一种 AI 模型,可以使用自然语言查询进行声音分离。这一创新性的模型由Audio-AGI开发,使用户能够通过简单的语言描述来分离各种声音源。 比如在嘈杂的人流车流中说话的录音中,可以分别提取干净的人声说话声音和嘈杂的人流车流噪声。可以根据需求分离,保留人声或者噪声。甚至可以单独提取声音中的笑声。除此之外,还能提取伴奏声音里指定的乐器声音,比如一段钢琴和吉他合奏曲目,需要单独分离钢琴曲,就可以用这个项目来实现。 但缺点是目前不支持歌曲的人声和伴奏分离,如果有类似需求,可以尝试用 UVR5 来分离,这个工具恰好弥补了UVR5的不足,两者相辅相成,AI语音项目里的两个神器。 做AI语音训练的人都知道,一段干净的纯人声是多么的重要,一个声音模型的好坏,就取决于人声素材的纯净与否,这个工具的出现,大大解决了分离声音素材噪声的问题,相信在这个工具的加持下,训练的声音模型会有本质的提升。
打开封面
下载高清视频
观看高清视频
视频下载器
腾讯开源PhotoMaker V2版,一张图,一键生成任何人、任何风格,高保真人像写真,无需训练lora模型 本地一键整合包下载
Video Background Remover - AI视频抠像、视频一键换背景软件 本地一键整合包下载
Diffree - AI一键P图、一键换衣,告别P图困扰,只需要输入一段文字就能轻松玩转P图的神器 本地一键整合包下载
Hallo2 - 复旦、百度联手推出全新AI数字人模型 可生成4K超高清+1小时超长视频 本地一键整合包下载
免费的AI一键视频翻译、配音工具,持一键视频翻译并配音 Linly-Dubbing本地一键整合包下载
AI一键分离人声,轻松提取高清伴奏,居然还有降噪功能!
In-Context-LoRA 助力淘汰不思进取的设计师? ComfyUI_Demucs 简单复现音频人声分离
惊人创新!EchoMimic 让照片变出声视频,AI数字人视频一键生成,可用于AI数字人生成,EchoMimic 本地一键整合包下载
RoopUnleashed 4.1.1新版升级,新增子样本放大功能,人脸生成清晰度大幅度提升,本地一键整合包下载
F5-TTS V4版,接入千问大模型,支持实时语音克隆对话。上海交大最新零样本语音克隆,文本转语音 本地一键整合包下载
一句话P图神器,打打字就能轻松P图。OmniGen 8Bit量化版,8G显存可玩,全能型图像生成模型,简单提示实现图像生成与精细编辑 本地一键整合包下载
腾讯开源头像生成视频模型 V-Express,一张图片一键生成口播说话视频,音频驱动数字人项目 本地一键整合包下载
听歌识曲用这一个神器就够了!成功率直接提高200% | LALAL.AI音乐分离器
AI一键智能制作生成证件照工具 - HivisionIDPhoto 本地一键整合包下载
AI生成语音成精了,ChatTTS,迄今为止模仿人类最像的开源文本转语音工具使用教程,新增保存固定音色功能,附本地一键整合下载
鼠标涂一涂,点一点,小白也能成为P图高手。MimicBrush使用教程附本地一键整合包下载
FunClip V2版 - AI全自动视频剪辑神器,阿里达摩院出品 本地一键整合包下载
audiocraft - 免费文本转音乐、AI音乐生成、AI音乐创作工具,Facebook开源,本地一键整合包下载
F5-TTS -上海交大最新零样本语音克隆,文本生成语音模型 本地一键整合包下载
GOT-OCR-2-GUI - 一个强大的AI文本识别模型 OCR文字识别 图片文字识别 本地一键整合包下载
MaskGCT - 媲美真人的语音克隆大模型,零样本语音克隆,文本转语音大模型 本地一键整合包下载
PMRF-老照片重生神器,高质量人像超清修复、人脸逼真高清修复 老照片修复 本地一键整合包下载
ReSyncer:百度联手清华打造的高质量数字人、对口型、视频音频同步神器,期待精彩的表现
FoleyCrafter黑科技:视频自动配音,让无声视频瞬间逼真配音。FoleyCrafter本地一键整合包下载
MuseTalk - 一键创建高质量数字人(对口型)工具,附一键整合包
F5-TTS V4版,模型微调训练教程 - 接入千问大模型,支持实时语音克隆对话。上海交大最新零样本语音克隆,文本转语音 本地一键整合包下载
AI一键换脸软件 FaceFusion3.0重磅升级,新增年龄修改、人脸编辑功能,全新架构,更强的人脸检测。
HelloMeme -一个实用人脸表情迁移模型,一张照片生成表情丰富的动图/视频 本地一键整合包下载
一键免费创建批量数字人软件,及数字人牙齿和面部模糊修复方案,附软件本地一键整合包下载
“Anydoor”任意门,可实现隔空换物,一键换衣等功能(附anydoor一键包下载)
一键换脸软件RoopUnleashed4.0更新,实时直播加入遮罩功能,遮罩处理能力大幅度提升
小白轻松学换脸,FaceFusion一键换脸教程,快来创作你的第一个换脸作品吧,附FaceFusion一键包
Pyramid Flow V2版 - 8G显存玩的文本生成视频项目 快手联合北大、北邮开发的文生视频AI模型 支持384P@24fps 本地一键整合包下载
一张照片生成多风格人像写真 - 阿里开源”妙鸭相机“,最新版FaceChain FACT 本地一键整合包下载
AdvancedLivePortrait - 一张照片生成生动任意表情图片/视频,精准操控眼睛和嘴唇动作 表情包制作 本地一键整合包下载
AI一键音频转文字、音频转字幕工具,视频生成字幕、语音转文本,OpenAI开源语音识别神器Whisper本地一键整合包下载
表情包制作神器 - LivePortrait V4版:一张图生成丰富的表情动画,新增图片驱动图片,更精准地控制你的眼睛、嘴巴、人脸转动方向等
LivePortrait:一张照片生成生动动画视频,精准操控眼睛和嘴唇动作 本地一键整合包下载
这个刚刚上线的AI人声分离神器,彻底惊到我了
VR视频也能一键换脸了,Roop-Unleashed 使用VR视频换脸教程