AI一键音频转文字、音频转字幕工具，视频生成字幕、语音转文本，OpenAI开源语音识别神器Whisper本地一键整合包下载 - 视频下载 Video Downloader

AI一键音频转文字、音频转字幕工具，视频生成字幕、语音转文本，OpenAI开源语音识别神器Whisper本地一键整合包下载

发布人

免费下载地址：https://deepface.cc/thread-377-1-1.html
Whisper是美国人工智能研究公司OpenAI发布的一个自动语音识别（ASR）系统。目前市面上最强大的语音识别系统，尤其是英语等外国语言识别能力非常强大，只是多国语言翻译转写字幕功能。

今天发布的就是基于OpenAI的Whisper的WebUI一键整合包，可以用于语音转文字、语音转字幕等用途，支持音频、视频一键识别并生成字幕，还支持一键导出字幕功能。

打开封面下载高清视频观看高清视频视频下载器

Hallo2 - 复旦、百度联手推出全新AI数字人模型可生成4K超高清+1小时超长视频本地一键整合包下载

免费的AI一键视频翻译、配音工具，持一键视频翻译并配音 Linly-Dubbing本地一键整合包下载

免费开源批量音视频转文字，支持批量转srt字幕文件，无任何限制

Video Background Remover - AI视频抠像、视频一键换背景软件本地一键整合包下载

惊人创新！EchoMimic 让照片变出声视频，AI数字人视频一键生成，可用于AI数字人生成，EchoMimic 本地一键整合包下载

低调大厂小红书最新开源AI语音克隆合成系统-FireRedTTS 免训练一键音频克隆本地一键整合包下载

FireRedTTS V2版 - 小红书最新开源AI语音克隆合成系统免训练一键语音克隆本地一键整合包下载

腾讯开源PhotoMaker V2版，一张图，一键生成任何人、任何风格，高保真人像写真，无需训练lora模型本地一键整合包下载

GOT-OCR-2-GUI - 一个强大的AI文本识别模型 OCR文字识别图片文字识别本地一键整合包下载

Diffree - AI一键P图、一键换衣，告别P图困扰，只需要输入一段文字就能轻松玩转P图的神器本地一键整合包下载

ReSyncer：百度联手清华打造的高质量数字人、对口型、视频音频同步神器，期待精彩的表现

“Anydoor”任意门，可实现隔空换物，一键换衣等功能（附anydoor一键包下载）

批量混剪带货视频画中画自动配音语音识别一键生成免费软件工具

AI一键智能制作生成证件照工具 - HivisionIDPhoto 本地一键整合包下载

ControlNet作者新作-Omost，让天下再也没有难写的提示词，小白也可以轻松学习AI绘画，一句话即可AI绘画，自动生成关键词，本地一键整合包

LivePortrait V2版：一键包表情包制作，表情迁移，新增动物模式，支持动物表情迁移。一张照片生成生动视频，精准操控眼睛和嘴唇动作本地一键整合包下载

一句话P图神器，打打字就能轻松P图。OmniGen 8Bit量化版,8G显存可玩，全能型图像生成模型,简单提示实现图像生成与精细编辑本地一键整合包下载

腾讯开源头像生成视频模型 V-Express，一张图片一键生成口播说话视频，音频驱动数字人项目本地一键整合包下载

AudioSep：从音频中分离出特定声音（人声、笑声、噪音、乐器等）使用教程，及本地一键整合包下载

【MindNLP】Whisper实时字幕

AI一键换脸软件 FaceFusion3.0重磅升级，新增年龄修改、人脸编辑功能，全新架构，更强的人脸检测。

【开源】48集语音识别语音唤醒程序讲解 #ESP32 #嵌入式开发 #编程

京东开源数字人项目JoyHallo，应该是目前普通话效果最好的一个开源数字人项目本地一键整合包下载

表情包制作神器 - LivePortrait V4版：一张图生成丰富的表情动画，新增图片驱动图片，更精准地控制你的眼睛、嘴巴、人脸转动方向等

HelloMeme -一个实用人脸表情迁移模型，一张照片生成表情丰富的动图/视频本地一键整合包下载

MuseTalk - 一键创建高质量数字人（对口型）工具，附一键整合包

#1024程序员节【开源】esp32的ai语音唤醒和语音识别 #开源 #ESP32

Stable Audio Tools - AI文本生成音频工具，人人可以成为音乐创作者，自媒体必备神器。生成音频可商用，无视版权

easy wav2lip - 小白也能一键创建AI数字虚拟人，自媒体必备神器

F5-TTS V3版 - API版，新增api接口功能，上海交大最新零样本语音克隆，文本转语音本地一键整合包下载

AI生成语音成精了，ChatTTS，迄今为止模仿人类最像的开源文本转语音工具使用教程，新增保存固定音色功能，附本地一键整合下载

一句话出图！实时语音AI儿童绘本实验（离线）

FunClip V2版 - AI全自动视频剪辑神器，阿里达摩院出品本地一键整合包下载

AdvancedLivePortrait - 一张照片生成生动任意表情图片/视频，精准操控眼睛和嘴唇动作表情包制作本地一键整合包下载

一张照片生成多风格人像写真 - 阿里开源”妙鸭相机“，最新版FaceChain FACT 本地一键整合包下载

EasyAnimate - 阿里开源视频生成项目，国产版Sora，高质量长视频生成本地一键整合包下载

EchoMimic新版升级，新增加速模型，推理生成速度提升10倍！让照片变出声视频，AI数字人视频一键生成

AI周杰伦？听过周杰伦唱高音吗？Seed-VC，零样本声音转换方案，支持免训练语音和唱歌转换工具本地一键整合包下载

零基础生成AI直播虚拟人，AI数字人，音频驱动数字人、虚拟人

audiocraft - 免费文本转音乐、AI音乐生成、AI音乐创作工具，Facebook开源，本地一键整合包下载