V
主页
AI一键音频转文字、音频转字幕工具,视频生成字幕、语音转文本,OpenAI开源语音识别神器Whisper本地一键整合包下载
发布人
免费下载地址:https://deepface.cc/thread-377-1-1.html Whisper是美国人工智能研究公司OpenAI发布的一个自动语音识别(ASR)系统。目前市面上最强大的语音识别系统,尤其是英语等外国语言识别能力非常强大,只是多国语言翻译转写字幕功能。 今天发布的就是基于OpenAI的Whisper的WebUI一键整合包,可以用于语音转文字、语音转字幕等用途,支持音频、视频一键识别并生成字幕,还支持一键导出字幕功能。
打开封面
下载高清视频
观看高清视频
视频下载器
Hallo2 - 复旦、百度联手推出全新AI数字人模型 可生成4K超高清+1小时超长视频 本地一键整合包下载
免费的AI一键视频翻译、配音工具,持一键视频翻译并配音 Linly-Dubbing本地一键整合包下载
免费开源批量音视频转文字,支持批量转srt字幕文件,无任何限制
Video Background Remover - AI视频抠像、视频一键换背景软件 本地一键整合包下载
惊人创新!EchoMimic 让照片变出声视频,AI数字人视频一键生成,可用于AI数字人生成,EchoMimic 本地一键整合包下载
低调大厂小红书最新开源AI语音克隆合成系统-FireRedTTS 免训练一键音频克隆 本地一键整合包下载
FireRedTTS V2版 - 小红书最新开源AI语音克隆合成系统 免训练一键语音克隆 本地一键整合包下载
腾讯开源PhotoMaker V2版,一张图,一键生成任何人、任何风格,高保真人像写真,无需训练lora模型 本地一键整合包下载
GOT-OCR-2-GUI - 一个强大的AI文本识别模型 OCR文字识别 图片文字识别 本地一键整合包下载
Diffree - AI一键P图、一键换衣,告别P图困扰,只需要输入一段文字就能轻松玩转P图的神器 本地一键整合包下载
ReSyncer:百度联手清华打造的高质量数字人、对口型、视频音频同步神器,期待精彩的表现
“Anydoor”任意门,可实现隔空换物,一键换衣等功能(附anydoor一键包下载)
批量混剪带货视频画中画自动配音语音识别一键生成免费软件工具
AI一键智能制作生成证件照工具 - HivisionIDPhoto 本地一键整合包下载
ControlNet作者新作-Omost,让天下再也没有难写的提示词,小白也可以轻松学习AI绘画,一句话即可AI绘画,自动生成关键词,本地一键整合包
LivePortrait V2版:一键包表情包制作,表情迁移,新增动物模式,支持动物表情迁移。一张照片生成生动视频,精准操控眼睛和嘴唇动作 本地一键整合包下载
一句话P图神器,打打字就能轻松P图。OmniGen 8Bit量化版,8G显存可玩,全能型图像生成模型,简单提示实现图像生成与精细编辑 本地一键整合包下载
腾讯开源头像生成视频模型 V-Express,一张图片一键生成口播说话视频,音频驱动数字人项目 本地一键整合包下载
AudioSep:从音频中分离出特定声音(人声、笑声、噪音、乐器等)使用教程,及本地一键整合包下载
【MindNLP】Whisper实时字幕
AI一键换脸软件 FaceFusion3.0重磅升级,新增年龄修改、人脸编辑功能,全新架构,更强的人脸检测。
【开源】48集 语音识别语音唤醒程序讲解 #ESP32 #嵌入式开发 #编程
京东开源数字人项目JoyHallo,应该是目前普通话效果最好的一个开源数字人项目 本地一键整合包下载
表情包制作神器 - LivePortrait V4版:一张图生成丰富的表情动画,新增图片驱动图片,更精准地控制你的眼睛、嘴巴、人脸转动方向等
HelloMeme -一个实用人脸表情迁移模型,一张照片生成表情丰富的动图/视频 本地一键整合包下载
MuseTalk - 一键创建高质量数字人(对口型)工具,附一键整合包
#1024程序员节 【开源】esp32的ai语音唤醒和语音识别 #开源 #ESP32
Stable Audio Tools - AI文本生成音频工具,人人可以成为音乐创作者,自媒体必备神器。生成音频可商用,无视版权
easy wav2lip - 小白也能一键创建AI数字虚拟人,自媒体必备神器
F5-TTS V3版 - API版,新增api接口功能,上海交大最新零样本语音克隆,文本转语音 本地一键整合包下载
AI生成语音成精了,ChatTTS,迄今为止模仿人类最像的开源文本转语音工具使用教程,新增保存固定音色功能,附本地一键整合下载
一句话出图!实时语音AI儿童绘本实验(离线)
FunClip V2版 - AI全自动视频剪辑神器,阿里达摩院出品 本地一键整合包下载
AdvancedLivePortrait - 一张照片生成生动任意表情图片/视频,精准操控眼睛和嘴唇动作 表情包制作 本地一键整合包下载
一张照片生成多风格人像写真 - 阿里开源”妙鸭相机“,最新版FaceChain FACT 本地一键整合包下载
EasyAnimate - 阿里开源视频生成项目,国产版Sora,高质量长视频生成 本地一键整合包下载
EchoMimic新版升级,新增加速模型,推理生成速度提升10倍! 让照片变出声视频,AI数字人视频一键生成
AI周杰伦?听过周杰伦唱高音吗?Seed-VC,零样本声音转换方案,支持免训练语音和唱歌转换工具 本地一键整合包下载
零基础生成AI直播虚拟人,AI数字人,音频驱动数字人、虚拟人
audiocraft - 免费文本转音乐、AI音乐生成、AI音乐创作工具,Facebook开源,本地一键整合包下载