V
主页
语音识别模型微调 | 训练一个自己的模型 | 训练模型 | 大模型训练 | ASR模型训练 | 模型微调 | ASR模型微调
发布人
忙碌了一周,终于把模型训练好了,今晚评估了一下,训练前 cer = 0.86,使用8k音频训练,cer = 0.06,而使用16k音频训练,cer=0.05,挺开心的,准确率提升了80%。这一周不白忙活。 最难处理的还是数据集,这里数据集有34090条音频,其中验证集抽取了10%,剩下的90%用于训练。 训练设置的lr=0.005 batch_size=10000 max_epoch=200 采用两张RTX4090显卡训练 训练时长超过了10小时 如果你不会训练,想要训练一个特定领域的模型,也可以联系我,不过你自己需要准备好标注好的数据集 lukeewin
打开封面
下载高清视频
观看高清视频
视频下载器
Whisper | Faster Whisper | 语音识别 | 可内网部署的ASR
喂饭教程!25分钟本地部署Qwen2大模型:配置、微调、部署+效果展示,带你训练自己的行业大模型!
免费开源语音转文字Whisper快速搭建,可生成字幕,媒体人的福音
whisper-jax | 可在内网部署的语音识别开源项目
python编写的一个自动化监听指定路径下的音视频,并对其进行转写 | 用大模型对视频内容进行总结 | 自动化生成视频字幕
基于faster_whisper的实时语音识别 | 可对接大模型的实时语音识别 | 实时语音识别 | 一句话识别
记一次给研究生训练实时语音识别大模型的经历
whisper | 语音识别 | Openai Whisper | Whisepr GUI
自动生成字幕程序优化 | 视频字幕生成 | 制作视频字幕 | 自动化制作视频字幕
本地可运行的说话人拆分 | 说话人分离
基于faster_whisper的实时语音识别改进版 | whisper中出现繁体中文的解决方法 | 语音识别中繁体转简体 | OpenCC
一款比Whisper更快的模型 | 基于Java实现的实时一句话语音识别 | 实时语音识别 | 超低延迟实时语音识别
OpenAI开源Whisper,我来教你如何从零开始搭建
如何部署一个属于自己的ChatGLM-4大语言模型--环境配置+模型微调+模型部署+效果展示,手把手教会你!
70年老算法Dijkstra被证明普遍最优 斩获顶会FOCS 2024最佳论文
[ICML 2024] 揭示与利用隐藏注意力下沉:通过注意力校准在无需训练的情况下增强大型语言模型
闽南语语音识别 | 方言语音识别 | ASR | 识别闽南语
自动化转写 | 自动化语音识别 | 对直播录屏自动化生成字幕 | 大模型总结视频内容
VAD优化Whisper,faster-whisper-webui一个转录速度起飞的开源语音识别项目,转录效果很好
声纹识别
faster_whisper对接大模型进行语音对话 | 人机对话 | 语音识别 | 大模型 | faster whisper实时语音识别 | 实时语音识别
【秒懂教程】10分钟学会部署大模型GLM4,本地部署+模型微调+效果展示详细教程!草履虫都能学会~
可本地部署的实时语音识别项目
这是第一次尝试使用Python编写GUI程序 | ASR | 语音识别 | 批量语音识别
【宝藏级微调教程】使用Llama Factory实现中文llama3微调,这绝对是全B站最用心(没有之一)
噪音消除和人声增强 | 很好用的一个降噪和人声增强工具
不会带团队,只能干到死
批量生成字幕 | 批量语音识别 | 基于faster whisper的批量语音识别 | whisper | faster whisper | asr
语音识别之识别方言-闽南语 | 闽南语语音识别
一句话生成应用,现在人人可用了👩💻
离线部署Whisper | 如何在纯内网环境中安装Whisper
基于faster whisper的实时语音识别项目
我教你爬虫不是爬三上悠亚微博直播视频本地观看啊
前方高能,这27个变态AI,一定要偷偷用起来!
B站讲的最好的AI大模型实战(2024最新版)LLM+RAG系统+GPT-4o+OpenAI,全部都讲明白了!!
语音分离|声纹对比|离线可用的语音分离|多个说话人分离|单声道录音说话人分离
可用于智能呼叫中心的内网可用的区分说话人的语音识别 | 通话区分说话人语音识别 | 通话区分说话人语音转写
深度学习代码,抄他的就可以了!——深度学习/代码/pytorch/人工智能
能有多牛被300多万人浏览的我问题”对于神经网络,硕士博士不需要弄明白原理,只需要应用,是这样吗?“
AI降噪