语音识别模型微调 | 训练一个自己的模型 | 训练模型 | 大模型训练 | ASR模型训练 | 模型微调 | ASR模型微调 - 视频下载 Video Downloader

语音识别模型微调 | 训练一个自己的模型 | 训练模型 | 大模型训练 | ASR模型训练 | 模型微调 | ASR模型微调

发布人

忙碌了一周，终于把模型训练好了，今晚评估了一下，训练前 cer = 0.86，使用8k音频训练，cer = 0.06，而使用16k音频训练,cer=0.05，挺开心的，准确率提升了80%。这一周不白忙活。
最难处理的还是数据集，这里数据集有34090条音频，其中验证集抽取了10%，剩下的90%用于训练。
训练设置的lr=0.005
batch_size=10000
max_epoch=200
采用两张RTX4090显卡训练
训练时长超过了10小时

如果你不会训练，想要训练一个特定领域的模型，也可以联系我，不过你自己需要准备好标注好的数据集
lukeewin

打开封面下载高清视频观看高清视频视频下载器

Whisper | Faster Whisper | 语音识别 | 可内网部署的ASR

喂饭教程！25分钟本地部署Qwen2大模型：配置、微调、部署+效果展示，带你训练自己的行业大模型！

免费开源语音转文字Whisper快速搭建，可生成字幕，媒体人的福音

whisper-jax | 可在内网部署的语音识别开源项目

python编写的一个自动化监听指定路径下的音视频，并对其进行转写 | 用大模型对视频内容进行总结 | 自动化生成视频字幕

基于faster_whisper的实时语音识别 | 可对接大模型的实时语音识别 | 实时语音识别 | 一句话识别

记一次给研究生训练实时语音识别大模型的经历

whisper | 语音识别 | Openai Whisper | Whisepr GUI

自动生成字幕程序优化 | 视频字幕生成 | 制作视频字幕 | 自动化制作视频字幕

本地可运行的说话人拆分 | 说话人分离

基于faster_whisper的实时语音识别改进版 | whisper中出现繁体中文的解决方法 | 语音识别中繁体转简体 | OpenCC

一款比Whisper更快的模型 | 基于Java实现的实时一句话语音识别 | 实时语音识别 | 超低延迟实时语音识别

OpenAI开源Whisper，我来教你如何从零开始搭建

如何部署一个属于自己的ChatGLM-4大语言模型--环境配置+模型微调+模型部署+效果展示,手把手教会你！

70年老算法Dijkstra被证明普遍最优斩获顶会FOCS 2024最佳论文

[ICML 2024] 揭示与利用隐藏注意力下沉：通过注意力校准在无需训练的情况下增强大型语言模型

闽南语语音识别 | 方言语音识别 | ASR | 识别闽南语

自动化转写 | 自动化语音识别 | 对直播录屏自动化生成字幕 | 大模型总结视频内容

VAD优化Whisper，faster-whisper-webui一个转录速度起飞的开源语音识别项目，转录效果很好

声纹识别

faster_whisper对接大模型进行语音对话 | 人机对话 | 语音识别 | 大模型 | faster whisper实时语音识别 | 实时语音识别

【秒懂教程】10分钟学会部署大模型GLM4，本地部署+模型微调+效果展示详细教程！草履虫都能学会~

可本地部署的实时语音识别项目

这是第一次尝试使用Python编写GUI程序 | ASR | 语音识别 | 批量语音识别

【宝藏级微调教程】使用Llama Factory实现中文llama3微调，这绝对是全B站最用心（没有之一）

噪音消除和人声增强 | 很好用的一个降噪和人声增强工具

不会带团队，只能干到死

批量生成字幕 | 批量语音识别 | 基于faster whisper的批量语音识别 | whisper | faster whisper | asr

语音识别之识别方言-闽南语 | 闽南语语音识别

一句话生成应用，现在人人可用了👩‍💻

离线部署Whisper | 如何在纯内网环境中安装Whisper

基于faster whisper的实时语音识别项目

我教你爬虫不是爬三上悠亚微博直播视频本地观看啊

前方高能，这27个变态AI，一定要偷偷用起来！

B站讲的最好的AI大模型实战（2024最新版）LLM+RAG系统+GPT-4o+OpenAI，全部都讲明白了！！

语音分离|声纹对比|离线可用的语音分离|多个说话人分离|单声道录音说话人分离

可用于智能呼叫中心的内网可用的区分说话人的语音识别 | 通话区分说话人语音识别 | 通话区分说话人语音转写

深度学习代码，抄他的就可以了！——深度学习/代码/pytorch/人工智能

能有多牛被300多万人浏览的我问题”对于神经网络，硕士博士不需要弄明白原理，只需要应用，是这样吗？“

AI降噪