V
主页
一款比Whisper更快的模型 | 基于Java实现的实时一句话语音识别 | 实时语音识别 | 超低延迟实时语音识别
发布人
基于Java实现的实时一句话语音识别 | 实时语音识别 底层基于 paraformer 模型推理 目前增加标点符号,测试一句话转写时间低于1秒,转写速度极快 适用对速度要求极高的场景,例如:实时通话质检,人机交互 视频中的字幕是通过 whisper + ffmpeg 实现
打开封面
下载高清视频
观看高清视频
视频下载器
自动识别并生成字幕,实时翻译软件
语音识别与翻译,自动生成视频字幕,让你无障碍学习!自媒体人必备神器!
【GLM-4-Voice】一键包 智谱开源实时语音对话项目 可控制 情感、语调、语速、方言等
实时语音识别,流式SenseVoice来啦!
whisper-large-v3-turbo极速生成字幕,一键翻译字幕,双语字幕翻译,支持NSFW,OpenAI出品,音频转写srt,听懂老湿们在说啥
开源免费的FunASR实时语音识别模型,手把手教你部署和使用
ESP32-S3与GPT AI融合的智能问答嵌入式设备
最丝滑的AI实时语音 听声辨人 多人互动 (开源ESP32)
【vLLM+Sensevoice+Cosyvoice】本地部署大语言模型+ASR+TTS实现个人智能助手功能-环境部署及成果展示
搭建自己的语音对话大模型 | ASR+LLM+TTS串联
基于FunASR说话人声纹识别实现说话人确认及ASR
FunASR语音识别 + Qwen2大模型,快速提取音视频内容,整理成结构化的Markdown笔记,准确度非常高
Java后端一个很恶心但光速拿到offer的方法!
基于Java的ASR | 基于Java的语音识别 | 基于Java实现的一句话语音识别接口 | 实时一句话语音识别 | 低延迟语音识别 | 实时语音识别
语音识别转文字软件faster-whisper整合包下载,免费语音转文字工具
安装开源的SenseVoice实现比Whisper更快更精准的语音转文字
2024最新超简单实现Python图片识别、颜色识别、文字识别Ocr教程
100%本地部署智能语音助手方案 | 超低延迟,实时交互 | 超真实人声,可定制、可训练 | 对接本地大语言模型
听风转录v0.2 实时AI字幕+翻译 支持AMD显卡
esp32超极快速的语音识别+LLM+TTS方案。
【听风转录】Whisper流式实时转录翻译 GPU版本更新发布
ChatTTS 最强文本转语音!一键本地安装,100%成功!效果逼真如真人,完全免费开源!!| 零度解说
【MindNLP】Whisper实时字幕
【NarratoAI】| 一站式 AI 影视解说+自动化剪辑工具
发明Netron的人真是个天才,能把复杂难懂的代码以图形化的方式展示!
faster-whisper的large-v2和large-v3语音识别AI大模型识别成srt字幕的效果简单对比
我实现了语音流式转录翻译!(win11实时字幕+Luna Translator hook)
4.1从Paraformer语音识别到SenseVoice音频理解:技术演进与应用探索
SenseVoice整合包-添加批量文件识别-情绪打标、音频文件重命名等功能
语音识别模型微调 | 训练一个自己的模型 | 训练模型 | 大模型训练 | ASR模型训练 | 模型微调 | ASR模型微调
【开源项目】浏览器在线使用,实时语言AI对话,STT+流式LLM(智谱)+TTS(GPT-SOVITS),浏览器录音+播放,文本内容回显
本地化实时语音识别 · 终结
【开源】乐鑫ESP32P4 S3 C3 地表最强AI对话,AI谈恋爱,1S超快响应,电子斗蛐蛐
基于faster_whisper的实时语音识别 | 可对接大模型的实时语音识别 | 实时语音识别 | 一句话识别
本地部署whisperlive,实时高准确率语音转文本(附一键安装包)
安装Ollama+CosyVoice打造流式智能语音秘书,流式生成语音大大缩短了等待时间,提升用户体验
【将免费进行到底】剪映字幕收费且加密,试试这些免费又好用的字幕识别生成器
大模型提示词泄露与越狱攻击
用Dify搭建基于智能体的聊天式数据查询应用
ESP32 语音识别教程【ESP-SR】