V
主页
SenseVoice整合包-添加批量文件识别-情绪打标、音频文件重命名等功能
发布人
SenseVoice是阿里团队开源语音识别模型。专注于高精度多语言语音识别、情感辨识和音频事件检测。速度飞快,支持多语言。 整合包加入了批量文件识别、情绪打标、音频文件重命名等功能。 整合包链接:https://pan.quark.cn/s/46c5d867db56 魔撘地址:https://www.modelscope.cn/models/iic/SenseVoiceSmall
打开封面
下载高清视频
观看高清视频
视频下载器
100万次代码模拟投注摸索双色球最佳复式红蓝组合
GPT-SoVITS加载自定义路径模型及参考音频
通宵达旦,终于弄成了 | 一句话识别 | Java ASR | 基于Java的语音识别 | 外呼系统语音识别
mixly图形化单片机编程 89 基于天问block制作一个语音识别项目
【videolingo整合包】免费开源AI视频原声翻译项目
【AI视频翻译】一站式字幕翻译、原音色配音,你的搬运神器【VideoLingo】
我实在摸不透08的小想法?@领克汽车
一句话出图!实时语音AI儿童绘本实验(离线)
【videolingo】本地安装使用教程来了-AI视频翻译
可区分说话人的语音识别项目 | 可用于智能语音客服录音通话转写 | 语音识别 | 商用级别语音识别
第二十课ASRPRO编程模式延时和点动控制
音频文件转字幕文件工具 对接外部接口无需本机配置 精准识别 操作迅速 只需几秒钟迅速识别音频文字!
【MindNLP】Whisper实时字幕
Streaming Captions一键整合包 Win10可用实时字幕+Luna Translator剪贴板+VAC
【开源】48集 语音识别语音唤醒程序讲解 #ESP32 #嵌入式开发 #编程
mixly图形化单片机编程 90 天问block与esp8266串口通讯
小米hyperos2.0发布回顾-AI特性概览
第二代上汽名爵MG6非斑马系统车机升级教程
Groq支持的自动检测语音输入AI对话应用,中文对话效率翻倍 | Whisper+LLM +VAD
区分说话人转写 | 说话人区分 | 区分说话人的语音识别项目
一款比Whisper更快的模型 | 基于Java实现的实时一句话语音识别 | 实时语音识别 | 超低延迟实时语音识别
whisper | 语音识别 | Openai Whisper | Whisepr GUI
【虚幻引擎】UE5数字人开发语音识别+语音合成+口型驱动+ 动画播放
基于stm32单片机的简易款智能药箱|定时服药提醒
可用于智能呼叫中心的内网可用的区分说话人的语音识别 | 通话区分说话人语音识别 | 通话区分说话人语音转写
STM32智能语音台灯
批量混剪带货视频画中画自动配音语音识别一键生成免费软件工具
极越07语音识别业界第一了吧?不信你看
吕德华的语音识别到底有多离谱
用一瓶芥末,讲清楚德国产品的包装逻辑。
大漂亮如何选“坐馆”——基础知识篇。
基于51单片机的智能饮水机系统
当一个美国汉学家,决定推翻所有大师的学说——70分钟读懂《中国叙事学》
语音表示学习:HuBERT模型
基于STM32单片机的智能家居系统的设计
【虚幻引擎】UE5 历时一个多月自研开发的数字人教程终于上线了!!!
PH测量模块的详细教程,手册分析+代码说明,可精准测量PH!【用在智能养殖、游泳馆、水库监测、污水处理等诸多领域】
记一次给研究生训练实时语音识别大模型的经历
【虚幻引擎】AI数字人选择发音人+ 情感风格 +流式语音合成 + 语音标点停顿
媒体疯狂炒作的“珍稀昆虫”,抓一只直接坐牢,事实上却……?| 海南雨林探险!