V
主页
基于FunASR说话人声纹识别实现说话人确认及ASR
发布人
说话人声纹识别是一项利用人声中独特特征来识别和验证个人身份的技术。这项技术在安全、法证和个性化服务等多个领域有广泛应用。以下是关于说话人声纹识别的一些要点: 工作原理: 声纹识别基于每个人声音的独特特征,如音高、音色、语速等。 系统会分析语音信号中的多个参数,如梅尔频率倒谱系数(MFCC)、线性预测系数(LPC)等
打开封面
下载高清视频
观看高清视频
视频下载器
区分说话人转写 | 说话人区分 | 区分说话人的语音识别项目
阿里巴巴中文识别FunASR模型全线开源,支持热词识别,VAD检测,支持多端
准确度98.7%的说话人性别识别模型测试
阿里巴巴-语音处理模型SenseVoice实测
腾讯实时开放词汇目标检测YOLO-World
FunASR 实时流式语音识别 iOS实现
语音识别模型微调 | 训练一个自己的模型 | 训练模型 | 大模型训练 | ASR模型训练 | 模型微调 | ASR模型微调
【MindNLP】Whisper实时字幕
OpenAI Whisper:免费超准的语音识别转文字 介绍OpenAI Whisper识别准度以及工具如何使用、在线使用网站
【虚幻引擎】AI数字人选择发音人+ 情感风格 +流式语音合成 + 语音标点停顿
语音性别识别实战
Arc Search,秘塔AI搜索,explorer.globe.engineer,mylens.ai实现搜索信息汇总分析,为你提供决策
音频文件转字幕文件工具 对接外部接口无需本机配置 精准识别 操作迅速 只需几秒钟迅速识别音频文字!
MacOS开发教程-开发任务管理工具App
可区分说话人的语音识别项目 | 可用于智能语音客服录音通话转写 | 语音识别 | 商用级别语音识别
使用机器学习基于声音分类优化语音识别
DifyAI+Python实现视频标签自动裁切合并功能
登上GitHub趋势榜榜首的TTS开源大模型:MaskGCT,刷新全球多项SOTA
可用于智能呼叫中心的内网可用的区分说话人的语音识别 | 通话区分说话人语音识别 | 通话区分说话人语音转写
记一次给研究生训练实时语音识别大模型的经历
whisper | 语音识别 | Openai Whisper | Whisepr GUI
Groq支持的自动检测语音输入AI对话应用,中文对话效率翻倍 | Whisper+LLM +VAD
WhisperKit语音转文字中英互译工具
批量混剪带货视频画中画自动配音语音识别一键生成免费软件工具
OpenAI发布了全新的 o1 推理模型 工作原理及技术报告详解
使用GPT-SoVITS实现声音克隆
【开源】48集 语音识别语音唤醒程序讲解 #ESP32 #嵌入式开发 #编程
mixly图形化单片机编程 90 天问block与esp8266串口通讯
语音技术研究落地-移动端语音助手实现方案
【虚幻引擎】UE5数字人开发语音识别+语音合成+口型驱动+ 动画播放
亲自体验 YOLOv9!该视频深入介绍了架构、设置以及如何在自定义数据集上训练 YOLOv9。
mixly图形化单片机编程 89 基于天问block制作一个语音识别项目
货拉拉TheRouter iOS使用讲解视频
移动端适配方案
本地运行AI多模态大语言模型open-webui
#1024程序员节 【开源】esp32的ai语音唤醒和语音识别 #开源 #ESP32
移动端最佳开发模版和技术选型方案
Swift 宏初实践
CyberScraper 2077-强大网络爬虫工具
【虚幻引擎】UE5 历时一个多月自研开发的数字人教程终于上线了!!!