V
主页
京.东618红包,每天可领3次
五分钟!快速体验Qwen-Audio语音识别,阿里最新开源的大语音模型
发布人
本期视频为你介绍阿里云最新发布的,基于大语言模型的,性能非常强的,一款可以用于语音识别的模型,Qwen-Audio。首先带你了解Qwen-Audio的独特之处,并为你演示如何在Windows个人电脑上运行有着近100亿参数的模型。
打开封面
下载高清视频
观看高清视频
视频下载器
链家发布中文能力更强的 whisper-large-v3
基于多任务训练的Qwen-Audio模型实现音频理解能力提升
【保姆级教程】6小时掌握开源大模型本地部署到微调,从硬件指南到ChatGLM3-6B模型部署微调实战|逐帧详解|直达技术底层
阿里通义千问Qwen-7B的原理及ReAct用法
python实现语音识别功能-喂饭式教学(附文档 源码)
实时语音识别部署教程 | 可离线部署的实时语音识别项目
VAD优化Whisper,faster-whisper-webui一个转录速度起飞的开源语音识别项目,转录效果很好
whisper最新开源语音识别模型 | 企业级开源语音识别项目
Whisper.cpp:轻量级智能语音识别库-开源
faster_whisper部署详细教程 | 可内网部署ASR | 开源ASR
从0开始语音识别(附带讲解内容)Python
whisper-jax最详细的安装教程 | 一个号称比whisper快70倍的语音识别项目 | 免费开源的语音识别项目
离线语音识别,原来如此简单
离线语音识别 支持Windows和Linux 通用语音识别 实时语音识别 Python开发语言
语音识别OpenAI Whisper微调,识别中文地方方言-潮州话
多模态大模型Qwen-VL
基于whisper实现的前端调用麦克风进行语音识别
实现任意大模型本地web、api部署,语音对话
【Whisper-Webui】一键包 批量离线制作字幕文件 自带large-v3模型
免费离线语音识别神器whisper安装教程
基于faster_whisper的实时语音识别
OpenAI语音识别模型Whisper原理介绍以及代码演示
从OpenAI's Whisper模型到你自主研发的语音识别服务: 长音频与流式识别 (第三部分)
OpenAI 发布新版开源语音识别模型 whisper-large-v3
免费开源语音转文字Whisper快速搭建,可生成字幕,媒体人的福音
可本地部署的实时语音识别项目
【SRT字幕工具箱】当Whisper识别的字幕不会智能断句时,试试这个方法!
Whisper | Faster Whisper | 语音识别 | 可内网部署的ASR
文字转语音、音频转文字软件!双向转换,完全免费开源!支持 Windows、macOS、Linux | 零度解说
【Qwen-VL】一键包 阿里云的大型视觉语言模型
新一代 Kaldi: 说话人识别+VAD+语音识别之 Python API
双4090部署qwen72b大模型 每秒150tokens
阿里发布的语音模型连方言情绪都能识别了?
基于faster whisper实现实时语音识别项目语音转文本python编程实现
qwen大模型地部署和微调法律大模型(只需5G内存)
【开源神助手】阿里Qwen-Agent免费开源,助你轻松应对各类数据和文件处理挑战!
如何用 faster-whisper 做一个超低延迟语音聊天机器人
基于faster whisper的实时语音识别项目
Qwen-Audio:宝藏AI音频工具
[每日一库] Whisper 音频增强、降噪和语音识别的Python库