OneKey问答盒子（使用ESP32S3 接入MiniMax文本语音大模型对话） - 视频下载 Video Downloader

京东 11.11 红包

OneKey问答盒子（使用ESP32S3 接入MiniMax文本语音大模型对话）

发布人

当你面临一些无法应对的问题，需要在短时间得到答案，只需要按下按键→说出问题→语音+文字回答。这就是我想要的效果：“一键”解决问题。这个项目其实很早就想做了。我也当时技术有限，最近看到有大佬发了一系列ESP32接入国产语音模型的例子，学习了一波。颇有收获。于是参考大佬的代码在加上自己配合通义灵码这类插件加了一些功能。以下是教程：https://makelog.dfrobot.com.cn/article-314583.html
 源代码参考B站大佬2345vor的教程https://blog.csdn.net/vor234/article/details/138620142 感谢！

打开封面下载高清视频观看高清视频视频下载器

我实现了语音流式转录翻译!（win11实时字幕+Luna Translator hook）

faster_whisper对接大模型进行语音对话 | 人机对话 | 语音识别 | 大模型 | faster whisper实时语音识别 | 实时语音识别

免费、不限量生成视频，支持中文提示词！中文AI视频工具新王者，彻底疯了！| 海螺Hailuo AI x Minimax教程

【幻灯片朗读套装】VOICEPEAK 可商用 6说话人套装与 Voice Presenter Pro【介绍视频】

Seed VC整合包：最快速的歌声转换 | 革命性的语音克隆体验

语音识别转文字软件faster-whisper整合包下载，免费语音转文字工具

【GPT-SoVITS-v2】小桃和小绿中文音频模型v2版！《GPT模型分享第七期》

添加双语字幕功能啦可以保存双语字幕了二哲AI视频播放器

强烈推荐！语音识别全套教程！恨不得马上就学会的语音识别技术！谷歌“万能”语音识别大模型USM、OpenAI、语音分离、语音合成、变声器

海螺ai做的汽车追逐戏《Sin City》｜复古80年代

读研期间，如何快速学会语音识别技术？多亏了这套NLP语音识别项目全套教程！从零基础到实战简单明了讲明白了！语音分离、语音合成、变声器

基于faster_whisper的实时语音识别 | 可对接大模型的实时语音识别 | 实时语音识别 | 一句话识别

ESP32本地语音助手演示

Qt+Ollama开源大模型随意部署，免安装解压即用

TD+flux实时语音生成高画质AI儿童绘本

自动化转写 | 自动化语音识别 | 对直播录屏自动化生成字幕 | 大模型总结视频内容

基于faster_whisper的实时语音识别改进版 | whisper中出现繁体中文的解决方法 | 语音识别中繁体转简体 | OpenCC

视频翻译pyVideoTrans使用演示

恐怖胆脂瘤；耳道被扎出一个大坑从坑里挖出好大一坨耳屎

Whisper终结者：Reverb ASR 语音识别和说话人分离方面新标杆在前所未有的20万小时人工转录数据上进行训练支持可定制的逐字转录

Vedal用超绝画技解释前几次直播崩溃原因【Neuro&Vedal 开发者直播切片】

【开源项目】F5-TTS 一句话克隆声音，开源TTS，附赠Windows整合包，有兴趣的可以玩玩0.0

MINIMAX 似乎更懂小动物，海螺AI 视频生成片段合集

带有情绪控制的TTS文字转语音软件EmotiVoice整合包下载，免费文本转语音工具

一站式语音识别服务——中文、中文方言、多国语言识别

【AI主播-TTS篇】对接 CosyVoice API Win 0819，整体很简单，懂得不看也没啥问题

AI一键音频转文字、音频转字幕工具，视频生成字幕、语音转文本，OpenAI开源语音识别神器Whisper本地一键整合包下载

小红书出品！无需训练，中英语音克隆合成！

实测 OpenAI 高级语音功能 & 常见问题解答

我的声音被克隆了？效果惊人 | F5 TTS语音合成模型体验和本地部署全流程

一点红语音合成2.9版本更新【增加版本并存，多语种翻译，资源中心】

基于 FunASR 实时语音识别的 esp32 语音助手。

第十六课ASRPRO配置模式PWM输出和电机控制

大招来了，Kimi更新更强搜索功能，AI进入新阶段！

WebUI更好用！GPT-SoVITS界面改进分享

【Stable Diffusion】5款超绝涩涩大模型推荐，绝对好用！绅士都在用的SD大模型新手小白必备福利大放送！（附资料）

一次性解决你，文字转语音、语音合成、配音方面的各种需求

科研废物导航！这里的工具比4399的游戏还多，可是90%的研究生都不知道！

更快的语音识别模型whisper-large-v3-turbo

刮画也蛮好玩滴嘛