V
主页
十分钟告诉你为什么OpenAI的Whisper语音识别没ChatGPT那么好用 [语音语言论文阅读]
发布人
Explain why OpenAI's Whisper ASR may not be as successful as GPT-3 in NLP domain by reading the paper behind it in 10 minutes "Robust Speech Recognition via Large-Scale Weak Supervision" Whisper is an automatic speech recognition (ASR) system trained on 680,000 hours of multilingual and multitask supervised data collected from the web. We show that the use of such a large and diverse dataset leads to improved robustness to accents, background noise and technical language. Moreover, it enables transcription in multiple languages, as well as translation from those languages into English. We are open-sourcing models and inference code to serve as a foundation for building useful applications and for further research on robust speech processing. #openai #whisper #API #asr #gpt3 #nlp #wav2vec #hubert #transformer #google #meta #microsoft #icml #nips #ml #course #coursera #nlp #chatgpt #sota #asr #speechrecognition
打开封面
下载高清视频
观看高清视频
视频下载器
B站讲的最好的AI大模型实战(2024最新版)LLM+RAG系统+GPT-4o+OpenAI,全部都讲明白了!!
【国内白嫖】10月30日最新ChatGPT4.0
从OpenAI's Whisper模型到你自主研发的语音识别服务: 总论 (第一部分)
从OpenAI's Whisper模型到你自主研发的语音识别服务: 后处理与语言模型 (第四部分)
三分钟搞定ChatGPT
三分钟搞定微软零样本语音合成VALL-E
详解AudioLM: a Language Modeling Approach to Audio Generation
导师推荐的数据库!4个神级代码复现网站,里面99%的论文都能找到!
【附源码】2024最新53个大模型实战项目!练完即就业Ⅰ基础到框架Ⅰ适合小白入门_LLM_RAG_Agent_ChatGPT_Prompt
[全网第一家]分析OpenAI GPT-4图文模型结构与训练数据和成本(推测)
解锁天顶星科技ChatGPT
语音合成速度最快的开源TTS | 基于MIT协议可商用的开源TTS | 这是我用过合成速度最快的开源TTS
【国内白嫖】11月15日最新ChatGPT4.0
十分钟看懂谷歌易筋经BERT
【国内白嫖】10月31日最新ChatGPT4.0
太厉害了 已跪!终于有人能把OpenCV图像处理讲的这么通俗易懂了,现在计算机视觉opencv全套分享给大家。
美国AI可能走入死胡同,OpenAI新模型遇到无法控制的错误
2024最爽的吴恩达深度学习,附神经网络与Transformer论文合集
从OpenAI's Whisper模型到你自主研发的语音识别服务: 长音频与流式识别 (第三部分)
最新OpenAI+Microsoft, Google, Meta, and Nvidia开源语音大模型评价:语音识别部分
【强推!】 这绝对是AI+医疗最好的【医疗机器学习】全套教程,不愧是MIT教授31小时全学会通关了!!!-人工智能|AI医疗|人工智能医疗
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI),3天学完,让你少走99%弯路!
完全可以轻松自学LLama3,从下载安装-微调-量化-部署,算法原理+代码精讲,太通俗易懂了,草履虫都能学会!机器学习|计算机视觉|自然语言处理|大模型
开场白
CV论文阅读OpenAI CLIP(2/3):Learning Transferable Visual Models From Natural Language
研毕!杀疯了!读博期间,有哪本书你恨不得把它全部内容都背诵下来?
语音文本技术论文阅读 SNRi Target Training for Joint Speech Enhancement and Recognition
大模型研讨课第一期(共10期)
(超爽中英!) 2024公认最好的【Agent智能体】系列教程!带你从0到1构建自己的智能体!
语音文本技术论文阅读 UniSpeech-SAT - Universal Speech Representation Learning with Speaker
【国内白嫖】11月17日最新ChatGPT4.0
语音文本技术论文阅读 Scaling Laws for Neural Language Models
[ICML 2024] 揭示与利用隐藏注意力下沉:通过注意力校准在无需训练的情况下增强大型语言模型
生成式AI神级论文:谷歌DeepMind的Variational Autoencoder (VAE) and Reparameterization
【大模型面试】Flash Attention面试连环炮,淘汰80%面试竞争者
语音文本技术论文阅读 RefineGAN - Universally Generating Waveform Better than Ground ...
【外网爆火】大模型学习研讨会:探索 GPT 模型在科学研究中的潜力和缺陷!-大模型/大模型入门/大模型学习
强推!【NLP自然语言处理】自然语言处理NLP快速入门教程!这可能是唯一一个把自然语言处理讲清楚了的教程吧!(人工智能、深度学习、机器学习算法)
(强推!)BERT模型项目实战教程!基于BERT模型的文本分类、情感分析及中文命名实体识别实战教程!真的通俗易懂!(人工智能、深度学习、机器学习算法、神经网络)
语音文本技术论文阅读 One-Edit-Distance Network (OEDN) in Mispronunciation Detection & ASR