V
主页
语音文本技术论文阅读 Joint Unsupervised and Supervised Training for Multilingual ASR
发布人
Joint Unsupervised and Supervised Training for Multilingual ASR Join 'Speech and Language Technologies' Meetup group https://www.meetup.com/speech-and-language-technology-meetup-group/
打开封面
下载高清视频
观看高清视频
视频下载器
十分钟看懂脸书太极拳法Wav2Vec2.0 -- 语音预训练模型就像绝命毒师老白教杰西
[Long Review] Axial Attention in Multidimensional Transformers
还是太全面了!NLP十天起飞,一口气学完文本分类、文本摘要、机器翻译、知识图谱、情感分析等十大技术点!算法原理+论文解读,草履虫都能学会!大模型|机器学习
生成式AI神级论文:谷歌DeepMind的Variational Autoencoder (VAE) and Reparameterization
【人物访谈】10月29日,马斯克接受访谈:AI能力每年至少增长10倍,2028年左右具备所有人类的综合能力|2024.10.29
[Long Review] Cascaded Diffusion Models for High Fidelity Image Generation
详解微软零样本语音合成VALL-E
[论文阅读] Zipformer: A faster and better encoder for automatic sp
三分钟搞定ChatGPT
CV论文阅读OPENAI CLIP(1/3):Learning Transferable Visual Models From Natural Language
Openai最大的敌人来了,Mistral Ai能不能成为救世主让商用大模型全免费!
【深度学习零基础篇】从入门到精通一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络!
十分钟看懂谷歌铁布衫BigSSL: Exploring the Frontier of Large-Scale Semi-Supervised ...
语音NLP论文阅读 Token-level Sequence Labeling for SLU using Compositional E2E Models
【122集付费!】从入门到精通CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络一口气学完!
只需两步就可以搭建你的项目_论文主页来部署你的算法和模型
[Long Review] Transfer Learning from Speaker Verification to Multispeaker TTS
详解AudioLM: a Language Modeling Approach to Audio Generation
语音文本技术论文阅读 Exploring Wav2vec 2.0 fine-tuning for improved speech emotion recogni
深度学习缝了别人的模块,创新点如何描述?附魔改注意力机制+多尺度特征融合模块源码
十分钟告诉你为什么OpenAI的Whisper语音识别没ChatGPT那么好用 [语音语言论文阅读]
从OpenAI's Whisper模型到你自主研发的语音识别服务: 长音频与流式识别 (第三部分)
数学这类基础到底是点到为止还是牢牢掌握,我不服啊!
CV论文阅读OpenAI CLIP(2/3):Learning Transferable Visual Models From Natural Language
详解OpenAI GPT-3: Language Models are Few-Shot Learners(2/3)
膜拜!浙大教授竟把Transformer讲的如此简单!全套【Transformer基础】课程分享,连草履虫都能学会!再学不会UP下跪!
[Long Review] Conformer: Convolution-augmented Transformer for Speech Recogniti
语音文本技术论文阅读 Scaling Laws for Neural Language Models
[Long Review]Kullback-Leibler Divergence: Listen, Attend, Spell and Adapt ASR
语音文本技术论文阅读 Branchformer: Parallel MLP-Attention Architectures and E-Branchformer
三分钟搞定微软零样本语音合成VALL-E
语音文本技术论文阅读 SNRi Target Training for Joint Speech Enhancement and Recognition
详解OpenAI GPT-3: Language Models are Few-Shot Learners(1/3)
独家揭秘OpenAI GPT-4o逆天网络结构,居然高中生也能看懂
[Long Review] Deduplicating Training Data Makes Language Models Better
草履虫都能入门,这才是零基础入门AI人工智能的最佳学习路线!人工智能/深度学习/机器学习
【大模型面试】Flash Attention面试连环炮,淘汰80%面试竞争者
最新OpenAI+Microsoft, Google, Meta, and Nvidia开源语音大模型评价:语音识别部分
一统Ai圈的Transformer、到底是做啥的?
[Short Review]Conformer Convolution-augmented Transformer for Speech Recognition