V
主页
论文解读-SoundStream: An End-to-End Neural Audio Codec
发布人
SoundStream,神经网络编解码模型,能将音频离散化,然后可以使用transformer对离散后对数据进行自监督学习。 第一次在B站讲解论文,有不对的地方希望多包含。
打开封面
下载高清视频
观看高清视频
视频下载器
论文补充-Residual Vector Quantizer(RVQ)
论文解读-Encodec:High Fidelity Neural Audio Compression
论文解读-Encodec(代码实现):High Fidelity Neural Audio Compression
stable diffusion 3 核心技术1(Rectified Flow论文解读及实现)
【多模态论文解读】llama3.2-vision
AIGC-Flow(Normalizing Flow 理论介绍及论文解读)
9个报错?但我代码只有8行?
论文解读: 神经常微分方程1(Neural Ordinary Differential Equations)
AIGC-GAN (Generative Adversarial Nets)论文解读及实现
Flow matching论文解读-flux.1核心技术(FLOW MATCHING FOR GENERATIVE MODELING)
海外知网Researcher关闭怎么办!?试试Bohrium AI论文搜索,文献追踪&订阅、管理不用愁!
【2024年最新顶会】大模型+时间序列预测,Time-LLM:基于大模型的时间序列预测实战,论文解读+源码复现,带你从零解读前沿新方向!-人工智能/深度学习
酒鬼嵌入式,每天一个小知识12-cache如何加速程序运行!
最全面的Zookeeper论文解读 深入浅出底层原理
打破时空壁垒,改进注意力网络助你横扫十篇SCI !
GLM4本地部署(支持function calling,code interpreter和文档解析)
AIGC-VAE论文公式推导及代码实现(VAE+GAN)
chatglm3模型本地部署及微调
【CVPR 2024】开放词汇语义分割——SED模型解读!
CVPR2024论文解读!!AI博士带你深度解读YOLO-World:实时开放词汇目标检测!通俗易懂!2024最新!SCI论文写作必看!人工智能 | 计算机视觉
qwen大模型地部署和微调法律大模型(只需5G内存)
AI应用-本地部署LLM+TTS+ASR实现语音面试对话
xinference一键实现各种大模型本地部署(包含llm,tts,asr,embedding,rerank等模型)
StoryDiffusion(小说生成漫画实现)-8G显存可玩
论文解读|无需标签就能识别图像?
4 BERT模型训练1-数据处理(构建mask 训练语料)
ollama+dify实现本地模型部署和本地知识库搭建
实现任意大模型本地web、api部署,语音对话
玩转huggingface模型,实现模型下载自由(MiniCPM-V-2 使用演示)
1 LLM-训练语料准备及读取
Flux.1-dev lora模型训练-可视化只需三步训练一个lora模型
一文搞懂常用CNN原理及形状变换公式(CNN 、Transposed CNN、Causal CNN、Dilated CNN)
ChatMusician 文本生成音乐
6 BERT模型训练3-损失函数构建、模型训练
5 BERT预训练 2-Transformer Encoder 模型实现
2 LLM- 分词器选择及自定义分词器
Llama3中文增强模型微调和法律大模型微调
GPT-SoVITS声音克隆模型部署及训练
人类寿命即将翻倍?!【诺贝尔奖2024】
离谱!不写一行代码,改一个文件名竟然干崩系统!