V
主页
3 GPT2模型实现、训练及推理
发布人
详细介绍了GPT2模型的训练, 从数据加工,数据分词,transformer decoder 结构,mask,模型推理等详细实现了gpt2的细节
打开封面
下载高清视频
观看高清视频
视频下载器
5 BERT预训练 2-Transformer Encoder 模型实现
6 BERT模型训练3-损失函数构建、模型训练
30分钟学会微调Qwen1.8B大模型,轻松实现天气预报功能
4 BERT模型训练1-数据处理(构建mask 训练语料)
Flux.1-dev lora模型训练-可视化只需三步训练一个lora模型
GPT-SoVITS声音克隆模型部署及训练
玩转huggingface模型,实现模型下载自由(MiniCPM-V-2 使用演示)
多头注意力(Multi-Head Attention)
xinference一键实现各种大模型本地部署(包含llm,tts,asr,embedding,rerank等模型)
论文解读-Encodec(代码实现):High Fidelity Neural Audio Compression
这可能是目前为止我在B站看到过最系统的【时间序列预测模型】教程!迪哥一次性讲全了!_LSTM/Informer/ARIMA/Pandas/Transformer
【全100集】人工智能课程(理论+实战) 大模型学习路线及框架详解 pytorch transformer详解 大模型rag ChatGLM llama微调
ollama+dify实现本地模型部署和本地知识库搭建
模型性能起飞!图神经网络(GNN)和Transformer的结合,绝对是2024年最热门的研究方向!
stable diffusion 3 核心技术1(Rectified Flow论文解读及实现)
AIGC-VAE论文公式推导及代码实现(VAE+GAN)
全网最全收录!目前热门的六大时序预测任务:CNN-LSTM-Attention神经网络时序预测、Time-LLM结合大模型时序预测、informer、LSTM.
超强动画演示,手把手深入浅出讲解大模型是如何训练模型的?!太通俗易懂了,草履虫都能轻松学会!深度学习|大模型|注意力机制|计算机视觉|自然语言处理
绝对通俗易懂!9小时精讲大模型预训练微调+四大多模态大模型CLIP BLIP VIT MLLM+对话机器人办公助手
Transformer本质上在解决什么事?迪哥手把手带你从零基础开始搭建Transformer!论文解读+源码复现,草履虫都能学会!-人工智能/深度学习/大模型
【共享LLM前沿】假如我从11月1号开始学大模型!9小时学会搭建对话机器人办公助手、大模型预训练微调、四大多模态大模型!
AIGC-GAN (Generative Adversarial Nets)论文解读及实现
我竟然半天学会了6大深度学习经典神经网络模型!CNN/RNN/GAN/GNN/Transformer/LSTM 一次吃透原理与实战!
直观理解Vision Transformer(ViT)及Diffusion Models使用扩散模型进行图像合成,
Transformer真的不难啊!100集带你逐层分解Transformer模型——注意力机制、神经网络、位置编码、编码器、解码器等!算法原理+实战,通俗易懂!
手把手带你从零实现AI Agent!轻松搭建自己的AI工具,通俗理解AI Agent多智能体应用及项目实战,RAG、LLM、langchain
太全面了!一口气看完CNN、RNN、GAN、DQN、GNN、LSTM、Transformer、DBN等八大深度学习神经网络算法!比刷剧还爽!
多尺度融合的Corssformer时间序列锂电池预测
还是太全面了!NLP十天起飞,一口气学完文本分类、文本摘要、机器翻译、知识图谱、情感分析等十大技术点!算法原理+论文解读,草履虫都能学会!大模型|机器学习
论文补充-Residual Vector Quantizer(RVQ)
qwen大模型地部署和微调法律大模型(只需5G内存)
【微调实战】喂饭级教程!!15分钟学会Qwen2-7B微调及部署,帮你从零基础到大神,通俗易懂,连草履虫都能学会~
[动手写 Transformer] 手动实现 Transformer Decoder(交叉注意力,encoder-decoder cross attentio)
论文解读-Encodec:High Fidelity Neural Audio Compression
太全了!一口气学完CNN、RNN、GAN、GNN、Transformer、LSTM 6大深度学习神经网络!从入门到精通!
AI应用-本地部署LLM+TTS+ASR实现语音面试对话
强推!草履虫都能一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM、DBN等八大深度学习神经网络算法!真的比刷剧还爽!
实现任意大模型本地web、api部署,语音对话
1 LLM-训练语料准备及读取
基于傅里叶混合卷积的改进itransformer时间序列预测模型