V
主页
Transformer的无限之路:位置编码视角下的长度外推
发布人
Transformer的无限之路:位置编码视角下的长度外推 长度外推的定义及研究动机 (5min) 可外推的位置编码 (20min) 大模型时代的外推方法 (10min) 挑战和开放问题 (5min) QA讨论环节(20mins) 主讲人:赵亮 哈工大SCIR研一 主持人:华文越 罗格斯大学在读博士 【NICE七期】
打开封面
下载高清视频
观看高清视频
视频下载器
知识斗地主:解析RAG大模型中复杂的知识冲突
评估中文大模型中的幻觉
【NICE二期】王鸿儒:武侠小说视角:大模型对话系统的内功和外功
RNN卷土重来:基于门控记忆槽的线性注意力机制
LLaMA-MoE:基于参数复用的混合专家模型构建方法探索
大模型时代下非自回归模型的多层次能力提升:媲美自回归模型的探索之路
从0开始训练1.4b中文大模型的经验分享
大模型事实性综述
【NICE一期】冯兆鹏:文本表征模型能区分“猫追老鼠”和“老鼠追猫”吗?一项实证研究
LLMLingua: 压缩prompt构造LLMs的语言
大语言模型的时间魔法:从共时推理到框架优化
如何加速大语言模型推理?万字长文综述大语言模型高效推理技术
【NICE一期】张子殷:代码大模型综述
Deita: 用高质量数据在微调中“四两拨千斤”
全栈大模型微调框架LLaMA Factory:从预训练到RLHF的高效实现
符号化规则强化CoT,大幅提高推理性能 - ACL2024
FacTool: 生成人工智能中的事实检测 - 用于多任务和多领域场景的工具增强框架
蛋白质交流的艺术:ProLLM用'思维链'重新定义蛋白质相互作用预测!
【NICE一期】李建玲:基于LLM加强版自训练的成分句法解析器
LLMBar:评价用于评估指令遵循的大语言模型
大语言模型在text-based game上的表现及分析
这也太全了!火爆全网的【Transformer】入门到精通终于被人上传出来,全程大白话讲解绝对通俗易懂!
【NICE二期】章岳:AI海洋中的海妖之歌:大模型幻觉问题调研
【NICE一期】吴胜琼:NExT-GPT:全能多模态大语言模型
基于深度学习在医学领域实战:Resnet+Transformer!医学分割应用与数据集分类实战!迪哥手把手带你原理推导+代码解析+项目实战!
【NICE二期】薛博阳:给定外部知识,模型如何正确使用和表达?
【全168集】华为大佬终于把AI大模型落地做成了教程,通俗易懂,2024最新内部版,学完即就业!
【第一性原理】AI大模型原理:60分掌握大模型基础框架 LLM推理能力 LLM原理 RAG及训练自己专属大模型 (人工智能大模型入门基础知识)
国外小哥哥手把手带你用PyTorch写扩散模型 (Diffusion Models)
不愧是李宏毅!入门到精通一口气讲透CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络算法!简直不要太爽!
【NICE一期】张军磊 :从零开始生成高质量的NLI风格的标注数据
从头实现transformer 08 掩码
比刷剧还爽!一口气学完Transformer在CV+NLP方向最热门的几大模块,从算法到代码再到论文系统解读,这也太全了!
标注革命!通用标注工具 T-Rex Label 如何横扫农业数据集
【Kaggle竞赛】手把手教学,全网最细致的Kaggle项目实战教程!赛题解析/代码详解 LLM/NFL/OTTO/ICR 机器学习/深度学习/神经网络
llama3.1国内可直接使用教程,405B堪称最强开源大模型,API无限调用,迪哥带你怎么玩,手把手教你打造自己的大模型!-人工智能、大模型、深度学习、NLP
超全超简单!入门到进阶一口气学完CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等七大深度学习神经网络算法!真的比啃书好太多!
【挑战不可能】超强AI大模型零基础入门实战教程,AI技术专家手把手带你从零基础/小白到就业
CMU《多模态机器学习|CMU Multimodal Machine Learning, Fall 2023》中英字幕
什么是扩散模型?