V
主页
模型训练,从记忆到泛化的顿悟之旅
发布人
本视频介绍一个有趣的研究工作,模型在训练的时候,到底是对训练数据的记忆,还是对新数据的泛化?以小见大,从一个小模型出发,通过研究其机理,观察实验结果,发现模型训练过程中先从记忆开始,实现一个到泛化的“顿悟”过程。
打开封面
下载高清视频
观看高清视频
视频下载器
【全105集】1300个单词轻松记 小学初中学生的思维导图记忆法 让孩子在玩乐中掌握英语
【记忆】倪师讲如何过目不忘,记得收藏转发
基于3D高斯展开的实时少样本视角合成
DeepCache:无需训练加速扩散模型的创新方法
基于潜在变量推断的训练链式思维提升语言模型推理能力
FreeControl:实现任意文本到图像扩散模型的无训练空间控制
开源AI女友安装教学 [Open-LLM-VTuber]
图神经网络何时预训练?从数据生成角度探讨
基于上下文调整的检索增强生成方法
AI安全说第一期直播回放 | 大语言模型与视觉语言模型越狱行为及防御机制的回顾与展望
电商领域指令微调大模型
综述:大模型的可解释性研究
基于扩散模型的可控4D引导视频生成
Make-A-Shape: a Ten-Million-scale 3D Shape Model
提升 Cursor 使用体验的 3 个关键技巧全解
深度学习中的泛化理论 (1)基础
风吹来的砂穿过所有的记忆
大型语言模型在上下文学习中的可靠性提升:结合监督知识的方法
Video-Bench: 全面评估视频大型语言模型的基准测试和工具包
Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection
CreativeSynth: Creative Blending and Synthesis of Visual Arts based on Multimoda
LLM Comparator: Visual Analytics for Side-by-Side Evaluation of Large Language M
Diffuse to Choose: Enriching Image Conditioned Inpainting in Latent Diffusion Mo
传统机器学习算法还值不值得学?迪哥带你分析各大机器学习算法的重要性,精讲机器学习树模型系列(重中之重)
用视觉语言模型自动生成奖励函数,训练多目标强化学习智能体
Implicit Diffusion: Efficient Optimization through Stochastic Sampling
SceneVerse: Scaling 3D Vision-Language Learning for Grounded Scene Understanding
语义压缩:扩展大型语言模型的上下文窗口
ReST与ReAct结合:面向多步推理的LLM智能体自我提升
【StableDiffusion】2024最细最保姆SD全套教程!零基础入门到精通,全程干货无废话!逼自己一个周学完,允许白嫖,拿走不谢,AI绘画 AI商业
Tuna: Instruction Tuning using Feedback from Large Language Models
CLIP作为RNN:无需训练即可分割无数视觉概念
教你10分钟打造专属AI客服,接入各大平台【扣子小白教程】
LLaVA-Grounding:实现大型多模态模型的基于视觉的聊天
Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition
基于注意力调整的局部图像编辑方法:MAG-Edit
Vary: 大型视觉语言模型视觉词汇扩展新方法
PaperWeekly x 清华大学:计算未来轻沙龙——揭秘AutoML技术