V
主页
如何评价大模型的能力值,大语言模型的评测标准BLEU,ROUGE,BERTscore,Entailmentscore, Chain-of-Code
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
语音识别OpenAI Whisper微调,识别中文地方方言-潮州话
模型压缩-剪枝,蒸馏与量化
论文分享:Chain-of-Code, LINC, Logic Driven Data Extension
论文分享:DoLa等文章 Contrastive search对比学习方法在decoding解码策略中的应用,提高输出多样性,正确性,减少幻觉
这是我看过最好的Transformer模型讲解视频 - Model explanation (including math)
【大模型学习路径】LLM知识点及面试相关
Code LLaMA 首个据说超越GPT-4的代码生成模型
llama3 meta ai模型进化,开源模型使用教程
主流开源大模型LLama基本架构 KV-Cache, Rotary Positional Embedding, RMS Norm, Grouped Query
【论文】Meta AI最新论文self rewarding language model可以自我进化的的语言模型要来了
动画演示Transformer模型
旋转位置编码-绝对位置编码与相对位置编码的结合
【论文】苹果最新小模型论文Specialized Language Models with Cheap Inference from Limited Data
【论文】Decoding-time Realignment of Language
如何理解模型量化-GGML vs GPTQ
Transformer在训练阶段和推理阶段分别是怎么工作的(inference vs. training)
语言模型的发展史
大模型通俗讲解中文字幕-生成式人工智能
法拉利名车最能干的销售车内空间测评
BERT模型介绍 Training, Inference, BERT vs GPT_LLamA, Fine tuning
初见英语老师
大模型第二课:Transformer结构。input embedding, position embedding, query, key, value,
大模型解码/采样新策略Assisted Generation/speculative sampling
【论文】Multimodal Pathway: Improve Transformers with Irrelevant Data from Multimoda
【论文】Mistral 8x7b模型论文公布 MoE Mixtral of Experts快来围观最强多专家小模型技术报告
从零手搓中文大模型计划|Day02|聊一聊Tokenizer,顺带复习下BPE的工作原理
从零手搓中文大模型计划|Day01|请大家多多捧场,欢迎监督催更
Sunny Daddy 我很甜——糖
AI智能体进化方向和成果-具身化(embodiment)和技能(skills):AlphaGo -> MineCLIP -> Voyager -> Eureka
再有人问我什么是LoRA,我就甩给他这个视视频!LoRA、精度以及量化
9岁女孩身高170,比在座的各位都高吧!
从零手搓中文大模型计划|Day03-04|预训练走起
这是我看过最好的算法与数据结构中文教程
OpenAI视频模型Sora虽好,但是缺点也非常明显。从文本生成视频 AI世界模型的时代已经到来,然而,该技术的性能受到计算能力的限制,且正确的提示对其表现至关
【IPN】5分,《户晨风》评测:请直接表达观点!
来看看避孕套siki-沸的感受怎么样
男生内裤分享|像没穿一样舒服自由|舒适新高度|好穿不踩雷内裤测评
【论文】Efficient Memory Management for Large Language Model Serving PagedAttention
超爱芝芝老师测评
NLP24最新课程连载中UMass CS685 S24 (Advanced NLP) #3: Neural language models