如何评价大模型的能力值，大语言模型的评测标准BLEU，ROUGE，BERTscore，Entailmentscore, Chain-of-Code - 视频下载 Video Downloader

如何评价大模型的能力值，大语言模型的评测标准BLEU，ROUGE，BERTscore，Entailmentscore, Chain-of-Code

发布人

打开封面下载高清视频观看高清视频视频下载器

语音识别OpenAI Whisper微调，识别中文地方方言-潮州话

模型压缩-剪枝，蒸馏与量化

论文分享：Chain-of-Code, LINC, Logic Driven Data Extension

论文分享：DoLa等文章 Contrastive search对比学习方法在decoding解码策略中的应用，提高输出多样性，正确性，减少幻觉

这是我看过最好的Transformer模型讲解视频 - Model explanation (including math)

【大模型学习路径】LLM知识点及面试相关

Code LLaMA 首个据说超越GPT-4的代码生成模型

llama3 meta ai模型进化，开源模型使用教程

主流开源大模型LLama基本架构 KV-Cache, Rotary Positional Embedding, RMS Norm, Grouped Query

【论文】Meta AI最新论文self rewarding language model可以自我进化的的语言模型要来了

动画演示Transformer模型

旋转位置编码-绝对位置编码与相对位置编码的结合

【论文】苹果最新小模型论文Specialized Language Models with Cheap Inference from Limited Data

【论文】Decoding-time Realignment of Language

如何理解模型量化-GGML vs GPTQ

Transformer在训练阶段和推理阶段分别是怎么工作的（inference vs. training）

语言模型的发展史

大模型通俗讲解中文字幕-生成式人工智能

法拉利名车最能干的销售车内空间测评

BERT模型介绍 Training, Inference, BERT vs GPT_LLamA, Fine tuning

初见英语老师

大模型第二课：Transformer结构。input embedding, position embedding, query, key, value,

大模型解码/采样新策略Assisted Generation/speculative sampling

【论文】Multimodal Pathway: Improve Transformers with Irrelevant Data from Multimoda

【论文】Mistral 8x7b模型论文公布 MoE Mixtral of Experts快来围观最强多专家小模型技术报告

从零手搓中文大模型计划｜Day02｜聊一聊Tokenizer，顺带复习下BPE的工作原理

从零手搓中文大模型计划｜Day01｜请大家多多捧场，欢迎监督催更

Sunny Daddy 我很甜——糖

AI智能体进化方向和成果-具身化（embodiment）和技能（skills）：AlphaGo -> MineCLIP -> Voyager -> Eureka

再有人问我什么是LoRA，我就甩给他这个视视频！LoRA、精度以及量化

9岁女孩身高170，比在座的各位都高吧！

从零手搓中文大模型计划｜Day03-04｜预训练走起

这是我看过最好的算法与数据结构中文教程

OpenAI视频模型Sora虽好，但是缺点也非常明显。从文本生成视频 AI世界模型的时代已经到来，然而，该技术的性能受到计算能力的限制，且正确的提示对其表现至关

【IPN】5分，《户晨风》评测：请直接表达观点！

来看看避孕套siki-沸的感受怎么样

男生内裤分享｜像没穿一样舒服自由｜舒适新高度｜好穿不踩雷内裤测评

【论文】Efficient Memory Management for Large Language Model Serving PagedAttention

超爱芝芝老师测评

NLP24最新课程连载中UMass CS685 S24 (Advanced NLP) #3: Neural language models