学术报告-大语言模型的知识学习研究-黄书剑-南京大学自然语言处理组

发布人

2024年11月19日，南京大学自然语言处理组黄书剑教授受哈工大深圳陈科海老师邀请做线上报告，报告题目为：大语言模型的知识学习研究。该报告包含三个工作，其中第一个知识学习偏好分析的相关工作获得EMNLP2024 Outstanding Paper。以下为三个工作的论文信息：
1、知识学习偏好分析：Formality is Favored: Unraveling the Learning Preferences of Large Language Models on Data with Conflicting Knowledge. EMNLP 2024 Outstanding Paper Award (arXiv:2410.04784)
Jiahuan Li, Yiqing Cao, Shujian Huang, Jiajun Chen.
2、跨语言能力迁移：Large Language Models Are Cross-Lingual Knowledge-Free Reasoners (arXiv:2406.16655)
Peng Hu, Sizhe Liu, Changjiang Gao, Xin Huang, Xue Han, Junlan Feng, Chao Deng,Shujian Huang
3、增强跨语言迁移：PreAlign: Boosting Cross-Lingual Transfer by Early Establishment of Multilingual Alignment. EMNLP 2024 (arXiv:2407.16222)
Jiahuan Li, Shujian Huang, Aarron Ching, Xinyu Dai, Jiajun Chen.

打开封面下载高清视频观看高清视频视频下载器

学术报告-大语言模型的知识学习研究-黄书剑-南京大学自然语言处理组

南京大学大学生写oj破防实录

2024NJUNLP夏令营-南京大学自然语言处理组（南大NLP）

斯坦福大学《自然语言处理2023|CS224n: Natural Language Processing》中英字幕

南大数院建院庆祝会 鼓楼校区大礼堂勾起田刚院士回忆

都2024年了，还不知道先学Transformer还是Diffusion？

SIGGRAPH 2024最佳论文：富人上天堂比骆驼穿过针眼还难 Repulsive Shells

李沐-大模型训练半年-数据来源不清不白-数据不能公开的原因

墨尔本大学不再接受境外语言成绩，留学生还是要提高自身实力！

北大和谷歌提出tokenformer 把模型参数当做token 大幅降低模型扩容成本

0.5B小模型将原始HTML完美转换为干净的Markdown，或许专用场景的小模型才是未来主流

独家视频解读：【北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式】

李宏毅NLP(自然语言处理)完整课程，强推！

从打灰哥到大模型（LLM）算法研究员，应届捞钱如捡豆

来灞渭桥感受中式美学

帅臣来国科大讲座啦！不愧是硕博顶流

2024年美国大选佐治亚州选举结果 共和党占优势 但亚特兰大主要是民主党支持者

李开复透露：GPT-5训练受阻，OpenAI仍有大量先进技术未发布

日本 AI 算力大跃进，我国却遭 “断芯锁算”，算力之战何去何从？AI大模型算力 GPU

国产大模型陷入技术迷局与 商业困境！市面所见模型主要分两类：其一为基础通用大模型，像文心一言、通义千问等大厂力作！其二则是行业专用模型，在政务、医疗、金融等细分

介绍 FrontierMath｜测试 AI 极限的数学基准｜Epoch AI｜陶哲轩｜Evan Chen

诺奖和图灵奖双料得主：杰弗里·辛顿的“科研帝国”｜这事钛大了

【访谈】专访菲尔兹奖得主Alessio Figalli，在自然中探索数学问题的漫游者

人工智能大师Joscha Bach:你的思想，其实并不完全属于你自己

杨振宁室友：计算复杂性理论第一华人

北京10043计算机专业，转学去美国

强化学习之父Richard Sutton演讲：实现AGI需要明确的目标和一个世界模型

人工智能 AI 四小龙的兴衰! 商汤、旷视、依图等一批 15 年前后崛起的 A I 创业公司，似乎一夜之间就没了声！响

艰难啃pytorch，是不是用惯了python的作者大佬没有考虑代码可读性

厦门大学在读博士张妍：加权关键词共现网络的潜在空间模型及其在统计学知识发现中的应用

博士毕业论文《不确定非线性系统自适应预设时间控制》华长春教授

时间线 - 可视化写作、情节设计与历史研究

都2024了，还不知道先学Transformer还是Diffusion？迪哥精讲BERT、Swin、DETR、VIT四大核心模型，原理讲解+论文解读+代码复现！

读硕士一点用都没有

【计算机博士带你啃书】白话讲解周志华机器学习西瓜书

所有研究生快步跟上！起因就是这本联合了斯坦福、微软、UCLA和华盛顿大学以及李飞飞撰写的论文综述！——人工智能/机器学习/深度学习

[ICML 2024] 揭示与利用隐藏注意力下沉：通过注意力校准在无需训练的情况下增强大型语言模型

211人工智能应届生直言:在大学自学比上课更重要!

打破官僚特权主义！

【本地知识库解决方案】GraphRAG 就应该这么学！ | 传统RAG与GraphRAG的构建区别 | Microsoft GraphRAG 底层原理解

美女同事回归！又可以和她组成“饭搭子”了，但生活一地鸡毛，还是难以开心起来！

南大数院建院庆祝会鼓楼校区大礼堂勾起田刚院士回忆

2024年美国大选佐治亚州选举结果共和党占优势但亚特兰大主要是民主党支持者

国产大模型陷入技术迷局与商业困境！市面所见模型主要分两类：其一为基础通用大模型，像文心一言、通义千问等大厂力作！其二则是行业专用模型，在政务、医疗、金融等细分