V
主页
语言模型的训练、评测与应用|北京大学张铭教授Dlib团队
发布人
讲者及报告简介 讲者:袁野同学来自北京大学计算机学院,目前在读博士三年级,师从北京大学张铭教授。研究方向主要为大模型的训练与微调加速、大模型的评测等,同时也对结合大模型的数学自动定理证明领域感兴趣。 报告题目:语言模型的高效预训练 & 多模态模型的评测 报告简介:本次报告袁野同学将介绍最近分别发表于AAAI2024与ICLR2024的两篇工作。在AAAI2024发表的Preparing Lessons for Progressive Training on Language Models工作提出了一种渐进预训练策略的改进,能够使模型的预训练过程获得大幅加速。在ICLR2024发表的Measuring Vision-Language STEM Skills of Neural Models工作中,作者提出了一个具有挑战性的细粒度的多模态模型评测数据集。 讲者: 杨君维同学来自北京大学计算机学院,目前在读博士二年级,师从北京大学张铭教授。研究方向主要为大规模预训练模型和生物医学的交叉应用。 报告题目:大语言模型对科学发现的负面影响 报告简介: 大语言模型的强大生成能力已经使诸多科学研究从中获利,但其负面影响尚缺乏系统性地研究。本次报告中,杨君维同学将介绍如何以知识图谱为媒介,探究大语言模型对科学发现的影响。研究结果表明,对于包含三百万篇科学论文的数据库,只需要通过特定方式混入一篇由大语言模型生成的有害文章,就能有效扰乱基于该数据库构建的科学知识图谱,进而使得下游的科学发现呈现出攻击者所期望的结果。本次报告旨在通过这一现象展示大语言模型滥用和非同行评审文章滥用能带来的确切负面影响,进而强调负责任和值得信赖的科学知识发现的重要性。 讲者: 刘成武同学来自北京大学计算机学院,目前在读博士一年级,师从北京大学张铭教授。研究方向主要为结合大语言模型的自动定理证明和大语言模型的数学推理。 报告题目:搭建形式化与非形式化数学的桥梁 报告简介:在大型语言模型崛起之后,数学推理被视为通向通用人工智能的关键能力之一。形式化数学具有精确性和可由程序验证的特点,因此受到学术界的广泛关注。然而,目前形式化数学的自动化程度较低,形式化语言的表达不够灵活,导致形式化数学数据相对稀缺且专家标注成本高昂。本报告旨在介绍我们基于自动形式化的解决方案,以建立形式化与非形式化数学之间的桥梁,从而突破数据稀缺的困境。 讲者:袁境阳同学来自北京大学计算机学院,目前在读博士二年级,师从北京大学张铭教授。研究方向主要为图神经网络和动力学系统。 报告题目:带有噪声标签下的图迁移学习 报告简介:图神经网络(GNN)由于在各种图机器学习任务中表现出色而备受关注。然而,大多数基于GNN的方法都是使用含人工标签的基准数据集进行检验的,这导致在实际图学习场景中表现不佳。本次报告对这一问题进行阐述,并介绍我们的解决方案。
打开封面
下载高清视频
观看高清视频
视频下载器
大模型安全与超级对齐—清华大学黄民烈教授
7篇NeurIPS'24|香港浸会大学TMLR课题组专场:Trustworthy Machine Learning and Foundation Models
NAACL 2024杰出论文奖:解锁大语言模型中自发涌现的模块性
大模型视觉规化、量化、Text-to-SQL
17篇 NeurIPS'24| 大语言模型:价值对齐、文化理解、冲突缓解、推荐优化等
绝对通俗易懂!9小时精讲大模型预训练微调+四大多模态大模型CLIP BLIP VIT MLLM+对话机器人办公助手
【喂饭教程】Ollama+OpenWebUI部署本地大模型,畅玩上万个开源大模型~小白入门必看的保姆级教程!
ECCV24 10篇工作|3D视觉理解、雨滴消除、快速生成、模型蒸馏等
EMNLP 2024预讲会|10月19日上午场 自然语言处理应用等方向
6篇NeurIPS'24|浙江大学软件学院专场
【AI虚拟伙伴】对接本地Ollama VLM教程 图像识别多模态大模型推荐
NeurIPS'24预讲会|AI 4 Sceience 6篇工作:全局优化控制、自动化细胞分类、3D半监督对比学习等
大模型推荐系统专题-中科大数据科学实验室
年薪40W的提示词工程师需要掌握什么?吴恩达大佬1小时精讲Prompt:OpenAI调用,上下文构建,任务导向,关键词...看完就能写进简历!-大模型/人工智能
CodeGeeX:更强大的代码大模型与项目级编程助手
大模型对齐、评测和微调—王晋东 王子奇 黄杰 郑锐 刘明道 陈修元 杨恺【大模型嘉年华0104上午】
多模态模型CLIP深度讲解
ChatGLM: 智能体时代下的长文本模型探索【ChatGLM干货技术分享】
图预训练专题 浙江大学-信也科技人工智能联合实验室专场
AI时代我们该如何学习
ECCV'24 7篇工作|3D大场景生成、视频问答自动评估、手写文本生成、虚拟试穿等
6篇NeurIPS'24|大语言模型: 模拟人类信任行为、推理边界框架、偏见放大等
通过统一框架来理解和增强图神经网络
当人工智能遇到时空数据:概念、方法和应用
大模型对齐、评测和微调—白雨石 王晓智 李烜 程家乐 安晟男【大模型嘉年华0103下午】
【学霸模型】整式加减应用的10大类型题—第1讲(共3讲),助你成为学霸,灵活应用整式加减的方法技巧
14篇NeurIPS'24|机器学习与数据科学:联邦协作、图神经网络公平性、时间序列预测、对抗性推荐等
2025年五大惊人AI趋势!人工智能技术
国产AI-一口气讲清楚可灵AI免费生成内容
大规模语言模型下的代码处理综述
孙爱欣教授: 推荐系统研究现状的理解|AI 2000学者专场
Ferret-UI 2:拥有跨平台UI理解的多模态大模型
Dify实战 - 文件上传,图文理解工作流!
ChatGLM大模型应用构建和指令工程
多模态RAG #1:与包含图像的文档聊天 | 学习如何使用 CLIP model 构建多模式 RAG 系统
【NeurIPS 2022 预讲】能量函数指导的随机微分方程和在图到图生成任务的应用
WAIC 2024 | GLM-新一代基座大模型技术前沿与产业应用论坛 Part1
可信机器学习专题(二)伊利诺伊大学安全学习实验室专场
可信机器学习专题(一)-伊利诺伊大学安全学习实验室
GLM-130B:开源的双语千亿预训练模型——可在4张3090或8张1080Ti上使用的千亿模型