V
主页
脆弱的不确定性:大模型的可信度如何被操控
发布人
主题 脆弱的不确定性:大模型的可信度如何被操控 论文 Uncertainty is Fragile: Manipulating Uncertainty in Large Language Models 大纲 1. 介绍uncertainty这个领域和两种常见的衡量方法 entropy计算和conformal prediction 2. 介绍backdoor的作用和一些指标比如asr 3. 如何用backdoor来操控uncertainty 4. 实验 5. 总结 嘉宾 金明宇,罗格斯博0 phd,师从张永锋老师。主要研究方向XAI,Trustworthy AI,AI4Science,大语言模型。在AAAI,ECAI,ACL,COLM等顶级会议发表过文章。 主持人 薛博阳 香港中文大学博士生 引言 这项研究探讨了大型语言模型(LLMs)在不确定性估计方面的脆弱性,展示了攻击者如何在不改变实际输出的情况下操纵模型对其预测的信心。通过后门攻击实现这一点,该攻击根据特定触发器修改模型的输出概率分布,使其与攻击者预设的分布一致,同时保持顶级预测不变。研究发现在不同模型和触发策略中达到了100%的攻击成功率。这突出了LLM可靠性面临的重大威胁,并强调了针对此类攻击需要防御机制的必要性。
打开封面
下载高清视频
观看高清视频
视频下载器
从0开始训练1.4b中文大模型的经验分享
EMNLP2024分享会之Agent主题
EMNLP2024分享会之NER、模型微调
LLM推理加速新范式!推测解码(Speculative Decoding)最新综述
迈向可信的AI:探索安全、负责的大语言模型
EMNLP2024分享会之多模态主题
EMNLP2024分享会之模型对齐主题
EMNLP2024分享会之模型安全主题
全栈大模型微调框架LLaMA Factory:从预训练到RLHF的高效实现
Transformer模型能否进行隐式的推理?一个关于Grokking和泛化的深入探索
生成式搜索引擎能否取代检索技术?
【李宏毅】2024秋《生成式人工智能导论》教程!LLM大模型入门到进阶,比刷剧爽多了!--附带课件代码
【全网最细】逼自己一周吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,2024最新版,学完即就业!!
【NICE一期】张子殷:代码大模型综述
从零开始训练大模型
EMNLP2024分享会之模型/推理加速主题
EMNLP2024分享会之模型编辑主题
知识斗地主:解析RAG大模型中复杂的知识冲突
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI),3天学完,让你少走99%弯路!
大语言模型的知识编辑:问题,方法与挑战
鲨疯了!最适合新手入门的【LLM医疗大模型】教程:医疗大模型LLM应用现状及如何微调一个医疗大模型?我竟然一天就搞懂了!
EMNLP2024分享会之可解释性、资源与评估
FacTool: 生成人工智能中的事实检测 - 用于多任务和多领域场景的工具增强框架
2024吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI)通俗易懂,学完即就业!拿走不谢,学不会我退出IT圈!!!
2024年吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI) 全程通俗易懂,别再走弯路了,逼自己一周学完,少走99%弯路,学不会我退出IT界!
Deita: 用高质量数据在微调中“四两拨千斤”
关于LLaMA & Alpaca 微调、代码生成、RAM配置等,更多你的疑问都在这里
评估中文大模型中的幻觉
什么是扩散模型?
你的模型真的擅长数学吗?MathCheck:大模型数学推理能力的新评估范式
冒死上传!目前B站最完整的大模型微调教程,适应于所有大模型微调实战!微调|量化|部署|应用
【11月10日最新版国内直连ChatGPT4.0】免费使用教程,免翻,无任何限制!
让我们一起构建ChatGPT,用代码,拼出来
30分钟学会Qwen2.5-3B本地部署LightRAG,完胜GraphRAG!从模型部署到源码解读,带你全流程解析,速度快,效果好,落地部署更方便!!!
【Dify开源项目实战 】目前B站最详细的Dify快速入门教程,手把手教你基于Llama 3.1和OpenAI创建聊天机器人与知识库
【全878集】零基础自学AI大模型能救一个是一个,新手小白少走99%的弯路(LLM+RAG系统+GPT-4o+OpenAI)光刷完就赢麻了,通俗易懂|学完即
【包学包会】不需要高配置!6分钟教会你使用Ollama在本机运行部署llama3.1 || 大模型本地部署、LLM、
这可能是B站讲的最好的AI大模型教程,一周吃透AI大模型(LLM+RAG系统+GPT-4o+OpenAI) 让你少走99%弯路!(2024最新版)
大模型RAG企业级实战,华为大佬手把手带你构建一个完整的智能问答系统,看完教程草履虫都能自己搭建!
今天教大家ChatGPT4-GPT4o国内如何使用,官方版GPT4.0体验分享!