2605.11996
2026-05-13
cs.AI
BadSKP: Backdoor Attacks on Knowledge Graph-Enhanced LLMs with Soft Prompts
Xiaoting Lyu, Yufei Han, Hangwei Qian, Haoyuan Yu, Xiang Ao, Bin Wang, Chenxu Wang, Xiaobo Ma, Wei Wang
发表机构
*
Ministry of Education Key Lab for Intelligent Networks and Network Security(教育部长智能网络与网络安全重点实验室)
;
Xi’an Jiaotong University(西安交通大学)
;
INRIA(法国国家信息与自动化技术研究院)
;
CFAR, A*STAR(新加坡A*STAR机构)
;
Beijing Key Laboratory of Security and Privacy in Intelligent Transportation(北京智能交通安全与隐私重点实验室)
;
Beijing Jiaotong University(北京交通大学)
;
Institute of Computing Technology, Chinese Academy of Sciences(中国科学院计算技术研究所)
;
School of Cyber Engineering, Xi’an University of Electronic Science and Technology(西安电子科技大学网络安全工程学院)
;
Ministry of Education Key Lab for Intelligent Networks and Network Security at Xi’an Jiaotong University(西安交通大学教育部长智能网络与网络安全重点实验室)
AI总结
本文研究了针对知识图谱增强大语言模型(KG-LLMs)的后门攻击问题,特别是针对通过图神经网络将知识图谱编码为软提示的新型架构。该架构引入了图条件通道,使得现有针对文本通道的后门攻击效果大打折扣。为此,作者提出BadSKP攻击方法,通过多阶段优化策略操纵图表示,诱导软提示生成对抗性语义,实验表明该方法在多种设置下均能有效攻击目标模型,而传统仅针对文本的攻击则效果有限。