2511.20002
2026-06-18
cs.CV
cs.AI
cs.CR
版本更新
专题 85
Semantic Router: On the Feasibility of Hijacking MLLMs via a Single Adversarial Perturbation
语义路由器:通过单一对抗扰动劫持多模态大语言模型的可行性研究
Changyue Li, Jiaying Li, Youliang Yuan, Jiaming He, Zhicong Huang, Pinjia He
专题命中
越狱攻击
:提出语义感知通用扰动劫持MLLM,属于越狱攻击。
AI总结
提出语义感知通用扰动(SAUP),作为语义路由器同时劫持多个无状态决策,通过理论分析和SORT优化策略实现,在Qwen上对五个目标达到66%攻击成功率。