Attend to Evidence: Evidence-Anchored Spatial Attention Supervision for Multimodal RLVR
关注证据:面向多模态RLVR的证据锚定空间注意力监督
发表机构 * Harbin Institute of Technology(哈尔滨工业大学) ; Zhongguancun Academy(中关村学院) ; Zhongguancun Institute of Artificial Intelligence(中关村人工智能研究院) ; Nankai University(南开大学) ; Shanghai Jiaotong University(上海交通大学) ; Zhejiang University(浙江大学)
AI总结 提出EASE方法,通过将标注证据区域转化为平滑视觉标记目标,在多模态强化学习训练中引导响应到图像的注意力,从而提升视觉语言模型在感知、幻觉、视觉数学和多模态推理基准上的性能。