arXivDaily arXiv每日学术速递 周一至周五更新

AI 大模型

视觉大模型 / VLM

视觉语言模型、视觉推理、视觉问答、图文理解和视觉 grounding。

今日/当前日期收录 1 信号源:cs.CV, cs.AI, cs.LG
2606.18101 2026-06-18 cs.AI 新提交 专题 90

Trust the Right Teacher: Quality-Aware Self-Distillation for GUI Grounding

信任正确的教师:面向GUI定位的质量感知自蒸馏

Jingyuan Huang, Zuming Huang, Yucheng Shi, Tianze Yang, Xiaoming Zhai, Wei Chu, Ninghao Liu

专题命中 视觉定位 :自蒸馏提升VLM的GUI定位能力

AI总结 提出质量感知自蒸馏方法,通过软正确性感知门控和教师概率缩放改善坐标令牌教师信号质量,提升VLM在GUI定位任务中的性能。

Comments corrected some claims