Less Redundancy: Boosting Practicality of Vision Language Model in Walking Assistants
AI总结 本文研究如何提升视觉语言模型在导盲系统中的实用性,针对现有模型输出冗余、缺乏环境风险主动评估的问题,提出了一种减少冗余的行走辅助模型WalkVLM-LR。该模型通过引入基于人类偏好的奖励函数优化输出简洁性与准确性,并结合环境感知判别器提升风险评估效率,实验表明其在输出简洁性和时间冗余度方面均优于现有方法。
Comments ICASSP 2026 Best Industry Paper