Turning Adaptation into Assets: Cross-Domain Bridging for Online Vision-Language Navigation
将适应转化为资产:面向在线视觉语言导航的跨域桥接
发表机构 * School of Computer Science, Peking University, Beijing, China(北京大学计算机科学系) ; Peng Cheng Laboratory, Shenzhen, China(鹏城实验室) ; School of Electronics, Peking University, Beijing, China(北京大学电子学院)
AI总结 本文研究了视觉语言导航(VLN)代理在非平稳环境下的适应问题,提出了一种新的测试时适应(TTA)框架IDEA,通过将在线适应转化为知识资产的积累与组合,有效解决了现有方法中的灾难性遗忘和负迁移问题。IDEA引入了基于Fisher指导的软提示优化机制,并结合领域坐标构建动态资产库,利用历史知识构建跨领域桥梁,实现无需训练的适应。实验表明,该方法在多个基准测试中表现优异,展示了其在实际应用中的有效性。
Comments Accepted by ICML 2026