PIGEON: VLM-Driven Object Navigation via Points of Interest Selection
PIGEON: 通过兴趣点选择的VLM驱动物体导航
发表机构 * Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; Beijing Academy of Artificial Intelligence (BAAI)(北京人工智能研究院) ; Peking University(北京大学) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院)
AI总结 提出PIGEON框架,将物体导航建模为基于原始观测的稀疏决策问题,通过兴趣点(PoI)作为视觉决策单元,结合VLM选择关键点,实现零样本SOTA性能并迁移至主动具身问答。