PanoWorld: Towards Spatial Supersensing in 360$^\circ$ Panorama World
PanoWorld:迈向360度全景世界的空间超感知
发表机构 * Zhejiang University(浙江大学) ; University of California, San Diego(加州大学圣地亚哥分校) ; University of California, Irvine(加州大学伊维特分校) ; The University of Hong Kong(香港大学)
AI总结 本文提出PanoWorld,通过构建全景原生理解能力,解决传统多模态大模型在空间感知上的不足,通过全景空间交叉注意力机制提升3D空间推理能力,并建立PanoSpace-Bench基准测试,验证了全景原生监督的有效性。
Comments Project page: https://wcpcp.github.io/PanoWorld