TAR: Text Semantic Assisted Cross-modal Image Registration Framework for Optical and SAR Images
AI总结 本文提出了一种基于文本语义辅助的跨模态图像配准框架TAR,用于光学图像与合成孔径雷达(SAR)图像的配准。该方法通过引入遥感场景和地物覆盖类型的文本语义先验,缓解了光学与SAR图像之间的模态差异,增强了跨模态特征学习能力。TAR包含多尺度视觉特征学习、文本辅助特征增强和由粗到细的密集匹配三个模块,实验表明其在大形变情况下仍能实现优于现有方法的配准性能。