ELVA: Exploring Ranking-Driven Universal Multimodal Retrieval
ELVA:探索排序驱动的通用多模态检索
发表机构 * National Key Laboratory of Human-Machine Hybrid Augmented Intelligence(人机混合增强智能国家级重点实验室) ; Institute of Artificial Intelligence and Robotics(人工智能与机器人研究院) ; MiLM Plus ; Xiaomi Inc(小米公司) ; Zhongguancun Academy(中关村学院) ; Beijing, China(北京市)
专题命中 跨模态检索 :提出ELVA框架用于通用多模态检索
AI总结 提出ELVA框架,通过基于规则的强化学习缓解对比学习中的粒度盲视问题,在通用多模态检索中实现排序优化,并在新基准MRBench上提升13.1%。
Comments Accepted by ECCV 2026