E-VAds: An E-commerce Short Videos Understanding Benchmark for MLLMs
E-VAds:面向多模态大语言模型的电商短视频理解基准
发表机构 * Alimama Tech, Taobao \& Tmail Group of Alibaba ; Huazhong University of Science ; Vin University
专题命中 视频理解 :电商短视频理解基准,评估多模态大模型视频理解能力。
AI总结 提出电商短视频理解基准E-VAds,通过多模态信息密度评估框架量化领域复杂性,并构建多智能体生成的问答数据集,最后开发基于强化学习的推理模型E-VAds-R1,在商业意图推理上实现109.2%的性能提升。
Comments Accepted by ICML2026