RoboSemanticBench: Diagnosing Semantic Grounding in Action Prediction for VLA Models
RoboSemanticBench: 诊断 VLA 模型在动作预测中的语义基础
发表机构 * HIT(哈尔滨工业大学) ; ZGCA(中钢集团人工智能研究院) ; ZGCI(中钢集团智能计算研究所) ; WHU(武汉大学) ; HUST(华中科技大学) ; HKUST(GZ)(香港科技大学(广州)) ; BUAA(北京航空航天大学) ; ECNU(华东师范大学) ; DeepCybo
AI总结 提出 RoboSemanticBench 基准,通过多选问答任务评估 VLA 模型是否利用指令语义选择正确物体,发现模型在语义正确选择上接近随机,揭示语义理解与动作预测之间的差距。
Comments GitHub: https://github.com/ZGC-EmbodyAI/RoboSemanticBench