GIVE: Grounding Human Gestures in Vision-Language-Action Models
GIVE:在视觉-语言-动作模型中接地人类手势
发表机构 * MARS Lab, Nanyang Technological University(南洋理工大学MARS实验室)
AI总结 针对VLA模型忽略手势导致意图理解不准的问题,提出GIVE方法,通过视觉和语义双路径增强手势理解,在真实HRI实验中目标识别准确率提升40%,任务成功率提升80%。
Comments Project page: https://luis-cloud-sg.github.io/GIVE-project/