Reinforcing VLAs in Task-Agnostic World Models
在任务无关的世界模型中强化视觉-语言-动作
发表机构 * Microsoft Research Asia(微软亚洲研究院) ; Nanjing University(南京大学) ; University of Illinois at Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Wuhan University(武汉大学) ; University of Technology Sydney(悉尼科技大学) ; Tsinghua University(清华大学)
AI总结 本文提出RAW-Dream方法,通过分离世界模型学习与下游任务依赖,利用预训练的世界模型和现成的视觉-语言模型,实现零样本推理,从而在无需任务特定数据的情况下提高VLA适应性。