My App
PaperWam

World Action Models are Zero-shot Policies

VLA方法对未见的物理动作进行泛化存在困难, 通过共同预测视频和动作, WAMs继承了世界物理的先验知识, 从而实现:1) 从多样化且不重复的数据中有效学习; 2) 开放世界的泛化能力; 3) 仅使用视频数据进行跨实体学习; 4) 对新机器人的少量样本适应.

Loading...