grape

把RLHF带给VLA模型！通过偏好对齐来优化机器人策略，代码已开源

GRAPE：通过偏好对齐提升机器人策略泛化能力 aixiv专栏持续报道全球顶尖ai研究成果。本文介绍一篇来自北卡罗来纳大学教堂山分校、华盛顿大学及芝加哥大学的研究，该研究提出了一种名为grape的新算法，显著提升了视觉-语言-动作（vla）模型的泛化能力。 ☞☞☞AI 智能聊天, 问答助手, AI …

程序猿
2025年11月6日 • 用户投稿
0000

关注微信