grape
-
把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源
GRAPE:通过偏好对齐提升机器人策略泛化能力 aixiv专栏持续报道全球顶尖ai研究成果。本文介绍一篇来自北卡罗来纳大学教堂山分校、华盛顿大学及芝加哥大学的研究,该研究提出了一种名为grape的新算法,显著提升了视觉-语言-动作(vla)模型的泛化能力。 ☞☞☞AI 智能聊天, 问答助手, AI …
*本站广告为第三方投放,如发生纠纷,请向本站索取第三方联系方式沟通
GRAPE:通过偏好对齐提升机器人策略泛化能力 aixiv专栏持续报道全球顶尖ai研究成果。本文介绍一篇来自北卡罗来纳大学教堂山分校、华盛顿大学及芝加哥大学的研究,该研究提出了一种名为grape的新算法,显著提升了视觉-语言-动作(vla)模型的泛化能力。 ☞☞☞AI 智能聊天, 问答助手, AI …