
麻省理工学院计算机科学与人工智能实验室(CSAIL)联合丰田研究院近日发布了一项创新的生成式 AI 技术——“可引导场景生成”(steerable scene generation),旨在增强机器人在复杂环境中的学习能力。该工具能够构建高度逼真的虚拟空间,如厨房、客厅和餐厅等室内场景,供研究人员测试机器人执行现实世界任务的表现。
这一平台基于超过4400万个3D房间数据进行训练,具备独特的“可引导性”,其核心技术是一种名为“蒙特卡洛树搜索”(Monte Carlo Tree Search, MCTS)的决策算法。通过MCTS,AI系统能够在生成场景时动态评估多种可能性,选择最优路径以达成特定目标,例如提升场景的真实感或增加物体密度。这种方法使模型在迭代过程中持续优化,逐步生成更加复杂且符合需求的环境结构。
MIT博士生、CSAIL研究员尼古拉斯・帕夫(Nicholas Pfaff)指出,这是首次将MCTS应用于场景生成领域,并将整个生成过程建模为一个“序列决策问题”。“我们不是一次性完成场景构建,而是逐步完善,每一步都朝着更理想的结果推进。”他表示,“相比传统的扩散模型,MCTS生成的场景在结构和语义层次上更为丰富。”
业内专家认为,这项研究有望解决机器人训练中长期存在的瓶颈——高质量、多样化训练数据的稀缺。亚马逊机器人应用科学家杰里米・比纳吉亚(Jeremy Binagia)评价道:“这种可引导的生成方式不仅提升了场景的物理合理性,还打开了创造更具挑战性和多样性的训练环境的大门。”
研究团队强调,该系统的最大优势在于能为工程师提供大量定制化、任务导向且贴近现实的虚拟场景。帕夫解释说:“我们的方法不仅能生成视觉上真实的环境,还能确保这些场景服务于具体的机器人任务需求,从而显著提升训练效率和泛化能力。”
目前,该项目仍处于概念验证阶段。未来,团队计划扩展支持的对象种类和环境类型,并探索使用生成式AI直接创建全新3D资产的能力,而非仅依赖预设模型库。通过不断提升虚拟环境的多样性与真实度,研究人员也希望吸引更广泛的用户群体参与,共同构建开放的数据生态,为机器人掌握更广泛的实际技能提供坚实基础。
以上就是麻省理工推出可调节的生成 AI 工具,助力机器人虚拟训练的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/34899.html
微信扫一扫
支付宝扫一扫