OpenAI大模型上身机器人,原速演示炸场!

openai模型加持的机器人,深夜来袭!

名曰Figure 01,它能听会说,动作灵活。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

OpenAI大模型上身机器人,原速演示炸场!

能和人类描述眼前看到的一切:

我在桌子上看到一个红色的苹果,沥水架上还摆放着几个盘子和一个杯子;你站在旁边,双手轻轻放在桌子上。

OpenAI大模型上身机器人,原速演示炸场!图片

听到人类说“想吃东西”,就马上递过去苹果。

OpenAI大模型上身机器人,原速演示炸场!图片

而且对于自己做的事有清楚认知,给苹果是因为这是桌上唯一能吃的东西。

还顺便把东西整理,能同时搞定两种任务。

OpenAI大模型上身机器人,原速演示炸场!图片

最关键的是,这些展示都没有加速,机器人本来的动作就这么迅速。

(也没人在后面操纵)

OpenAI大模型上身机器人,原速演示炸场!

这下网友坐不住了,立马@波士顿动力:

老伙计们,这家伙是真来劲儿了。咱得回实验室,让以前的机器人(波士顿动力)多跳点舞了。

OpenAI大模型上身机器人,原速演示炸场!图片

也有网友看在OpenAI卷完大语言模型、文生视频之后,又狙击机器人后感慨道:

这是一场激烈的竞争;与OpenAl合作,苹果可能会超越特斯拉。

但硬件方面,擎天柱看起来更美观,Figure 01仍然需要一些“整容手术”。(doge)

OpenAI大模型上身机器人,原速演示炸场!图片

接下来,我们继续来看下Figure 01的细节。

OpenAI视觉语言大模型加持

根据创始人的介绍,Figure 01通过端到端神经网络,可以和人类自如对话。

基于OpenAI提供的视觉理解和语言理解能力,它能完成快速、简单、灵巧的动作。

模型只说是一个视觉语言大模型,是否为GPT-4V不得而知。

OpenAI大模型上身机器人,原速演示炸场!图片

它还能规划动作、有短期记忆能力、用语言解释它的推理过程。

OpenAI大模型上身机器人,原速演示炸场!图片

比如对话里说“你能把它们放在那里吗?”

“它们”、“那里”这种模糊表述的理解,就体现了机器人的短期记忆能力。

它使用了OpenAI训练的视觉语言模型,机器人摄像头会以10Hz拍下画面,然后神经网络将以200Hz输出24自由度动作(手腕+手指关节角度)。

具体分工上,机器人的策略也很像人类。

可图大模型 可图大模型

可图大模型(Kolors)是快手大模型团队自研打造的文生图AI大模型

可图大模型 32 查看详情 可图大模型

复杂动作交给AI大模型,预训练模型会对图像和文本进行常识推理,给出动作计划;

简单动作如抓起塑料袋(抓哪里都可以),机器人基于已学习的视觉-动作执行策略,可以做出一些“下意识”的快速反应行动。

同时全身控制器会负责保持机身平衡、运动稳定。

OpenAI大模型上身机器人,原速演示炸场!图片

机器人的语音能力则基于一个文本-语音大模型微调而来。

OpenAI大模型上身机器人,原速演示炸场!图片

除了最先进的AI模型,Figure 01背后公司——Figure的创始人兼CEO还在推文中提到,Figure方面整合了机器人的所有关键组成。

包括电机、中间件操作系统、传感器、机械结构等,均由Figure工程师设计。

据了解,这家机器人初创公司在2周前才正式宣布和OpenAI的合作,但才13天后就带来如此重磅成果。不少人都开始期待后续合作了。

OpenAI大模型上身机器人,原速演示炸场!图片

由此,具身智能领域又有一颗新星走到了聚光灯下。

“将人形机器人带进生活”

说到Figure,这家公司创立于2022年,正如前文所言,再次引爆外界关注,就在十几天前——

官宣在新一轮融资中筹集6.75亿美元,估值冲到26亿美元,投资方几乎要集齐半个硅谷,包括微软、OpenAI、英伟达和亚马逊创始人贝佐斯等等。

更重要的是,OpenAI同时公开了与Figure更进一步合作的计划:将多模态大模型的能力扩展到机器人的感知、推理和交互上,“开发能够取代人类进行体力劳动的人形机器人”。

用现在最热的科技词汇来说,就是要一起搞具身智能。

OpenAI大模型上身机器人,原速演示炸场!图片

彼时,Figure 01的最新进展是酱婶的:

通过观看人类的示范视频,仅需10小时端到端训练,Figure 01就能学会用胶囊咖啡机泡咖啡。

OpenAI大模型上身机器人,原速演示炸场!图片

Figure与OpenAI的合作一公开,网友们就已经对未来的突破充满了期待。

OpenAI大模型上身机器人,原速演示炸场!图片

毕竟Brett Adcock,可是把“唯一的重点是以30年的视角建立Figure,以积极影响人类的未来”这样的话都写在个人主页上了。

但可能没人能想得到,仅仅两周左右的时间,新进展就来了。

如此之快,如此之远。并且还能持续泛化、扩展规模。

OpenAI大模型上身机器人,原速演示炸场!图片

值得一提的是,与炸场demo同时发布的,还有Figure的招聘信息:

我们正在将人形机器人带进生活。加入我们。

OpenAI大模型上身机器人,原速演示炸场!图片

参考链接:
[1]https://www.php.cn/link/59bbfbe0d3922ccd1d167661a26d8353
[2]https://www.php.cn/link/a3fc34dce15cda93287496c84af5203c
[3]https://www.php.cn/link/194585b5215aea447389c5fefca09c61

以上就是OpenAI大模型上身机器人,原速演示炸场!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/619211.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月11日 05:34:09
下一篇 2025年11月11日 05:40:28

相关推荐

  • Microsoft Teams如何设置访客权限 Microsoft Teams外部协作的安全管理

    首先登录Microsoft 365管理中心启用Teams访客访问功能,接着在Azure AD中配置目录范围与信息可见性限制,最后通过敏感度标签、审核日志、DLP策略及文件共享设置实施沟通与内容安全管控,实现外部协作的安全管理。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 D…

    2025年12月6日 科技
    000
  • vivo Pad3 Pro 正式登场 跑分离谱还有蓝心大模型

    中关村在线消息:vivo 旗舰新品发布会正在进行中,本场发布会第一个登场的产品是 vivo pad3 pro。新款产品上来就放出王炸,搭载天玑 9300 处理器,跑分超过 210 万,也是行业首个突破 200 万的平板电脑。在游戏测试中,在 90 帧 +hdr 高清画质下,帧率稳定一条直线,性能十分…

    2025年12月5日
    000
  • OpenAI创始人力挺脑机接口初创公司 对抗马斯克Neuralink

    8月13日,据媒体报道,openai及其ceo山姆·奥特曼(sam altman)正计划支持一家名为merge labs的脑机接口初创企业,此举被视为对特斯拉掌门人埃隆·马斯克(elon musk)旗下neuralink的正面挑战,再次点燃两位科技领袖之间的长期竞争。 知情人士透露,Merge La…

    2025年12月5日
    200
  • 0.198 超低风阻 AI 智能纯电轿车极越 07 首秀北京车展

    展览会随着新车发布、新技术展露,每一次的大型车展都是购车用户和汽车爱好者的最佳去处。本届北京车展将于4月25日开幕,极越作为高端智能汽车品牌,将携带 ” 最美 7 系 ” 极越 07 和 ai 智能纯电 suv 极越 01 双双亮相。 本届北京车展,极越以” 极越…

    2025年12月5日 硬件教程
    100
  • 马斯克找了12位帮手 OpenAI前员工反对奥特曼转型计划

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 马斯克获OpenAI前员工支持,反对公司商业化转型 据彭博社报道,十二名OpenAI前员工于当地时间周五提交了一份法庭之友文件,公开支持埃隆·马斯克,反对OpenAI首席执行官萨姆·奥特曼将公司…

    2025年12月5日
    100
  • 谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

    大模型做奥赛题游刃有余,简单的数数却屡屡翻车的原因找到了。 谷歌的一项新研究,发现大模型不会数数的原因,并不是简单的 tokenizer 所致,而是没有足够的空间来存储用于计数的向量。 数出一段话中某个单词出现的次数,这样简单的任务可以难倒许多大模型,GPT-4o、Claude 3.5 也无法幸免。…

    2025年12月5日 硬件教程
    000
  • 用 Vision Pro 实时训练机器狗!MIT 博士生开源项目火了

    vision pro 又现火爆新玩法,这回还和具身智能联动了 ~ 就像这样,MIT 小哥利用 Vision Pro 的手部追踪功能,成功实现了对机器狗的实时控制。 不仅开门这样的动作能精准 get: 也几乎没什么延时。 Demo 一出,不仅网友们大赞鹅妹子嘤,各路具身智能研究人员也嗨了。 比如这位准…

    2025年12月4日 硬件教程
    000
  • Linux下安装SQLServer2019的方法

    可以直接参考官方文档:https://www.php.cn/link/32824c14387bff0a269b11c976c1d0d0 安装SQL Server 首先,下载 SQL Server 2019 (15.x) 的 Red Hat 存储库配置文件: sudo curl -o /etc/yum…

    2025年12月4日
    000
  • Linux实现自动挂载autofs的方法详解

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 目录 实现自动挂载-autofs autofs工具简单使用 autofs配置详细说明 自动挂载资源有两种格式 优化Linux系统性能 安装Tuned 选择调整配置文件 检查系统推荐的调整配置文件…

    2025年12月4日
    000
  • Parlant— 开源的大模型AI Agent开发框架

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 千帆大模型平台 面向企业开发者的一站式大模型开发及服务运行平台 0 查看详情 Parlant是什么 parlant是开源的llm(大型语言模型)代理行为建模引擎,帮助开发者快速创建符合业务要求的…

    2025年12月4日 科技
    000
  • 张亚勤:未来会有全新的物种,它将是人类的延伸

    清华大学智能产业研究院院长张亚勤院士近期接受媒体采访,对人工智能、自动驾驶和机器人技术等领域的未来发展趋势进行了展望。 张亚勤院士认为,人工智能将沿着“信息智能>物理智能>生物智能”的路径逐步发展,最终实现通用人工智能(AGI)。他预测,信息智能的AGI将在5年内实现;物理智能AGI,例…

    2025年12月4日
    100
  • OpenAI拟30亿美元收购AI编程工具Windsurf

    据知情人士透露,openai正在商谈以约30亿美元的价格收购人工智能辅助编码工具windsurf(原名codeium)。此项交易将成为openai迄今为止最大的一笔收购案,尽管具体细节尚未敲定,谈判仍有可能会改变或终止。 报道指出,Windsurf正在与Kleiner Perkins和General…

    2025年12月4日
    000
  • 透明物体也能被机器人抓起来了,单目的那种

    机器人精准抓取透明物体难题攻克!仅需单张图像,单目视觉即可实现! 这项突破性成果由地瓜机器人和中科院自动化所等单位合作完成,其核心是名为MODEST的新型算法框架。该框架是一个多任务模型,能够同时进行透明物体的深度估计和语义分割。 MODEST作为通用抓取模型的前端模块,无需额外传感器,即可高效、灵…

    2025年12月3日 硬件教程
    000
  • 显著超越 SFT,o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

    上海交大、上海ai lab和港中文大学的研究人员推出visual-rft(视觉强化微调)开源项目,该项目仅需少量数据即可显著提升视觉语言大模型(lvlm)性能。visual-rft巧妙地将deepseek-r1的基于规则奖励的强化学习方法与openai的强化微调(rft)范式相结合,成功地将这一方法…

    2025年12月3日 硬件教程
    000
  • 2024 年全球扫地机器人出货量排名:石头小米进前五

    2024年全球智能扫地机器人市场蓬勃发展,idc最新报告显示强劲增长态势。报告指出,2024年全球智能扫地机器人出货量达2060.3万台,同比增长11.2%,销售额更是增长19.7%,达到93.1亿美元。这一增长主要归功于消费者对智能家居的日益追捧以及扫地机器人技术的持续革新。 中国厂商在全球市场表…

    2025年12月3日 硬件教程
    000
  • 科沃斯 AWE 展台亮点释出 与品牌代言人胡歌一起体验家庭清洁智慧解决方案

    awe2024将于3月14日至3月17日在上海新国际博览中心举行,以”智能科技,创享生活”为主题。科沃斯集团将展示其旗下科沃斯机器人和添可智能科技产品于e1馆。科沃斯机器人将展示多款地宝新品,全新智能清洁技术和全场景服务机器人产品,为参会者带来全新的服务机器人生活体验。 科沃…

    2025年12月3日
    000
  • AI 越聪明越不听话!新研究:最强推理模型指令遵循率仅 50%

    如果面前有两个 ai 助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选? 最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Lar…

    2025年12月3日 硬件教程
    100
  • AI运行MySQL语句的方法是什么_使用AI操作MySQL数据库指南

    AI操作MySQL需将自然语言转为SQL,依赖LLM理解用户意图并结合数据库Schema生成查询,通过API或本地模型执行。典型流程包括:用户输入自然语言指令,AI解析关键信息,匹配数据库结构,生成SQL语句(如多表JOIN、聚合查询),经语法检查与优化后,通过安全连接执行并返回结果。为确保准确性,…

    2025年12月3日 数据库
    000
  • 如何使用AI执行分区表查询_AI操作数据库分区表方法

    AI能将自然语言转化为高效分区表查询SQL,通过提供表结构、明确查询意图、生成并优化SQL,结合人工审查与反馈循环,提升查询效率与准确性,同时需防范幻觉、性能陷阱及数据安全风险。 说实话,让AI“执行”分区表查询,这个说法本身就有点误导。AI它不是个数据库客户端,它更像是个超级聪明的助手,能帮我们理…

    2025年12月3日 数据库
    000
  • 《梦幻西游》全新赛事祥瑞即将来袭,剪影图曝光

    《梦幻西游》电脑版全新赛事祥瑞曝光,11月将会和广大玩家正式亮相!你们猜猜这只祥瑞是以什么为原型做的设计,以及和梦幻接下来的什么活动有关 无涯·问知 无涯·问知,是一款基于星环大模型底座,结合个人知识库、企业知识库、法律法规、财经等多种知识源的企业级垂直领域问答产品 153 查看详情 以上就是《梦幻…

    2025年12月2日 行业动态
    000

发表回复

登录后才能评论
关注微信