特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

沉寂了几个月的特斯拉人形机器人擎天柱(Optimus)终于有了新的动态。记得上一次看到它还是在特斯拉股东大会上,当时 Optimus 展示了自由行走、灵活抓取放下物体等技能。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

特斯拉 Optimus 在今天再次升级。现在,它具备了自主物体分类的能力。其中最引人注目的是完全端到端训练的神经网络:输入视频,输出控制。这类似于特斯拉自动驾驶 FSD V12 开发中的神经网络训练,能够处理所有输入信号并输出驾驶决策

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

 不禁要问,如何做到的呢?

Optimus具备了自我校准手臂和腿部的能力,只需使用视觉和关节位置编码器,它就能够准确定位自己的肢体在空间中的位置

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

Optimus具备精确的校准能力,使其能够更高效地学习各种任务。它仅仅通过视觉输入,在其神经网络上完全实现了on-board运行

这样一来,Optimus 可以完全自主地将物体按颜色进行分类。

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

即使有人干扰,Optimus仍然能够准确地按照颜色对物体进行分类

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

Optimus 还展示了自主纠正(将歪倒的物体摆正)的行为能力。

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

经过训练后,它还能执行新任务,比如将分类好的物体打乱。

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

经过了一整天的「工作」,是时候伸展一下、做个双手合十吧。

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

 团队资深软件工程师 Julian Ibarz 表示,「非常高兴分享团队在过去几个月中取得的进展。现在 Optimus 可以完成长期任务,比如完全以任务无关的方式自动对物体进行分类。只需要收集更多数据,则无需更改任何代码就可以训练新的复杂任务。」

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

马斯克也确认了这一「进展」

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

网友在震惊之余,也提出了一些问题,比如是否可以输入 prompt 让 Optimus 来执行任务?答案是肯定的,视频中使用相同的网络来执行分类或取消分类任务,只需要告诉 Optimus 你想做什么就行了。

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

Optimus 的「前世今生」

Optimus 并非一开始就是一个实体机器人的,它从「Tesla Bot」这样一个机器人通用计划慢慢孵化。

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

2021 年马斯克在「特斯拉 AI 日」上展示了 Tesla Bot 的大致形态。

甚至在 Tesla Bot 动作展示时,是由工作人员穿着特制的紧身服装,扮成机器人的模样表演了一段舞蹈。但就是这样一个想法,逐渐扎根,并走向现实,一次次突破给人们惊喜。

一年后的「特斯拉 AI 日」上,曾经由人扮演的 Tesla Bot 变为了机器人 Optimus。

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

2022 年的「特斯拉 AI 日」上,Optimus 与人们互相打招呼

Optimus 刚亮相的时候已经能够搬运箱子、给花浇水并在工厂里工作。然而,这并不是 Optimus 的最终目标。Optimus 的目标是成为一台拥有「大脑」的人形机器人

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

Optimus 在特斯拉超级工厂里工作

马斯克表示,当时这个机器人设计出来只用了半年时间,未来成型的样子有很多值得期待的地方。

在2023年的特斯拉股东大会上,Optimus的表现更加出色,步伐更加顺畅,动作也更加熟练

特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力

优化者可以灵活地抓取和放下物体

而现在,Optimus 已经向着它的目标不断前进,拥有「大脑」的路程也越走越清晰。下一次它将如何进化,我们拭目以待。

以上就是特斯拉人形机器人进一步进化:通过视觉自主分类实现瑜伽能力的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/491351.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 15:53:31
下一篇 2025年11月8日 15:55:00

相关推荐

  • Golang如何安全释放资源避免错误

    Go语言需手动释放文件句柄等资源,defer语句可确保函数退出前调用关闭操作;2. defer注册时即对参数求值,循环中直接使用变量可能导致预期外行为。 在Go语言中,安全释放资源是编写健壮程序的关键。由于Go具备垃圾回收机制,很多人误以为不需要关心资源管理,但实际上像文件句柄、网络连接、数据库连接…

    2025年12月16日
    000
  • Go语言中创建HTML表单模板:App Engine环境下的实践

    本教程将详细介绍在go语言中如何创建和使用html表单模板,特别是在app engine等文件系统受限的环境下。通过将html内容直接嵌入为字符串,并结合`html/template`包进行解析和渲染,开发者可以高效地构建动态网页,无需依赖文件系统,确保应用的灵活性和部署的便捷性。 Go语言模板引擎…

    2025年12月16日
    000
  • 在Go语言中设置函数参数类型

    本文旨在帮助Go语言初学者理解如何在Go函数中正确定义参数类型和返回值类型。通过一个简单的加法函数示例,详细讲解了Go语言中参数类型声明的两种方式,并强调了类型声明的重要性。此外,还推荐了官方的Go语言教程,帮助读者更深入地学习Go语言。 在Go语言中,定义函数时必须明确指定参数的类型和返回值类型。…

    2025年12月16日
    000
  • 构建健壮的Go语言Socket Echo服务器:从零到多客户端支持

    本文详细探讨了go语言中构建socket echo服务器的关键技术与常见陷阱。我们将从基础的net包使用出发,逐步解决c.read()阻塞行为、io.eof处理、sync.waitgroup正确传参以及如何高效支持多客户端连接等问题,最终提供一个功能完善、代码健壮的go语言echo服务器实现。 1.…

    2025年12月16日
    000
  • 使用 wxWidgets 和 Go 构建跨平台 GUI 应用程序

    本文档旨在指导开发者如何在 Go 语言中使用 wxWidgets 库构建跨平台的图形用户界面 (GUI) 应用程序。由于 `wxGo` 项目可能已停止维护,本文将介绍如何通过 Git 获取源码并使用 `make install` 命令进行编译安装,并提供使用示例。 环境准备 在开始之前,请确保已安装…

    2025年12月16日
    000
  • Go语言中unexpected EOF错误解析与调试

    本文旨在深入解析go语言中常见的`syntax error: unexpected eof`错误。该错误通常指示编译器在文件末尾遇到了非预期的终止,其根源往往是代码结构中的括号不匹配,例如缺少闭合的花括号`}`。文章将结合具体的json序列化和文件写入场景,演示如何识别、诊断并修正这类语法错误,并提…

    2025年12月16日
    000
  • 现代Go语言程序编译与运行指南

    本文旨在为go语言初学者提供一份现代化的程序编译与运行指南,纠正因遵循过时教程而产生的常见问题。我们将详细讲解go环境的正确配置,包括`path`环境变量的设置,以及如何使用go官方提供的`go`命令(如`go run`和`go build`)来高效地编译和执行go程序,同时提醒注意代码编写规范和官…

    2025年12月16日
    000
  • Golang如何开发事件倒计时功能

    Go语言实现事件倒计时需计算当前时间与目标时间差,使用time包获取差值并格式化输出天、时、分、秒,通过for循环结合time.Sleep或time.Ticker每秒更新,适用于命令行或Web服务场景;在Web中可结合HTTP服务器和Goroutine提供JSON接口返回倒计时数据,支持多用户访问。…

    2025年12月16日
    000
  • 如何在Golang中使用sync.WaitGroup等待并发完成

    答案:sync.WaitGroup用于等待一组goroutine完成,通过Add增加计数,Done减少计数,Wait阻塞直至计数归零。示例中启动5个worker,主协程等待全部完成。 在Golang中,sync.WaitGroup 是一种常用的同步机制,用于等待一组并发的goroutine执行完成。…

    2025年12月16日
    000
  • 如何在Golang中使用encoding/csv处理CSV文件

    答案:Go语言的encoding/csv包可读写CSV文件,支持自定义分隔符。使用csv.NewReader读取数据,ReadAll()适合小文件,大文件应逐行Read;csv.NewWriter写入需调用Flush()确保数据保存;设置Comma字段可更换分隔符;自动处理含逗号、引号的字段。 在G…

    2025年12月16日
    000
  • 如何在Golang中获取字段是否可设置

    要判断Golang结构体字段是否可设置,需传入指针并调用reflect.Value的CanSet()方法。示例中,即使导出字段Name,若未传指针,CanSet仍返回false;传入指针并解引用后,Name可设置为true,age因未导出仍为false。完整逻辑包括:检查是否为指向结构体的指针、字段…

    2025年12月16日
    000
  • 如何在Golang中进行错误包装

    使用fmt.Errorf配合%w可包装错误并保留原始信息,通过errors.Unwrap、Is和As能提取或判断错误链中的具体错误,支持多层上下文添加与精准处理。 在Go语言中,错误包装(Error Wrapping)是一种将底层错误信息保留并附加更多上下文的方式,使得调用者既能知道发生了什么,也能…

    2025年12月16日
    000
  • Golang如何使用errors.New创建错误

    errors.New 是Go语言中创建简单错误的基本方式,适用于仅需返回固定错误消息的场景。2. 使用前需导入 errors 包,函数接收字符串参数并返回 error 接口实例。3. 示例中 divide 函数用 errors.New(“division by zero”) …

    2025年12月16日
    000
  • Go与C++通过SWIG集成:处理std::string参数的现代方法

    本文详细介绍了如何利用最新go和swig版本,高效地在#%#$#%@%@%$#%$#%#%#$%@_6d505fe3df0aaea8c++a28ae0d78adbd51中调用c++函数并传递`std::string`参数。核心在于采用`go build`自动化编译流程,并利用c++侧的`const …

    2025年12月16日
    000
  • Go语言中值到其Go语法字面量表示的转换

    本文详细介绍了如何在Go语言中将任意Go值(包括字符串、数字、复杂类型、结构体等)转换为其对应的Go语法字面量表示。通过利用`fmt.Sprintf`函数的`%#v`格式化动词,开发者可以高效且准确地生成符合Go语言规范的字面量字符串,这在代码生成、调试输出或需要反射性表示Go值的场景中尤为实用。 …

    2025年12月16日
    000
  • Go语言中append操作与字符串拼接的复杂度分析及优化策略

    本文旨在深入探讨Go语言中`append`函数和字符串拼接操作的复杂度问题。通过分析切片和字符串的底层实现机制,揭示了`append`操作在不同情况下的时间复杂度,以及字符串拼接操作的性能瓶颈。同时,提供了针对性的优化建议,帮助开发者编写更高效的Go代码。 切片(Slice)的append操作复杂度…

    2025年12月16日
    000
  • Go语言:获取变量类型字符串的两种实用方法

    本文深入探讨了go语言中获取变量类型并以字符串形式输出的两种主要方法。首先介绍如何利用`fmt.printf`函数的`%t`格式化动词进行快速打印,适用于调试和日志记录。随后,详细阐述了如何借助`reflect`包的`typeof`函数来编程获取变量的类型字符串,包括`string()`和`name…

    2025年12月16日
    000
  • Go语言中HTTP 204 No Content响应的实现指南

    本文详细介绍了如何在go语言的`net/http`包中发送http 204 no content响应。它阐明了204状态码的用途,并演示了如何通过调用`w.writeheader(http.statusnocontent)`在http处理函数中实现这一功能,确保在不返回任何响应体的情况下正确设置ht…

    2025年12月16日
    000
  • 深入理解Go语言的init函数:多重定义与执行机制

    go语言的`init`函数用于包初始化,允许在同一包内定义多个,它们在程序启动前自动执行且顺序不确定。这种多重定义提升了代码局部性与可读性。`init`函数不可被显式调用或引用,这是为了维护go语言严格的包初始化顺序和依赖关系,防止因手动调用而破坏其执行保障。 Go语言中的init函数概览 在Go语…

    2025年12月16日
    000
  • Go语言:使用fmt.Scan向切片中读取多个输入值

    `fmt.scan`函数可以从标准输入读取空格分隔的值到提供的变量中。当需要将多个输入值动态地读取到一个go切片(slice)中时,直接使用`fmt.scan`的变长参数形式并不直观。本教程将详细介绍如何通过结合`for`循环,高效且优雅地实现`fmt.scan`向预定义大小的切片中读取多个数据,并…

    2025年12月16日
    000

发表回复

登录后才能评论
关注微信