幻觉？马斯克TruthGPT也搞不定！OpenAI联合创始人直言很复杂

程序猿 • 2025年11月9日 17:20:18 • 科技 • 阅读 0

上个月，马斯克疯狂呼吁叫停超级AI研发6个月。

还没等多久，老马就坐不住了，直接官宣推出一个名为TruthGPT的AI平台。

马斯克曾表示，TruthGPT将是一个「最大的求真人工智能」，它将试图理解宇宙的本质。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

他强调，一个关心理解宇宙的人工智能不太可能灭绝人类，因为我们是宇宙中有趣的一部分。

然而，「幻觉」，到现在还没有哪个语言模型能够搞定。

最近，OpenAI联合创始人便解释为什么TruthGPT的远大理想的实现是如此地困难。

TruthGPT理想是泡沫？

马斯克的X.AI想要建立的TruthGPT，是一种诚实的语言模型。

这么做，直接将矛头对准ChatGPT。

因为，此前，像ChatGPT这样的AI系统经常产生错误输出等经典幻觉案例，甚至支持某些政治信仰的报道。

虽然ChatGPT可以让用户更多控制语言模型去解决问题，但「幻觉」仍然是OpenAI、谷歌以及未来马斯克的人工智能公司必须处理的核心问题。

OpenAI联合创始人兼研究员John Schulman在他的演讲「RL和Truthfulness – Towards TruthGPT」中讨论了这些挑战以及如何应对这些挑战。

为啥有「幻觉」？

根据Schulman的说法，幻觉大致可以分为两种类型：

1. 「模式完成行为」，即语言模型无法表达自己的不确定性，无法质疑提示中的前提，或者继续之前犯的错误。

2. 模型猜测错误。

由于语言模型代表一种知识图谱，其中包含来自其自身网络中训练数据的事实，因此微调可以理解为学习一个函数，该函数在该知识图谱上运行并输出token预测。

例如，微调数据集可能包含「星球大战的类型是什么？」这个问题，以及答案「科幻」。

如果这些信息已经在原始训练数据中，即它是知识图谱的一部分，那么模型不会学习新信息，而是学习一种行为——输出正确答案。这种微调也被称为「行为克隆」。

但问题是，如果问题是关于「Han Solo的衍生电影的名字是什么」出现在微调数据集中。

但如果答案「Solo」不是原始训练数据集的一部分（也不是知识图谱的一部分），即使网络不知道答案，它也会学习回答。

使用实际上正确但不在知识图谱中的答案进行微调，从而教会网络编造答案——即产生「幻觉」。相反，用不正确的答案进行训练会导致网络隐瞒信息。

因此，理想情况下，行为克隆应始终基于网络知识，但创建或评估数据集的人类工作者来说，通常不知道这种知识，例如指令调优。

根据Schulman的说法，当其他模型创建微调数据集时也存在这个问题，就像羊驼公式的情况一样。

他预测，具有较小知识图谱的较小网络，不仅会学会使用ChatGPT的输出给出答案和遵循指令，而且学会更频繁地产生幻觉。

OpenAI如何打击幻觉？

首先，对于简单的问题来说，语言模型大部分情况下能预测自己是否知道答案，还能表达不确定性。

因此，Schulman表示，微调数据集的时候，必须得让模型学会怎么表达不确定、怎么应对前提被更改的情况，以及错误被承认的情况。

要把这些情况的实例喂给模型，让它们学习。

但是模型在时机方面还是欠练，也就是说，它们并不知道该何时执行这些操作。

Schulman表示，这就是强化学习（RL）该出场的地方了。比如，基于人类反馈的强化学习（Reinforcement Learning with Human Feedback，RLHF）。

应用RL，模型就可以学习「行为边界」，学会何时做出何种行为。

而另一个难题，则是检索和引用来源的能力。

问题在于，有了复制行为的能力和RLHF，为什么ChatGPT还会产生幻觉？

原因在于问题本身的难易。

虽然上述方法对于简短的问题和答案效果不错，但对于ChatGPT中常见的长格式设置就会出现其他问题了。

一方面，完全错误的答案也不太可能，大部分情况都是错的和对的混在一起。

在极端情况下，可能就是100行代码中的一个错误而已。

在其他情况下，这些信息在传统意义上并不能说是错的，而是有误导性的。因此，在像ChatGPT这样的系统中，人们很难根据信息量或者正确性来衡量输出的质量。

但这种衡量对于旨在训练复杂行为边界的RL算法却非常重要。

目前，OpenAI依托于RLHF的基于排名的奖励模型，该模型能够预测它认为两个答案中哪个更好，但不会给出有效的信号来明确哪个答案好了多少、信息量大了多少或正确了多少。

Schulman表示，它缺乏向模型提供反馈以学习精细行为边界的能力。而这种精细的行为边界，才是有可能解决幻觉的道路。

此外，此过程还会因为RLHF标记过程中的人为出错而变得更加复杂。

因此，虽然Schulman将RL视作减少幻觉的重要方式之一，但他认为仍然存在许多还没解决的问题。

除了前面提到的奖励模型究竟需要什么样子才能引导正确的行为之外，RLHF目前仅依赖于人类的判准。

这可能会使知识的生成变得更加困难。因为对未来的预测有时会导致不那么令人信服的表述。

然而，Schulman认为，知识的生成是语言模型的下一个重要步骤，同时，他认为对未来的预测和给出推理规则等问题的理论构建，是亟待解决的下一类开放性问题。

Schulman说，一种可能的解决方案是，用其他AI模型来训练语言模型。

OpenAI也认为，这种方法对于AI对齐来说，很有意义。

ChatGPT架构师

作为ChatGPT架构师，John Schulman早在2015年还在读博士学位的他，就加入OpenAI成为联合创始人之一。

在一次采访中，Schulman解释了自己加入OpenAI的原因：

我想做人工智能方面的研究，我认为openai这家公司的使命雄心勃勃，并且致力打造通用人工智能。

尽管，在当时谈论AGI似乎有些疯狂，但我认为开始考虑它是合理的，我希望在一个地方谈论AGI是可以接受的。

另外，据Schulman透露，OpenAI将人类反馈强化学习这一方法 (RLHF)引入ChatGPT的想法可以追溯到17年了。

当时，也是OpenAI的成员，曾发表了一篇论文「从人类偏好中进行深度强化学习」就提到了这一方法。

论文地址：https://arxiv.org/pdf/1706.03741.pdf

OpenAI Codex

可以生成十多种编程语言的工作代码，基于 OpenAI GPT-3 的自然语言处理模型

57 查看详情

OpenAI安全团队之所以致力于这项工作，是因为想让自己的模型符合人类的偏好ーー试图让模型真正倾听人类意见，并试图做人类想做的事情。

在GPT-3完成训练的时候，然后Schulman决定加入这股潮流，因为他看到了整个研究方向的潜力。

当被问到第一次使用ChatGPT时，第一反应是什么的时候，Schulman的话语中透露着「无感」。

还记得去年ChatGPT横空出世，让许多人瞬间炸脑。

而在OpenAI内部没有人对ChatGPT感到兴奋。因为发布的ChatGPT是一个基于GPT-3.5较弱的模型，那时候同事们在玩转GPT-4了。

所以在那个时候，OpenAI没有人对ChatGPT感到兴奋，因为有这么一个更强大，更聪明的模型已经被训练过了。

对于未来人工智能下一前沿领域看法，Schulman称，AI在更艰难的任务上不断进步，然后，问题就来了，人类应该做些什么，在哪些任务下，人类可以在大模型帮助下有更大影响力，做更多的工作。

以上就是幻觉？马斯克TruthGPT也搞不定！OpenAI联合创始人直言很复杂的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/545352.html

chatgpt 模型马斯克

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

微软 Bing Chat 不再“吝啬”，字数限制放宽至 4000

上一篇 2025年11月9日 17:19:53

别担心，ChatGPT不可能裁掉程序员

下一篇 2025年11月9日 17:20:56

好文分享

ai做html怎么运行_AI生成html运行步骤【教程】

答案是使用AI生成HTML代码后，将其保存为.html文件并用浏览器打开即可运行。具体步骤为：1. 在AI工具中输入需求生成HTML代码；2. 将代码复制到文本编辑器并另存为index.html，编码选UTF-8，类型选“所有文件”；3. 双击该文件用浏览器打开，若无法正常显示需检查文件后缀、编码及…

程序猿
2025年12月23日
0000
html的盒模型详解

这次给大家带来html的盒模型详解，使用html盒模型的注意事项有哪些，下面就是实战案例，一起来看一下。 1.1. 盒的内容区的尺寸— content width和content height —取决于几个因素： –生成该盒的元素是否设置了’width’或&#82…

程序猿
好文分享 2025年12月21日
0000
好文分享

p5.js中类方法声明的语法解析与常见错误修复指南

本文旨在解决从java processing迁移至p5.js时常见的语法错误，特别是类内部方法声明不当引发的问题。我们将深入探讨javascript中全局函数与类方法声明的语法差异，提供清晰的示例代码，并指导如何识别和修复“unexpected token”及“declaration or stat…

程序猿
2025年12月21日
0000
好文分享

p5.js中类方法声明的语法修正与迁移指南

本文深入探讨了将Processing/Java代码转换为p5.js时，因JavaScript类方法声明语法差异而引发的常见错误。我们将重点解析`Unexpected token`和`Declaration or statement expected`等错误信息，明确全局函数与类成员方法在JavaSc…

程序猿
2025年12月21日
0000
好文分享

TypeScript泛型函数中复杂对象结构类型推断的精确控制

本文探讨了在typescript中处理复杂嵌套对象结构时，如何为泛型函数实现精确的类型推断。通过一个具体的汽车品牌和车型数据场景，我们分析了`object.values`等操作可能导致类型信息丢失的问题。核心解决方案是利用映射类型（mapped types）重构数据结构，以显式地建立泛型键与对应值之…

程序猿
2025年12月21日
0000
好文分享

解决 ChatGPT 扩展选择器失效问题：一个实战教程

本文旨在帮助开发者解决 ChatGPT 网页更新导致扩展选择器失效的问题。通过分析问题原因，提供利用开发者工具查找新选择器的方法，并展示了使用 getElementsByClassName() 替代 querySelector() 的解决方案，以确保扩展功能在 ChatGPT 最新版本中正常运行。 …

程序猿
2025年12月20日
0000
好文分享

ChatGPT 扩展失效：定位新版选择器并修复

本文旨在帮助开发者解决因 ChatGPT 网页更新导致扩展失效的问题。通过分析失效原因，提供利用开发者工具定位新版选择器的实用方法，并给出示例代码，帮助开发者快速修复扩展，恢复其功能。当 ChatGPT 网页更新时，依赖于特定 CSS 选择器的扩展程序可能会失效。这通常是因为网页结构的改变导致原有…

程序猿
2025年12月20日
0000
好文分享

ChatGPT 扩展失效？定位新版选择器的实用指南

本文旨在帮助开发者解决因 ChatGPT 网页更新导致扩展失效的问题。重点讲解如何定位新版 ChatGPT 网页中的目标元素，并提供使用 getElementsByClassName() 方法的示例代码，帮助开发者快速修复和更新扩展，使其重新适配新版 ChatGPT 网页。 ChatGPT 网页频繁…

程序猿
2025年12月20日
0000
好文分享

ChatGPT 扩展插件选择器失效问题排查与解决方案

本文旨在帮助开发者解决 ChatGPT 扩展插件因页面更新导致选择器失效的问题。通过分析页面结构变化，提供使用 getElementsByClassName() 方法替代 querySelector() 的解决方案，并提供在不同浏览器环境下调整选择器的思路，确保扩展插件的稳定运行。由于 ChatG…

程序猿
2025年12月20日
0000
好文分享

应对ChatGPT界面更新：浏览器扩展选择器失效的定位与修复

本文针对ChatGPT界面更新导致浏览器扩展选择器失效的问题，提供了一套定位与修复策略。核心在于利用浏览器开发者工具识别新的DOM结构和类名，并建议从不稳定的querySelector转向更适合动态UI的getElementsByClassName等方法，以确保扩展的稳定运行。在开发浏览器扩展时，…

程序猿
2025年12月20日
0000
好文分享

LINE Bot 多消息类型回复：文本与贴图的组合发送指南

本文旨在解决 LINE Bot 开发中，通过 Messaging API 组合发送文本消息和贴图时遇到的 400 Bad Request 错误。核心问题在于对同一 replyToken 进行多次 replyMessage 调用，而正确的做法是利用 API 支持在单次调用中发送一个消息数组，从而实现文…

程序猿
2025年12月20日
0000
好文分享

使用LINE Bot与OpenAI API发送文本和贴图的完整教程

本文详细介绍了如何在LINE Bot中集成OpenAI API生成文本回复，并在此基础上发送LINE贴图。核心挑战在于LINE Messaging API的replyToken通常只能使用一次，导致连续发送文本和贴图时出现400错误。解决方案是利用API支持一次性发送多条消息的特性，将文本和贴图消息…

程序猿
2025年12月20日
0000
好文分享

优化OpenAI API：解决GPT应用中意外代码生成问题

本教程旨在解决使用OpenAI GPT-3.5 API（如text-davinci-003）时，模型意外生成无关代码的问题。文章强调了选择更适合代码生成任务的模型（如gpt-3.5-turbo或gpt-4）的重要性，并深入探讨了通过优化提示词（Prompt Engineering）来提升模型响应质量…

程序猿
2025年12月20日
2000
好文分享

解决 Next.js API 路由无法访问 Azure 云函数的问题

第一段引用上面的摘要：本文旨在帮助开发者解决 Next.js API 路由无法访问 Microsoft Azure 云函数的问题。主要原因通常是由于 process.env.VERCEL_URL 环境变量配置不正确，导致 Next.js 应用尝试通过 IPv6 的本地回环地址 ::1 连接云函数，…

程序猿
2025年12月20日
0000
好文分享

在Next.js API路由中高效传输OpenAI流式响应到客户端

本文详细介绍了如何在Next.js应用的API路由中，以流式传输的方式将OpenAI的响应发送给客户端，从而实现类似ChatGPT的实时交互体验。针对旧版Node.js环境限制和API密钥暴露等常见问题，我们提出了一种基于Next.js App Router和Web标准API（如ReadableSt…

程序猿
2025年12月20日
0000
好文分享

Node.js ES Modules中openai导入异常及误导性错误排查

本文探讨了在Node.js ES Modules (ESM) 环境下使用openai npm包时，遇到的一个看似是SyntaxError的模块导入问题。文章详细分析了问题现象，揭示了其背后实则是一个与导入语句无关的运行时逻辑错误，并解释了为何这类深层问题可能导致误导性的编译或模块加载错误。通过代码示…

程序猿
2025年12月20日
0000
好文分享

深入解析Node.js中误导性模块导入错误的排查与解决方案

本文深入探讨了Node.js项目中一个看似是模块导入错误（SyntaxError: The requested module ‘openai’ does not provide an export named ‘Configuration’），但实际根…

程序猿
2025年12月20日
0000
好文分享

探索chatgpt开发的挑战和局限性

ChatGPT：机遇与挑战并存 OpenAI研发的ChatGPT彻底改变了人机交互方式，其应用范围涵盖客户支持、内容创作等诸多领域。然而，ChatGPT的发展并非一帆风顺，仍面临诸多挑战与局限。本文将深入探讨这些问题，并提出相应的应对策略。 1. 训练数据限制 ChatGPT的核心局限在于其依赖于预…

程序猿
2025年12月19日
0000
好文分享

DeepSeek和Chatgpt可以＆＃t正确：如何使用元数据更新Cloudflare KV对

使用cloudflare kv更新键值对及其元数据本文提供使用Cloudflare KV API更新键值对及其元数据的代码示例。虽然大型语言模型可以生成代码，但仔细阅读官方文档仍然至关重要。以下代码片段演示了如何使用fetch API 更新Cloudflare KV中的键值对，同时更新其元数据…

程序猿
2025年12月19日
0000
好文分享

RSS如何实现动态内容过滤？

要实现rss动态内容过滤，核心在于引入“智能代理”对原始feed进行二次处理。具体路径包括：1.使用内置过滤功能的rss阅读器，如feedly、inoreader等，适合简单筛选；2.借助ifttt或zapier等自动化平台作为中间件，支持条件判断和内容分发；3.自建解析器，利用python、nod…

程序猿
2025年12月17日
0000