别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

2 月 8 号美东时间八点半,谷歌发布会在巴黎召开。前一天微软正式推出了新一代 AI 驱动搜索引擎 New Bing,把基于 ChatGPT 技术的生成模型和 Bing 集成在一起。微软副总裁 Yusuf Mehdi 进行了一次完美的演示 [0],当日微软市值暴涨 800 亿美元。即便是在 OpenAI 没有开放注册的中国,朋友圈、微信群里 Yusuf 展示的生成模型如何增强 Bing 搜索引擎和 Edge 浏览器体验的片段也在疯传。汝之蜜糖,彼之砒霜,大家都在等着搜索巨头谷歌怎么应对。

谷歌发布会的现场,大家都在等待传说中跟 New Bing 对标的 Bard 登场。作为有谷歌搜索引擎加持的大语言模型,大家对 Bard 充满了遐想。然而,发布会现场,关于 Bard 的内容并不多。于是大家又把眼光投向了谷歌在推特上发布的 Bard 视频,仔细扒下来,大家突然发现 Bard 在回答问题时犯了事实性错误。

在被问及「关于詹姆斯韦伯望远镜的新发现,有什么可以告诉我九岁孩子的?」时,Bard 回答道:「第一张系外行星照片是由詹姆斯韦伯望远镜拍摄。」而事实却是由欧洲南方天文台的甚大望远镜在 2004 年拍下的,此时距离詹姆斯韦伯望远镜升空还有 18 年之久。这个错误成了谷歌当日股价大跌的导火索。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 1 Bard 关于詹姆斯韦伯望远镜演示截图

而在巴黎发布会的现场,尽管 Bard 的展示部分只有 4 分钟左右,其关于星座最佳观测时间的回答同样存在明显的事实偏差。如下图,Bard 的回答中提到猎户座最佳观测时间是十一月到二月。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 2 Bard 关于星系观测时间演示截图

根据不同信息源,猎户座的最佳观测时间不尽相同,但是都明确指出最佳观测时段从每年一月起。教育科技网站 BYJU’S 提供的最佳时间为一月到三月 [1],维基百科提供的最佳时间为一月到四月 [2]。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 3 BYJU‘S 关于猎户座最佳观测时间的解答

由于 Bard 发布会相较于 New Bing 发布会的落差,以及被揪出了事实性错误,当天谷歌市值暴跌近 1000 亿美元,Bard 也因此被戏称为史上最贵发布会。我们不禁好奇,在 New Bing 看似完美的发布会中,是不是也藏着事实性的错误呢

New Bing 的事实性错误

我们发现,New Bing 生成的内容中掺杂了很多事实性错误,包括名人身份信息、财报数字、夜店营业时间,等等。

生成模型的事实性错误分类

对于以 GPT 系列(包括 ChatGPT、InstructGPT 等)、T5 为代表的生成模型,事实性错误可以粗分为以下两类:

生成内容与引用内容冲突。大语言模型在内容生成过程中随着序列增长,容易出现脱离引用内容,造成增加、删减或篡改原文的现象。生成的内容没有事实依据。这类错误通俗来说就是一本正经得胡说八道。没有事实依据的指引,仅靠模型预训练时候存储的信息很容易使模型在生成过程中不知所云。很大概率会生成与事实不符或是和问题无关的内容。

现在我们来检视 New Bing 发布会 [3] 以及 New Bing 演示 [4] 所展示的例子,是否存在事实性错误以及分别是什么类型。为了行文方便,我们把 New Bing 和集成在 Edge 的 New Bing 插件统称为 New Bing。

日本诗人例子的错误

在 New Bing 发布会视频 29:57 处,当 New Bing 被问到知名日本诗人时,给出的答案包括「Eriko Kishida 岸田惠理子 (1930-2004), poet, playwright, and essayist」。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 4 New Bing 演示中诗人例子截图

然而根据维基百科和 IMDB 提供的信息 [5, 6, 7],Eriko Kishida 的生卒年分别为 1929 和 2011。同时,她也不是剧作家(playwright)和散文家(essaysit),而是诗人、翻译家和童话作家。被 New Bing 转了业还少活了八年,岸田的家人大概不太能接受。同时不幸被转业的还有 Gackt 同学。据维基百科提供的信息 [8],Gackt 玩过音乐、唱过歌、作过曲也演过戏,就是没作过诗。

财报例子的错误

在 New Bing 发布会视频 35:49 处,Yusuf 展示集成了 New Bing 的 Edge 浏览器,对于打开的服饰公司盖璞 (Gap) 2022 年第三季度的财报,如何进行要点生成。乍眼一看,New Bing 的总结非常实用,用关键点的方式庖丁解牛一般展示了 Gap 三季报的要点,巴菲特看到此或许也会「惊为真人」。然而,当我们找出 Gap 2022 年三季报 [9],仔细阅读过后,发现 New Bing 的总结错漏百出,让人不忍直视

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 5 New Bing 对 Gap 2022 年第三季度财报的摘要

首先,New Bing 给出了 Gap 调整后的运营毛利率(reported operating margin, adjusted for impairment charges and restrucring costs)为 5.9%。然而在财报中,Gap 的运营毛利率是 4.6%,调整后则是 3.9%。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 6 Gap 2022 年第三季度财报截图

New Bing 接下来又给出调整后摊薄每股收益为 0.42 美元(diluted earnings per share, adjusted for impairment charges, restrucring costs and tax impact),但财报里的数据则是 0.71 美元。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 7 Gap 2022 年第三季度财报截图

甚至 New Bing 给出了 Gap 全年的销售指引为「预计销售净增长率为低双位数」,而实际是四季度「可能呈中间个位数下降」。是下降而非增长,一词之差,对用户的投资行为将产生严重的误导,这亏钱了算谁的。New Bing 甚至无中生有,给出了更多的全年财务指引「营业毛利为 7%,摊薄每股收益为 1.6 美元到 1.75 美元之间」,而这些数据在 Gap 三季度财报中统统没有提到。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 8 Gap 2022 年第三季度财报截图

视频 36:15 处,Yusuf 又展示了用 New Bing 进行 Gap 和体育休闲服品牌露露乐檬(Lululemon)财报对比的功能。这部分又是错误信息的重灾区。

微软爱写作 微软爱写作

微软出品的免费英文写作/辅助/批改/评分工具

微软爱写作 17 查看详情 微软爱写作

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 9 New Bing 对 Gap 和 Lululemon 财报对比功能

在右侧 New Bing 给出的表格中,除了上文所说的 Gap 营业毛利 5.9% 应为 4.6%(或调整后 3.9%)和 Gap 摊薄每股收益 0.42 美元应为 0.77 美元(或调整后 0.71 美元), New Bing 又给出了 Gap 现金和现金等价物为 14 亿美元的数据,而实际上财报中是 6.79 亿美元。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 10 Lululemon 2022 年第三季度财报截图

同样的情况也出现在 New Bing 给出的 Lululemon 数据中。根据 Lululemon 2022 三季报的数据 [10],New Bing 给出的 Lululemon 毛利率为 58.7%,实际上应为 55.9%。New Bing 提到 Lululemon 营业毛利为 20.6%,实际上应为 19.0%。New Bing 给出 Lululemon 摊薄每股收益为 1.65 美元,实际上应为 2.00 美元。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 11 Lululemon 2022 年第三季度财报截图

我们不禁想问:New Bing 是如何对着 Gap 和 Lululemon 的财报一本正经地胡说八道的?一个合理的推断是,生成出来的这些错误数据,很可能是来自它预训练阶段见过的财报分析数据。ChatGPT 这类大型语言模型的生成,随着生成的序列越长,越容易脱离给定的 Gap 和 Lululemon 的财报数据,放飞自我,生成不着边际的虚假信息。

夜店例子的错误

在 New Bing 发布会视频 29:17 处,New Bing 又为丰富墨西哥城的游客们的夜生活提供了「毫无建设性」的建议。对于其推荐的几个夜店,如 Primer Nivel Night Club、El Almacen 和 El Marra,New Bing 提到这些酒吧没有客户评价、没有联系方式也没有商店介绍。然而这些信息都可以在谷歌地图或者商店的 Facebook 主页上找到。看来 New Bing 网上冲浪力度还不够

El Almacen 在 New Bing 里的营业时间是周二到周日的下午五点到晚上十一点,然而真实的营业时间是除周一外的下午七点到凌晨三点 [11]。这让五点去吃晚饭的游客还得挨两个小时的饿。Guadalajara de Noche 则是相反,实际营业时间是每天的下午五点半到凌晨一点半或十二点半 [12],而 New Bing 给出的营业时间是下午八点开始。看来游客靠 New Bing 的建议去找餐厅,能不能吃到饭就得看运气了。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 12 New Bing 演示中夜店例子截图

其他错误 

除了上述的信息错误,我们还发现了一系列散布在各个角落的事实错误,比如商品价格误差、商店地址错误、时间错误等。

实例演示里的错误

由于 New Bing 还没有完全开放,我们无法直接在 New Bing 上拿到发布会现场的搜索结果,但是微软提供了几个实例演示 [13],让用户体验。本着打破砂锅问到底的精神,我们也把这几个演示都放到放大镜下进行研究。我们发现,即便是这几个精心挑选的例子,里面还是有不少错误信息

在「What art ideas can I do with my kid? 」中,New Bing 给出了很多手工品制作建议。对于每一个手工品,New Bing 都总结了制作所需的材料。然而每一个手工品的材料总结都是不完整的。比如 New Bing 从引用网站 [14] 中总结制作纸吉他需要纸盒、橡皮筋、颜料和胶水。但却漏掉了引用中提到的海绵刷、胶带和木珠。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 13  New Bing 实例演示 “我可以和孩子一起做什么样的手工?” 截图 

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 14 引用网站中制作纸吉他所需材料截图

在 New Bing 的实例演示中还有一个非常明显和常见的错误,即给的引用链接与生成的内容无关,驴唇不对马嘴

比如以下在「I need a big fast car. 」的例子中,2022 版 Kia Telluride 没有出现在所给的引用 10 [15] 中。同时「时间穿越」问题在该例子中依旧不能避免,New Bing 声称 2022 版 Kia Telluride 获得了 2020 年世界年度汽车奖,实际情况是当年获得该奖项的是 Kia Telluride 2020 版本。2022 年世界年度汽车奖获得者则是 Hyundai IONIQ 5,而引用 7 [16] 也是与「2020 年世界年度汽车奖」毫不相关的文章。我们在所有实例演示中找到了多达 21 处类似的错误。

别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出

图 15 New Bing 演示实例 “我需要一辆大型快车” 截图

小结:发现错误将指引我们前进

从上述的分析可以看出,无论是 New Bing 还是 Bard,他们的回答都容易出现事实性错误。当全世界都惊讶于 ChatGPT 等大型语言模型展现出来的能力时,当 ChatGPT 成为史上最快达到 1 亿用户的应用之际,我们一方面是为 AI 的进步振臂欢呼,一方面也需要冷静地思考怎么解决 AI 目前还存在的诸多问题。

自从 1956 年那群聚在达特茅斯学院的天才们,第一次定义了什么是人工智能之后,AI 经历了几起几落。近 70 年的发展过程中有很多让人感动的坚持:是初代 AI 的稚嫩探索,是专家系统的勇敢尝试,是 Hinton、Bengio、Lecun 这些学者把神经网络的冷板凳坐穿,是 DeepMind 用 AlphaGo 让 AI 出圈,是谷歌、Meta、CMU、斯坦福、清华等一众顶尖研究机构坚持开源,是 OpenAI 顶住压力把 GPT 这个路线走通,是全球几代科研人员的接力,我们才走到今天。

然而,如果我们放任 AI 生成大量不真实的信息,那么不用多久,大众对于 AI 建立的信心就会被摧毁,各种虚假信息也会充斥互联网。我们指出大模型的错误,并不是为了拉踩哪个公司或者哪个模型,相反,我们是要让 AI 变得更好

正如阿根廷诗人博尔赫斯曾经说过:任何命运,无论多么复杂漫长,实际上只反应于一个瞬间,那就是人们彻底醒悟自己究竟是谁的那一刻。在 ChatGPT 等大模型已经具备了媲美人类的文字能力时,我们清楚地知道,下一步的重点是把真实世界的知识更完整准确地融入大模型,让 AI 模型安全地、可靠地、广泛地应用于人们的日常生活。我们从未如此期待,也从未如此接近那一刻的到来。

以上就是别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/548787.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
如何解决网站注册时的机器人攻击问题?使用Composer安装gregwar/captcha可以!
上一篇 2025年11月9日 19:04:39
Linux DHCP租约时间管理:如何设置租约期限
下一篇 2025年11月9日 19:04:54

相关推荐

  • Go与.NET互操作:在Go应用中调用.NET库的策略

    本文探讨了在go应用中集成.net库或ui的策略。核心方法是通过在go进程中宿主.net clr,利用c-callable dll作为桥梁。文章将介绍这种技术的可行性,并讨论实现过程中可能遇到的技术细节和注意事项,帮助开发者实现go与.net之间的互操作性。 引言 在现代软件开发中,跨语言互操作性是…

    2026年5月10日
    000
  • C++如何为项目配置调试环境

    配置C++调试环境需生成调试符号并正确设置IDE或调试器。首先编译时添加-g(GCC/Clang)或/Zi(MSVC)以生成调试信息,使用CMake时设CMAKE_BUILD_TYPE为Debug;其次在IDE中配置可执行文件路径、工作目录、命令行参数、环境变量及调试器类型(如GDB、LLDB),V…

    2026年5月10日
    000
  • C++开发环境配置Visual Studio的完整流程

    配置C++开发环境需先安装Visual Studio并勾选“使用C++的桌面开发”工作负载,它包含MSVC编译器、Windows SDK、标准库和项目模板等核心组件。创建项目后可编写代码并运行调试。集成第三方库时,头文件-only库只需配置“附加包含目录”;静态库或动态库还需设置“附加库目录”和“附…

    2026年5月10日
    000
  • 开发基于ChatGPT的自动写诗系统:Python让诗意流淌

    开发基于ChatGPT的自动写诗系统:Python让诗意流淌 自古以来,诗歌一直是人类表达感情和思想的一种重要方式。然而,写好一首优美的诗歌并不是每个人都能做到的,特别是对于那些没有诗歌创作经验的人来说。但是,现代技术的发展让自动写诗成为可能,人们可以利用计算机和人工智能技术来自动生成诗歌。在这篇文…

    2026年5月10日
    000
  • OneDrive跨设备同步,HTML+CSS走到哪写到哪!

    OneDrive通过云同步实现HTML和CSS代码跨设备实时协作。将项目存于OneDrive文件夹并登录账户,可自动同步至所有设备;在Surface Pro 9运行Windows 11环境下,使用Visual Studio Code打开OneDrive中的项目目录,保存即触发后台同步;移动端安装On…

    2026年5月10日
    000
  • 如何添加html运行框_在网页中添加HTML代码运行框【添加】

    可实时运行HTML代码的交互式编辑框可通过三种方案实现:一、CodeMirror+iframe动态执行,用document.write渲染;二、JSFiddle风格iframe沙箱,用srcdoc属性加载;三、Monaco Editor+Blob URL,提供专业编辑体验。 如果您希望在网页中嵌入一…

    2025年12月23日
    100
  • 优化@font-face配置:确保自定义字体在移动设备上的兼容性与显示

    本文深入探讨了自定义字体通过@font-face规则在移动设备上无法正确显示的问题,并提供了详细的解决方案。核心在于优化字体格式的声明顺序,强调优先使用ttf、woff2和woff等广泛支持的字体格式,以提升跨平台兼容性,确保自定义字体在包括各类移动设备在内的所有环境中均能稳定渲染。 理解@font…

    2025年12月23日
    800
  • 解决移动设备上 @font-face 字体不显示的兼容性指南

    移动设备上 @font-face 字体显示异常,常见原因是字体格式优先级配置不当。本文将深入探讨不同字体格式的兼容性,并提供一套优化后的 @font-face 声明最佳实践,确保自定义字体在各类设备和浏览器上都能稳定加载与显示。 在现代网页设计中,自定义字体通过 @font-face 规则提供了丰富…

    2025年12月23日
    300
  • vs中的html怎么运行环境_vs配置html运行环境步骤【指南】

    在 Visual Studio 中运行 HTML 需通过 Web 项目模板并借助 IIS Express 服务。1. 安装 VS 时勾选“ASP.NET 和 Web 开发”工作负载;2. 创建 ASP.NET 项目,添加 HTML 页面;3. 编写代码后设为起始页,点击 IIS Express 运行…

    2025年12月23日
    400
  • ai做html怎么运行_AI生成html运行步骤【教程】

    答案是使用AI生成HTML代码后,将其保存为.html文件并用浏览器打开即可运行。具体步骤为:1. 在AI工具中输入需求生成HTML代码;2. 将代码复制到文本编辑器并另存为index.html,编码选UTF-8,类型选“所有文件”;3. 双击该文件用浏览器打开,若无法正常显示需检查文件后缀、编码及…

    2025年12月23日
    000
  • HTML文本在span中怎么设置样式_HTML文本在span中如何局部调整字体与颜色

    使用span标签结合style属性可对文本局部设置颜色、字体等样式;2. 推荐通过CSS类统一管理多处相同样式,提升可维护性;3. 中文建议设置Microsoft YaHei等常用字体并提供备选,颜色推荐十六进制值;4. 避免过多内联样式,保持结构与表现分离。 在HTML中,标签常用于对文本的局部进…

    2025年12月23日
    000
  • HTML文本与CSS怎么结合使用_HTML文本与CSS怎么结合实现丰富排版效果

    HTML提供结构,CSS负责样式,二者结合可实现美观布局。1. 内联样式通过style属性直接设置,适用于单元素调整但难复用;2. 内部样式表置于head中,用style标签定义,适合单页统一排版;3. 外部样式表将CSS独立为文件,通过link引入,利于多页共享与维护,推荐使用;4. 关键CSS属…

    2025年12月23日
    300
  • 网站根目录下的神秘HTML文件:识别与管理域名所有权验证文件

    网站根目录下发现的随机命名html文件,通常是用于验证域名或网站所有权的工具。本文将深入探讨这类文件的常见来源、作用及其在google search console等服务中的应用,并提供识别与管理建议,帮助网站管理员理解并妥善处理这些看似“多余”的文件。 1. 这类文件的神秘面纱 在维护或更新一个既…

    2025年12月23日
    000
  • Windows OneDrive同步HTML+CSS项目到多台电脑

    使用OneDrive同步HTML+CSS项目可行,需将项目放入OneDrive文件夹并登录同一账号实现多端同步。应采用英文命名、避免特殊字符,使用相对路径引用资源,如href=”css/style.css”。推荐结构:my-website/下分设css、js、images目录…

    2025年12月23日
    000
  • html代码怎么设置字体_html字体标签与CSS字体样式设置方法

    可通过HTML标签或CSS样式自定义网页文字效果:一、使用标签设置字体名称、大小、颜色;二、利用内联style属性设置font-family、font-size、color等;三、在中用定义内部样式表;四、通过link引入外部CSS文件实现样式分离;五、使用@font-face引入Web字体,确保跨…

    2025年12月23日
    000
  • Windows11 Widgets显示当前HTML使用的CSS文件数

    Windows 11 Widgets 不提供网页技术统计功能,无法显示当前HTML使用的CSS文件数,其面板由系统应用渲染,仅支持通过任务栏或快捷键打开、添加组件、调整布局及个性化设置。 Windows 11 Widgets 功能本身是一个操作系统层面的界面组件,它不直接提供“显示当前HTML使用的…

    2025年12月23日
    000
  • html如何改变字_HTML文字(字体/大小/颜色)修改方法

    推荐使用CSS设置文字样式,通过style属性或样式表定义font-family、font-size和color;2. 可在标签内用style直接设置,或在style标签及外部文件中统一管理;3. 避免使用已废弃的font标签。 在HTML中修改文字的字体、大小和颜色,主要通过内联样式(style属…

    2025年12月23日
    000
  • HTA中VBScript实现动态图像定位教程

    本教程详细讲解如何在HTML应用程序(HTA)中利用VBScript动态控制HTML图像元素的位置。文章将阐述VBScript与DOM(文档对象模型)的交互机制,通过实际代码示例展示如何监听用户输入并实时更新图像的`top`和`left`样式属性,从而实现无需按钮即可响应式调整图像位置的功能。 HT…

    2025年12月23日
    100
  • html如何改字体_HTML字体样式(font-family/size)修改方法

    html如何改字体_HTML字体样式(font-family/size)修改方法html如何改字体_HTML字体样式(font-family/size)修改方法html如何改字体_HTML字体样式(font-family/size)修改方法html如何改字体_HTML字体样式(font-family/size)修改方法

    通过CSS的font-family和font-size属性可设置网页字体类型与大小,示例包括使用Arial、微软雅黑等字体及px、em等单位,建议结合多个字体备选并用引号包裹中文字体名,推荐在style标签中全局统一设置以保持页面风格一致。 在HTML中修改字体样式,主要通过CSS的font-fam…

    2025年12月23日 用户投稿
    000
  • html如何加入ppt_HTML内容嵌入PowerPoint演示文稿方法

    可通过图片、插件、PDF或OneNote四种方式在PPT中嵌入HTML内容。1. 转为图片插入兼容性好但不可编辑;2. 用Web Viewer插件嵌入实时网页需联网且依赖插件;3. 导出为PDF再插入可保留排版与链接;4. 借助OneNote中转格式还原度高,支持富文本。根据需求选择合适方案即可实现…

    2025年12月23日
    000

发表回复

登录后才能评论
关注微信