LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

微软亚洲研究院推出的最新成果bGPT,这种基于字节的Transformer模型,为我们探索数字世界开辟了新的大门。

与传统基于词表的语言模型不同,bGPT具有独特之处,即其能够直接处理原始二进制数据,不受特定格式或任务的限制。其旨在全面模拟数字世界,为模型的发展打开了新的可能性。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

论文:https://www.php.cn/link/ee88b3cea2051be97bcddf2e0d9a28f6

代码:https://www.php.cn/link/359499f804ea7988921bf86c9377fb95

模型:https://www.php.cn/link/4b459ea1a5917be436df5f0bd5b3c4ad

项目主页:https://www.php.cn/link/71af59614c8b42af334933e9261e53be

研究小组在他们的研究论文中展示了bGPT在建模方面的巨大潜力。通过进行字节级处理,bGPT不仅能够生成文本、图像和音频,还能够模拟计算机的行为,包括格式转换算法和CPU状态的建模。这种将所有数据视为字节序列的方法使得bGPT能够将不同类型的数据整合到同一个框架中。

一经发布,bGPT的论文在X(Twitter)上引起了广泛热议,突显了深度学习模式的潜在变革,为模型真正理解和模拟数字世界中的各种活动打开了新可能性。

二进制数据:构成数字世界的基础DNA

二进制数据是数字世界的基石,它贯穿了计算机处理器以及我们日常使用的电子产品的操作系统,是所有数据、设备和软件的核心。因此,基于这一基础,bGPT的目标是通过研究二进制数据序列来理解数字系统的内在逻辑,从而重塑和模拟各种复杂的数字现象。

bGPT通过字节级的处理,不仅能应用于常规的AI生成和理解任务,还能处理更多的非传统应用。例如,它能直接模拟MIDI——一种音乐传输和存储的标准格式,这在之前的研究中由于MIDI的二进制本质而避免了直接建模。

但bGPT天生适合此类任务,能够精确模拟音乐数据的转换算法,将ABC记谱法转换为MIDI格式时,达到极低的错误率(0.0011 BPB)。

在实际应用中,bGPT通常能够准确地完成ABC符号与MIDI文件之间的转换,有时甚至能纠正原始文件中的错误,使音乐转换更加准确。

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

bGPT自动将ABC记谱法转换成MIDI格式(上图)与原MIDI数据(下图)的对比,凸显了关键的差异:虽然原MIDI数据中漏掉了一拍(见下图),导致和弦伴奏断开,但由bGPT转换的结果(见上图)正确填补了这一缺失,确保了和弦伴奏的流畅性。

研究团队还将CPU建模作为硬件行为模拟的代表性任务:该任务要求模型接收低级机器指令序列作为输入,其目标是准确预测每个指令执行后CPU状态如何更新,直至程序停止。

在这个任务中,bGPT展现出超过99.99%的准确率,显示了字节模型在处理原生二进制数据方面的强大能力和可扩展性。

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

在提供了程序和初始cpu状态的情况下,bgpt能够准确地预测cpu执行的完整过程,直到程序终止。在这个示例中,bgpt精确地处理了所有cpu指令。为了便于理解,这里将实际的字节序列转换成了更易读的格式。

Spacely AI Spacely AI

为您的房间提供AI室内设计解决方案,寻找无限的创意

Spacely AI 67 查看详情 Spacely AI

从字节到万物:突破边界,向着统一的数据建模进发

bGPT不仅能处理原生二进制数据,还能将多种数据类型融合进一个统一的模型架构中,视一切数据为字节序列。

这种方法不但简化了数据建模流程,还使得从任何数据源的整合变得轻而易举,且无需为特定数据类型定制模型。

研究团队在论文中举例了传统文本、图像及音频文件,展现了bGPT在统一数据建模方面的能力。他们训练的bGPT模型拥有约1亿参数。

实验结果表明,在与GPT-2(文本模型)、ViT(视觉模型)和AST(音频模型)等同规模模型的比较中,bGPT在不同数据类型上均展现出了可媲美的性能。

bGPT在文本生成方面的表现非常出色。得益于其字节级的文本编码,该模型无需依赖词汇表,从而能支持所有语言。

它的分层Transformer架构,尽管计算开销与GPT-2相近,却能生成长达8KB的文本,大大超出了GPT-2的长度限制。在经过Wikipedia数据进行预训练后,bGPT生成的文本在风格和主题上都与GPT-2不相上下,证明了其在文本生成方面的强大能力。

bGPT在Wikipedia数据集上进行预训练,生成的文本样例质量和主题一致性与GPT-2相当。

bGPT可以通过预测图像字节序列中的下一个字节来生成图像。该模型在ImageNet数据集上进行了预训练,生成的图像分辨率为32×32像素。

虽然在当前规模下,通过字节序列准确捕捉图像的二维空间关系有所困难,导致生成的图像存在伪影和噪点,但纹理和光影效果通常还是比较准确的。

此外,这些生成的图像均能被正常解码为BMP文件。研究团队指出,通过扩大bGPT的规模,类似于OpenAI开发的iGPT在像素序列建模方面的方法,或许可以实现更高质量、更逼真的图像生成。

这些是由在ImageNet数据集上进行预训练的bGPT生成的一组图像。虽然图像的纹理和光影效果通常比较准确,但在这些生成的图像中识别主要物体却有一定难度。

bGPT将音频数据视为字节序列,能生成1秒长、采样率为8000 Hz的音频样本。

该模型在LibriSpeech数据集上完成了预训练,并进一步在Speech Commands v2数据集上进行微调和演示。bGPT生成的音频样本保持了较高的准确度,其中一些样本几乎与真实音频无法区分。以下是展示bGPT在音频生成领域能力的示例集。

通过bGPT探索字节构成的数字世界

传统语言模型,不管它们有多强大,主要专注于处理自然语言文本。bGPT模型通过基于字节的处理机制,打破了这种仅限于文本处理的局限性,开辟了一个全新的数据处理范畴。

这一进步让bGPT有能力无缝地处理包括文本、图像、音频在内的各种数据类型,甚至能处理来自算法和硬件的原生二进制数据,为全面模拟和理解数字世界铺平了道路。

虽然bGPT展现出了引人注目的能力,但其在计算开销方面的局限性,如当前在常规显卡上仅能处理最大8KB的字节序列,对于那些需要生成或处理大量数据的应用来说,构成了明显的限制。未来的工作计划将集中在开发更高效的算法和利用硬件的进步上,旨在提高处理更大规模数据序列的能力。

全球的技术爱好者们已经开始展望bGPT未来的潜力,从网络修剪和自我学习的优化到超大规模网络的自我重构能力,这些讨论指向了一个共同的愿景:bGPT最终可能实现一个统一的模型,能够处理和输出所有类型的字节数据,真正成为数字世界的全面模拟器

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

研究团队已将bGPT的代码和模型开源。这意味着你可以在自己的数据集上直接训练bGPT,无需做出任何模型架构上的调整,便可探索字节模型在数字领域的广阔前景。

以上就是LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/847852.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月27日 16:10:37
下一篇 2025年11月27日 16:10:50

相关推荐

  • 《手办商店模拟器》攻略——游戏下载网址介绍

    《手办商店模拟器》(figure shop simulator)是由 gnome games 打造的一款兼具趣味性与高度细节化的经营模拟类游戏。该游戏的下载方式与其购买渠道紧密相关,例如在 steam 平台购买后,只需进入商品页面,完成购买流程,随后点击“马上开玩”即可启动下载程序。 玩家可通过 S…

    2025年12月6日 游戏教程
    000
  • 外媒盘点7款重制后比原版更差的游戏:还不如玩模拟器!

    外媒thegamer近日发布文章,整理了7款重制版表现不如原作的游戏作品。 《XIII》:漫画风FPS的两度尝试终陷口碑泥潭 初代《XIII》于2003年发售,凭借其独特的美式漫画风格在射击游戏中脱颖而出,尽管评价褒贬不一,但仍拥有忠实拥趸。然而2020年的重制版不仅抛弃了标志性的视觉风格,更因大量…

    2025年12月5日 游戏教程
    000
  • vivo Pad3 Pro 正式登场 跑分离谱还有蓝心大模型

    中关村在线消息:vivo 旗舰新品发布会正在进行中,本场发布会第一个登场的产品是 vivo pad3 pro。新款产品上来就放出王炸,搭载天玑 9300 处理器,跑分超过 210 万,也是行业首个突破 200 万的平板电脑。在游戏测试中,在 90 帧 +hdr 高清画质下,帧率稳定一条直线,性能十分…

    2025年12月5日
    000
  • 老电脑换Linux系统是否会更快,旧电脑不要装Windows!Bodhi Linux系统,小巧强悍,运行更流畅…

    大家好,又见面了,我是你们的朋友全栈君。 你的旧电脑安装win10还好吗? 随着科技的飞速发展,尤其是电脑硬件的不断更新换代,很多人不会轻易更换仅使用了两三年的电脑。 然而,电脑使用时间长了,性能难免会变慢,尤其是在Windows系统功能越来越多,占用资源越来越大的情况下,更换新电脑似乎是必然的选择…

    2025年12月5日 运维
    000
  • js如何操作Web NFC标签 5种NFC读写方法实现近场通信

    web nfc api是实现浏览器直接操作nfc标签的核心。它允许通过javascript与nfc硬件交互,支持读取、写入和格式化标签等功能。使用时需用户授权,并且仅在https环境下运行以确保安全性。目前chrome在android上支持较好,而ios和桌面浏览器支持有限。开发者可通过检测ndef…

    2025年12月5日 web前端
    000
  • 抖音不中奖被限制是什么情况解除?抖音直播中奖不给怎么办

    随着抖音的持续火热,越来越多用户加入这个充满创意与互动的平台。除了观看精彩短视频外,参与直播福袋、抽奖活动也成为大家喜爱的娱乐方式之一。但不少用户反映:自己频繁参与却始终不中奖,甚至账号还被限制了抽奖功能。这到底是怎么回事?又该如何应对和解除限制呢?下面我们一起来深入解析。 一、抖音不中奖并被限制的…

    2025年12月5日
    000
  • ChinaJoy 2024 Evnia 俄罗斯小姐姐吸睛全场!

    chinajoy 2024 已经于 7 月 26 日开展,作为融合了数码新品和科技潮玩的中关村在线展台,人气持续高涨,现场观众络绎不绝。而在众多深色调电竞风的展区中,evnia 凭借清新的蓝白色调脱颖而出,吸引了众多用户驻足。 除此之外,本次 ChinaJoy Evnia 也秉承着 ” …

    2025年12月5日 硬件教程
    000
  • 谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

    大模型做奥赛题游刃有余,简单的数数却屡屡翻车的原因找到了。 谷歌的一项新研究,发现大模型不会数数的原因,并不是简单的 tokenizer 所致,而是没有足够的空间来存储用于计数的向量。 数出一段话中某个单词出现的次数,这样简单的任务可以难倒许多大模型,GPT-4o、Claude 3.5 也无法幸免。…

    2025年12月5日 硬件教程
    000
  • 华硕主板bios设置 看完你也会!

    在组装电脑、升级硬件或排查系统故障时,bios设置是不可或缺的一环。作为主板行业的佼佼者,华硕主板以其直观的界面和丰富的功能广受用户青睐。然而,对于刚接触的新手而言,bios操作可能略显陌生。接下来,就让我们一起看看这份由驱动哥整理的华硕主板bios设置指南吧~ 一、如何进入华硕主板BIOS 1. …

    2025年12月4日
    000
  • 显著超越 SFT,o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

    上海交大、上海ai lab和港中文大学的研究人员推出visual-rft(视觉强化微调)开源项目,该项目仅需少量数据即可显著提升视觉语言大模型(lvlm)性能。visual-rft巧妙地将deepseek-r1的基于规则奖励的强化学习方法与openai的强化微调(rft)范式相结合,成功地将这一方法…

    2025年12月3日 硬件教程
    000
  • 李鬼再现! PS商店惊现《黑神话:悟空》山寨游戏

    此前,我们曾报道过一款与%ignore_a_1%热门种田游戏《集合啦!动物森友会》极为相似的山寨作品登陆ps商店,令人惊讶的是,该作在曝光后近一周仍未被下架。如今,ps商店内的仿冒问题似乎正变得愈发严重。 近日,一款名为《悟空:重生传奇》(《Wukong: Legacy Reborn》)的游戏悄然上…

    2025年12月3日
    100
  • 如何用BOM获取用户的设备方向?

    要通过bom获取用户设备方向,需监听deviceorientation事件,该事件提供alpha、beta和gamma三个角度值,分别表示设备在z轴、x轴和y轴上的旋转和倾斜。具体步骤如下:①检查浏览器是否支持deviceorientationevent;②添加事件监听器获取方向数据;③处理数据并应…

    2025年12月3日 web前端
    000
  • 消息称华为首款鸿蒙 PC 明日亮相 较 Windows 有三大优势

    5 月 7 日,有消息透露,华为将在明天(5 月 8 日)上午于深圳举办鸿蒙电脑技术与生态沟通会,届时鸿蒙电脑将正式亮相。会议内容将包括鸿蒙电脑的介绍、体验以及华为自研和第三方生态的详细信息。这将是国内首个从操作系统内核开始全新构建的电脑产品。 早在 3 月的 Pura X 发布会上,余承东就预告了…

    2025年12月3日
    000
  • 超普通修仙模拟器:黄级易筋丹炼制攻略

    超普通修仙%ign%ignore_a_1%re_a_1%中,炼制黄级易筋丹可参考以下步骤。 1、 初始步骤: 2、 进入游戏,点击角色主页的选项。 3、 接着进行第二步: 4、 打开炼制页面,点击炼丹按钮。 ProfilePicture.AI 在线创建自定义头像的工具 67 查看详情 5、 接着进行…

    2025年12月3日 软件教程
    000
  • 蓝蝶模拟器备份方法

    如何备份蓝蝶模拟器的详细步骤如下: 1、启动蓝蝶模拟器,点击“更多”进入设置界面。 2、在设置菜单中,选择“备份还原”功能。 3、进入备份还原页面后,点击“备份”按钮开始操作。 4、选择你希望保存备份文件的位置,确认无误后点击确定。 5、系统弹出提示窗口时,点击“是”继续操作,并耐心等待备份过程完成…

    2025年12月3日 软件教程
    000
  • 2025CUSGA第五届中国大学生游戏开发创作大赛决赛入围名单公布!

    经过严格的评审流程,2025CUSGA第五届中国大学生游戏开发创作大赛决赛入围名单正式出炉! 2025CUSGA第五届中国大学生游戏开发创作大赛由UGDAP大学生游戏开发联盟、CiGA中国独立游戏联盟主办,漕河泾开发区、未来42·趣创游戏孵化器联合主办,GGAC数字艺术平台、Hit Academy作…

    2025年12月3日 游戏教程
    000
  • 曝微软正开发 x64 模拟器 使 Xbox 游戏可在 Windows PC 运行

    5 月 20 日,据相关曝料透露,微软正在开发一项技术,可能将使 Xbox 游戏通过模拟器在 Windows 系统上运行。同时,他还透露 Xbox 应用将迎来类似 Steam 的大屏幕模式。 消息源提到,微软正在开发一款 x64 模拟器,旨在让 Windows PC 能够通过该模拟器运行 Xbox …

    2025年12月3日
    100
  • 《歧路旅人:大陆的霸者》正式公测,网易云游戏免下载秒玩送公测礼包

    《歧路旅人:大陆的霸者》将在5月16日10点正式公测,重现经典jrpg的荣光!但如果你的手机或者电脑内存不足以支持游戏运行,或者手机游玩时会发烫,也不用担心!你可以选择使用网易云游戏来畅玩《歧路旅人:大陆的霸者》。只需一键登录,即可随时上线游戏。网易云游戏同时支持手机(安卓和ios均已支持)、pc(…

    2025年12月3日 行业动态
    000
  • AI 越聪明越不听话!新研究:最强推理模型指令遵循率仅 50%

    如果面前有两个 ai 助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选? 最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Lar…

    2025年12月3日 硬件教程
    100
  • 卡妙思CAMMUS将参展2024 eSmart,颠覆你的模拟驾驶体验

    由chinajoy主办方汉威信恒主办的第八届国际智能娱乐硬件展览会(esmart)将于2024年7月26日至7月29日在上海新国际博览中心精彩亮相。本届esmart展会旨在积极引领智能娱乐硬件潮流,展示海内外业界最新的“黑科技”产品,带给广大玩家最新、最潮、最酷炫的智能娱乐体验。 此次出席2024 …

    2025年12月3日 行业动态
    000

发表回复

登录后才能评论
关注微信