扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径

「扩散模型」也能攻克算法难题?

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

一位博士研究人员做了一个有趣的实验,用「离散扩散」寻找用图像表示的迷宫中的最短路径。

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

作者介绍,每个迷宫都是通过反复添加水平和垂直墙生成的。

其中,起始点和目标点随机选取。

从起点到目标点的最短路径中,随机采样一条作为解决方案的路径。最短路径是通过精确算法算出来的。

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

然后使用离散扩散模型和U-Net。

将起点和目标的迷宫被编码在一个通道中,而模型在另一个通道中用解来消除迷宫的噪声。

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

再难一点的迷宫,也能做的很好。

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

为了估算去噪步骤 p(x_{t-1} | x_t),算法会估算 p(x_0 | x_t)。在这个过程中可视化这一估计值(底行),显示「当前假设」,最终聚焦在结果上。

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

英伟达高级科学家Jim Fan表示,这是一个有趣的实验,扩散模型可以「渲染」算法。它可以仅从像素实现迷宫遍历,甚至使用了比Transforme弱得多的U-Net。

我一直认为扩散模型是渲染器,而Transformer是推理引擎。看起来,渲染器本身也可以编码非常复杂的顺序算法。

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

这个实验简直惊呆了网友,「扩散模型还能做什么?!」

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

还有人表示,一旦有人在足够好的数据集上训练扩散Transformer,AGI就解决了。

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

不过这项研究还未正式发布,作者表示稍后更新在arxiv上。

值得一提的是,这个实验中,他们采用了谷歌大脑团队曾在2021年提出的离散扩散模型。

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

就在最近,这项研究重新更新了一版。

离散扩散模型

「生成模型」是机器学习中的核心问题。

它既可用于衡量我们捕获自然数据集统计数据的能力,也可用于需要生成图像、文本和语音等高维数据的下游应用程序。

GAN、VAE、大型自回归神经网络模型、归一化流等方法,在样本质量、采样速度、对数似然,以及训练稳定性方面都各有千秋。

最近,「扩散模型」已成为图像、音频生成,最受欢迎的替代方案。

它可以用更少的推理步骤,实现了与GAN相当的样本质量,以及与自回归模型相当的对数似然。

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

论文地址:https://www.php.cn/link/46994a3cd8d943d03b44b8fc9792d435

虽然已有人提出了离散和连续状态空间的扩散模型,但最近的研究主要集中在,连续状态空间中运行的高斯扩散过程(如实值图像和波形数据)。

离散状态空间的扩散模型,已在文本和图像分割领域进行了探索,但是还没有在文本和图像的大规模生成任务中,证明是一个有竞争力的模型。

谷歌研究团队提出了一种全新的离散去噪扩散概率模型(D3PM)。

研究中,作者证明了过度矩阵的选择是一个重要的设计决策,它能改善图像和文本领域的结果。

此外,他们还提出了一种新的损失函数,它结合了变分下界和辅助的交叉熵损失。

在文本方面,这个模型在字符级文本生成方面取得了很好的效果,同时可以扩展到大词汇量的LM1B数据集上。

在CIFAR-10图像数据集上,最新模型接近了连续空间DDPM模型的样本质量,并超过了连续空间 DDPM 模型的对数似然。

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径图片

项目作者

Arnaud Pannatier

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径

Arnaud Pannatier从2020年3月在导师François Fleuret的机器学习小组开始攻读博士学位。

他最近开发了HyperMixer,使用超级网络让MLPMixer能够处理各种长度输入。这使得模型能够以一种排列不变的方式处理输入,并证明了它给了模型一种随着输入长度线性扩展的注意力行为。

在EPFL,他先后获得了物理学学士学位和计算机科学与工程硕士学位(CSE-MASH)。

参考资料:

https://www.php.cn/link/46994a3cd8d943d03b44b8fc9792d435

https://www.php.cn/link/1879d84e181b6262704e95372dc9f4dc

以上就是扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/868367.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月28日 03:45:41
下一篇 2025年11月28日 03:53:01

相关推荐

  • REDMI K90系列正式发布,售价2599元起!

    10月23日,redmi k90系列正式亮相,推出redmi k90与redmi k90 pro max两款新机。其中,redmi k90搭载骁龙8至尊版处理器、7100mah大电池及100w有线快充等多项旗舰配置,起售价为2599元,官方称其为k系列迄今为止最完整的标准版本。 图源:REDMI红米…

    2025年12月6日 行业动态
    200
  • JavaScript动态生成日历式水平日期布局的优化实践

    本教程将指导如何使用javascript高效、正确地动态生成html表格中的日历式水平日期布局。重点解决直接操作`innerhtml`时遇到的标签闭合问题,通过数组构建html字符串来避免浏览器解析错误,并利用事件委托机制优化动态生成元素的事件处理,确保生成结构清晰、功能完善的日期展示。 在前端开发…

    2025年12月6日 web前端
    000
  • ai生成视频入口

    ai生成视频入口: 即梦ai:jimeng.jianying.com DeepSeek:chat.deepseek.com 访问这些工具的官方网站后,通常在首页显眼位置会看到“AI 生成视频”或“一键生成视频”等按钮。点击进入后,根据页面指引输入视频主题、脚本内容以及风格偏好等信息,即可利用 AI …

    2025年12月6日 软件教程
    000
  • 在Java中如何进行隐式类型转换

    隐式类型转换是Java中自动将小范围数据类型向大范围类型转换的过程,遵循byte→short→int→long→float→double的顺序,char可转为int及以上类型;赋值和运算时低精度类型会自动提升为高精度类型,如int与double运算时int被提升为double;byte、short、…

    2025年12月6日 java
    000
  • win11怎么更改桌面图标之间的间距_Win11桌面图标间距调整方法

    调整Windows 11桌面图标间距可通过三种方法:一、进入“设置-系统-显示”,调节“缩放”比例至100%或125%以改变整体布局;二、打开注册表编辑器,定位到HKEY_CURRENT_USER\Control Panel\Desktop\WindowMetrics,修改IconSpacing和I…

    2025年12月6日 系统教程
    000
  • PHP框架怎么实现分页查询_PHP框架分页算法与LIMIT优化技巧

    分页查询需根据场景选择合适方式,传统OFFSET易导致性能瓶颈,尤其在深分页时;推荐使用游标分页或主键范围分页以提升效率,结合缓存或省略总数可进一步优化体验。 在使用PHP框架开发Web应用时,分页查询是处理大量数据的常见需求。合理的分页实现不仅能提升用户体验,还能优化数据库性能。主流PHP框架如L…

    2025年12月6日 后端开发
    000
  • 高效管理带优先级数组:插入与更新时的自动优先级调整策略

    本文深入探讨了在javascript中管理带有优先级属性的对象数组时,如何处理新对象插入或现有对象更新导致的优先级冲突问题。核心策略包括使用`findindex`定位插入点,`splice`实现精确插入,以及通过迭代和条件判断实现后续元素的优先级自动递增调整,确保数组的有序性和优先级逻辑的正确性,并…

    2025年12月6日 web前端
    000
  • Linux文件系统中du命令的使用技巧

    使用du命令结合-h、–max-depth、–exclude及sort等参数可高效分析磁盘占用,如du -sh /path查看总大小,du -h –max-depth=1 /dir统计层级,du -h –exclude=”*.tmp&#82…

    2025年12月6日 运维
    000
  • 谷歌浏览器如何将扩展程序固定到工具栏_谷歌浏览器扩展图标固定操作方法

    首先进入扩展管理页面,点击浏览器右上角三点菜单选择“扩展程序”,找到目标扩展并开启“在工具栏中显示按钮”;也可通过工具栏拼图图标快速启用,点击扩展下方“在工具栏中显示”完成固定;最后可拖动图标调整顺序或关闭显示开关隐藏不常用图标。 如果您在使用谷歌浏览器时希望快速访问常用扩展程序,但发现图标无法直接…

    2025年12月6日 电脑教程
    000
  • JavaScript中基于优先级动态管理对象数组的策略

    本文探讨了在JavaScript中管理带有优先级属性的对象数组时遇到的复杂问题,特别是当新对象插入或现有对象优先级更新导致与其他对象优先级冲突时。我们将分析现有解决方案的局限性,并提出一种健壮的策略,通过精确的插入和智能的级联优先级调整来确保数组的逻辑顺序和优先级规则的完整性,从而有效解决优先级冲突…

    2025年12月6日 web前端
    000
  • 崩坏星穹铁道3.6虫鸣秘闻怎么解谜-崩坏星穹铁道3.6虫鸣秘闻解谜攻略

    崩坏星穹铁道3.6版本为玩家带来了激动人心的全新剧情篇章,一场宏大的救世之旅就此展开。与此同时,新地图中的“虫鸣秘闻”谜题也吸引了众多探索者的目光。接下来,就为大家带来详细的崩坏星穹铁道3.6虫鸣秘闻解谜指南。 一、辉痕圣林·虫鸣秘闻 1、首先传送到地图第一层,找到位于衣匠附近的区域,在其身旁可以拾…

    2025年12月6日 游戏教程
    000
  • PHP多维数组排序:基于指定键值进行排序

    本文介绍了如何在PHP中对多维数组进行排序,重点讲解了如何基于数组中一致的键值进行排序。通过`usort`函数和比较函数,可以灵活地实现自定义排序规则,从而满足各种复杂的排序需求。本文提供了详细的代码示例和注意事项,帮助开发者快速掌握多维数组排序的技巧。 在PHP中,对数组进行排序是一项常见的任务。…

    2025年12月6日 后端开发
    000
  • Yandex俄语资料查询必备入口 俄罗斯官网免登录版地址

    Yandex俄语资料查询必备入口地址是https://yandex.com/,该平台提供俄语内容深度索引、地图、邮件、新闻聚合等功能,支持多语言检索、关键词联想、图片及语音搜索,并内置翻译工具,适配移动端访问。 ☞☞☞☞点击俄罗斯yandex搜索引擎入口☜☜☜☜ ☞☞☞☞点击快速获取Yandex免登…

    2025年12月6日 电脑教程
    000
  • MAC怎么用自带的“图库”App管理emoji和符号_MAC图库App管理emoji与符号方法

    通过系统自带“图库”应用可快速在Mac上插入表情符号与特殊字符。1、将光标定位至输入框,点击菜单栏“编辑”→“表情与符号”即可打开图库;2、或使用快捷键Control+Command+空格键快速唤出面板;3、在图库右上角搜索框输入“版权”“心形”等关键词精准查找符号;4、通过点击符号右下角五星图标添…

    2025年12月6日 系统教程
    000
  • windows怎么设置显示缩放比例_Windows显示缩放比例设置方法

    1、通过显示设置调整缩放比例可优化文本和界面大小;2、多显示器可独立设置缩放;3、高级缩放支持自定义100%-500%比例;4、兼容性设置可解决应用模糊问题。 如果您发现Windows系统中文本、应用或界面元素显示过小或过大,影响正常使用,可以通过调整显示缩放比例来优化视觉效果。以下是设置显示缩放比…

    2025年12月6日 系统教程
    000
  • 夸克浏览器AI搜索结果不准_优化夸克AI搜索设置的技巧

    调整夸克AI搜索准确度的关键是优化设置与输入方式。首先可关闭“AI搜索增强”或使用“普通搜索模式”,回归传统网页排序以获取原始信息;其次改进关键词输入,采用“人群+场景+需求”的完整句式提升语义理解精准度;最后通过关闭“搜索发现”“桌面AI助手”等非必要功能,减少干扰并提升运行效率。这些操作简单但有…

    2025年12月6日 科技
    000
  • OPPO K12 非官方渲染图曝光 后置三摄 颜值有点东西

    k 系列一直是 oppo 侧重性价比的产品线,主打线上市场,有着不错的口碑。3 月 12 日下午,cnmo 注意到,有数码博主临摹出来了 2 张 oppo k12 的猜想图,设计让人眼前一亮。不过,该博主表示,” 主要是画着好玩,如果蒙对,纯属巧合。” OPPO K12 非官…

    2025年12月5日
    100
  • 新模型阐释磁性材料“半冰半火”相态

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 布鲁克海文国家实验室近期发布消息,物理学家在研究一维亚铁磁材料模型时,发现并阐释了一种前所未见的“半冰半火”物质新相态,相关成果发表在《物理评论快报》。这一发现填补了凝聚态物理学领域的认知空白,…

    2025年12月5日
    000
  • OPPO K12 正式发布 充电五分钟通话十小时 售 1799 元起

    4月24日14点30分,oppo召开新品发布会,推出了旗下新机——oppo k12。新机提供8gb+256gb、12gb+256gb以及12gb+512gb三个版本供用户选择,售价分别为1799元、1999元、2499元。 根据官方介绍,OPPO K12 在抗摔防护上下了不少功夫。其四角采用独特的抬…

    2025年12月5日 硬件教程
    000
  • js如何实现水印效果 前端动态生成防泄密水印

    在javascript中实现水印效果主要有canvas水印和dom水印两种方式。1. canvas水印通过创建canvas元素并使用filltext()方法绘制文字,性能较好且不易被移除,但实现较复杂;2. dom水印则通过创建div元素设置样式来显示水印,更加灵活易控,但容易被用户修改或移除。动态…

    2025年12月5日 web前端
    000

发表回复

登录后才能评论
关注微信