神经符号回归:从数据中提取科学

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

神经符号回归:从数据中提取科学

译者 | 李睿

审校 | 孙淑娟

宇宙是嘈杂而混乱的,复杂到让人们的预测变得困难。人类的智慧和直觉有助于对周围世界的一些活动有着基本的了解,并且足以从个人和小团体的有限视角在宏观空间和时间尺度上对各个事件有一些基本的理解。

人类史前和古代的自然哲学家大多局限于常识合理化和猜测检验。这些方法具有很大的局限性,特别是对于太大或太复杂的事情,因此导致迷信或魔法思维的盛行。

这并不是贬低猜测和检查(这是现代科学方法的基础),而是要看到人类调查和理解能力的变化是由将物理现象提炼成数学表达式的愿望和工具所引发的。

这在牛顿和其他科学家领导启蒙运动之后尤其明显,尽管在古代也有分析还原论的痕迹。从观察到数学方程(以及这些方程做出的预测)的能力是科学探索和进步不可或缺的一部分。

深度学习从根本上讲也是关于学习与输入-输出观察相关的转换,就像人类科学家试图以数学表达式的形式学习输入和输出之间的函数关系一样。

当然,不同之处在于深度神经网络学习的输入-输出关系(通用逼近定理的结果)由一个不可解释的数值参数“黑盒”组成,主要是权重、偏差和它们连接的节点。

通用逼近定理指出,满足非常宽松标准的神经网络应该能够非常接近任何表现良好的函数。在实践中,神经网络是一个脆弱而有漏洞的抽象概念,它代表了由简单而精确的基础方程产生的输入输出关系。

除非特别注意训练模型(或模型集成)以预测不确定性,否则神经网络在其训练的分布之外进行预测时往往表现非常差。

深度学习预测在做出可证伪的预测方面也表现不佳,即开箱即用的构成科学方法基础的假设。因此,虽然深度学习是一种经过充分验证的工具,擅长拟合数据,但它在人类最重要的追求之一的实用性受到限制,这个追求就是通过科学方法探索人们周围的宇宙。

尽管深度学习在人类的科学努力中存在着各种的缺点,但不能忽视深度学习在科学学科中的巨大拟合能力和众多成功之处。

现代科学产生了大量的数据,个人(甚至是团队)无法观察这些数据的输出,也无法从嘈杂的数据直观地转换为清晰的数学方程。

为此,可以求助于符号回归,这是一种将数据简化为方程的自动化或半自动化方法。

当前的黄金标准:进化方法

在进入将现代深度学习应用于符号回归的一些令人兴奋的最新研究之前,必须首先了解将数据集转化为方程的进化方法的当前状态。最常提到的符号回归软件包是基于遗传算法的Eureqa。

Eureqa最初是作为康奈尔大学HodLipson团队的一个研究项目开发的,并作为Nutonian的专有软件提供,后来被DataRobot公司收购。Eureqa已经集成到Datarobot平台中,由Eureqa的合著者兼Datarobot Michael Schmidt公司的首席技术官负责。

Eureqa和类似的符号回归工具使用遗传算法同时优化方程组,以实现准确性和简单性。

TuringBot是一个基于模拟退火的替代符号回归包。模拟退火是一种优化算法,类似于用于改变金属物理性质的冶金退火。

在模拟退火中,选择优化问题的候选解决方案时会降低“温度”,其中较高的温度对应于接受较差的解决方案,并用于促进早期探索,从而能够搜索全局最优值,并提供能量来逃避局部最优值。

TuringBot是基于模拟退火的另一种符号回归包。模拟退火是一种优化算法,类似于用于改变金属物理性质的冶金退火。

在模拟退火中,选择优化问题的候选解决方案时会降低“温度”,其中较高的温度对应于接受较差的解决方案,并用于促进早期探索,从而能够搜索全局最优值,并提供能量来逃避局部最优值。

TuringBot是一个免费版本,但在数据集大小和复杂性方面有很大的限制,并且代码不允许修改。

虽然商业符号回归软件(尤其是Eureqa)在开发符号回归的新工具时提供了重要的比较基准,但闭源程序的作用是有限的。

另一个名为PySR的开源替代方案在Apache 2.0许可下发布,由普林斯顿大学博士生Miles Cranmer领导,并分享了准确性和简约性(简单性)的优化目标,以及Eureqa和TuringBot使用的组合方法。

除了提供用于执行符号回归的免费且可自由修改的软件库之外,PySR从软件的角度来看也很有趣:它是用Python编写的,但使用Julia编程语言作为快速后端。

虽然遗传算法通常被认为是符号回归的当前最先进技术,但在过去几年中,新的符号回归策略出现了令人兴奋的爆炸式增长。

其中许多新的发展利用了现代深度学习模型,或者作为多步骤过程中的函数近似组件,或者以基于大型Transformer模型的端到端方式,最初是为自然语言处理开发的,以及介于两者之间的任何内容。

除了基于深度学习的新符号回归工具之外,概率和统计方法也在复苏,尤其是贝叶斯统计方法。

结合现代计算能力,新一代符号回归软件不仅本身是一项有趣的研究,而且为包括大数据集和综合实验在内的科学学科提供了真正的实用性和贡献。

以深度神经网络作为函数逼近器的符号回归

由于Cybenko和Hornik在上世纪80年代末/90年代初描述和研究的通用逼近定理,可以预期具有至少一个非线性激活隐藏层的神经网络能够逼近任何表现良好的数学函数。

在实践中,倾向于在更复杂的问题上使用更深层次的神经网络获得更好的性能。然而,原则上,需要一个隐藏层来逼近各种函数。

受物理学启发的AI Feynman算法将通用逼近定理作为一个更复杂难题的一部分。

AI Feynman(及其继任者AI Feynman 2.0)是由物理学家Silviu-Marian Udrescu和Max Tegmark(以及一些同事)开发的。AI Feynman利用了许多物理方程中的函数特性,例如平滑度、对称性和组合性以及其他一些特性。

神经网络作为函数逼近器发挥作用,学习数据集中表示的输入-输出变换对,并通过在相同的函数变换下生成合成数据来促进对这些特性的研究。

AI大学堂 AI大学堂

科大讯飞打造的AI学习平台

AI大学堂 87 查看详情 AI大学堂

AI Feynman用来解决问题的函数特性在物理学方程中很常见,但并不能任意应用于所有可能的数学函数的空间。但是,它们仍然是在与现实世界相对应的各种函数中寻找的合理假设。

与前面描述的遗传算法和模拟退火方法一样,AI Feynman从头开始拟合每个新数据集。不涉及泛化或预训练,深度神经网络仅构成一个更大的、物理信息丰富的系统中精心编排的一部分。

AI Feynman符号回归在破译Feynman物理学讲座中的100个方程(或谜团)方面表现出色,但缺乏泛化意味着每个新数据集(对应于一个新方程)都需要大量的计算预算。

用于符号回归的一组新的深度学习策略利用了非常成功的Transformer模型系列,最初由Vaswani等人作为自然语言模型引入。这些新方法并不完美,但使用预训练可以在推理时节省大量计算时间。

基于自然语言模型的第一代符号回归

鉴于基于注意力的超大型Transformer模型在计算机视觉、音频、强化学习、推荐系统和许多其他领域(除了基于文本的自然语言处理的原始角色)的各种任务上取得了巨大成功,因此Transformer模型最终也将应用于符号回归也就不足为奇了。

虽然数字输入-输出对到符号序列的领域需要一些仔细的工程,但数学表达式基于序列的性质自然适用于Transformer方法。

至关重要的是,使用Transformer生成数学表达式使他们能够利用对数百万个自动生成的方程的结构和数值含义进行预训练。

这也为通过扩大规模来改进模型奠定了基础。缩放是深度学习的主要优势之一,其中更大的模型和更多的数据继续提高模型性能,远远超出过拟合的经典统计学习限制。

缩放是Biggio等人在主题为“可缩放的神经符号回归”的论文中提及的主要优势,其名称为NSRTS。NSRTS Transformer模型使用专用编码器将每个输入输出对数据集转换为一个潜在空间。编码的潜在空间具有固定大小,而与编码器的输入大小无关。

NSRTS解码器构建一个令牌序列来表示一个方程,其条件是编码的潜在空间和到目前为止生成的符号。至关重要的是,解码器仅输出数字常量的占位符,但在其他方面使用与预训练方程数据集相同的词汇表。

NSRTS使用PyTorch和PyTorch Lightning,并拥有许可的开放源码MIT许可证。

在生成无常数方程(称为方程骨架)之后,NSRTS使用梯度下降来优化常数。这种方法在序列生成之上分层了一个通用优化算法,由Valipour等人同时开发的所谓的“SymbolicGPT”共享。

Valipour等人没有像NSRTS方法中那样使用基于注意力的编码器。而是使用基于斯坦福点云模型PointNet的模型来生成一个固定维特征集,供Transformer解码器用于生成方程。与NSRT一样,Symbolic GPT使用BFGS来查找Transformer解码器生成的方程骨架的数值常数。

基于自然语言模型的第二代符号回归

虽然最近的一些文章描述了使用自然语言处理(NLP)Transformer来实现符号回归的泛化和可扩展性,但上述模型并不是真正的端到端,因为它们不估计数值常数。

这可能是一个严重的缺陷:想象一个模型可以生成具有1000个不同频率的正弦基的方程。使用BFGS优化每个项的系数可能会非常适合大多数输入数据集,但实际上,它只是执行傅里叶分析的一种缓慢而迂回的方式。

就在2022年春季,第二代基于Transformer的符号回归模型已在ArXiv上由Vastl等人在SymFormer上发布,而另一个端到端Transformer由Kamienny及其同事发布。

这些和以前基于Transformer的符号回归模型之间的重要区别在于它们预测数字常数以及符号数学序列。

SymFormer利用双头Transformer解码器来完成端到端的符号回归。一个头产生数学符号,第二个头学习数值回归任务,即估计方程中出现的数值常数。

Kamienny和Vastl的端到端模型在细节上有所不同,例如数值估计的精度,但两组的解决方案仍然依赖于后续的优化步骤进行细化。

即便如此,根据作者的说法,它们比以前的方法具有更快的推理时间,并产生更准确的结果,产生更好的方程骨架,并为优化步骤提供了良好的起点和估计常数。

象征性回归的时代来临

在大多数情况下,符号回归一直是一种精巧且计算密集型的机器学习方法,在过去十年的时间里,它得到的关注远远低于一般的深度学习。

这在一定程度上是由于遗传或概率方法的“即用即失”方法,对于每个新数据集,它们必须从头开始,这一特征与深度学习到符号回归的中间应用(如AI Feynman)是相同的。

在符号回归中使用Transformer作为整体组件,使得最近的模型能够利用大规模的预训练,从而减少推理时的能量、时间和计算硬件需求。

这一趋势得到了进一步的扩展,新的模型可以估计数值常数和预测数学符号,从而实现更快的推理和更高的准确性。

生成符号表达式的任务反过来可以用来生成可测试的假设,这是一项非常人性化的任务,并且是科学的核心。在过去的二十年中,符号回归的自动化方法继续取得令人感兴趣的技术进步,但真正的考验是它们是否对从事真正科学的研究人员有用。

符号回归开始在技术演示之外产生越来越多的可发表的科学结果。贝叶斯符号回归方法产生了一个新的预测细胞分裂的数学模型。

另一个研究小组使用稀疏回归模型生成了海洋湍流的合理方程,为改进多尺度气候模型铺平了道路。

一个将图神经网络和符号回归与Eureqa的遗传算法相结合的项目概括了描述多体引力的表达式,并从传统的模拟器中推导出了一个描述暗物质分布的新方程。

符号回归算法的未来发展

符号回归正在成为科学家工具箱中的一个强大工具。基于Transformer方法的泛化、可扩展性仍然是热门话题,还没有渗透到一般的科学实践中。随着越来越多的研究人员适应和改进模型,它有望进一步推动科学发现。

这些项目中有许多是在开放源码许可下进行的,因此可以预期它们将在几年内产生影响,而且它们的应用可能比Eureqa和TuringBot等专有软件更广泛。

符号回归是对深度学习模型输出的一种自然补充,深度学习模型的输出往往神秘且难以解释,而数学语言中更易于理解的输出可以帮助产生新的可验证假设,并推动直观的飞跃。

这些特征和最新一代符号回归算法的直接能力有望为获得重大发现的时刻提供更多的机会。

以上就是神经符号回归:从数据中提取科学的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/568533.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月10日 04:45:19
下一篇 2025年11月10日 04:49:40

相关推荐

  • html官方资源入口_html网站免费设计导航

    html网站免费设计导航入口是https://www.htmldesignresources.com,该平台提供HTML模板、响应式示例、表单组件和CSS样式资源,支持预览、搜索、筛选与代码复制,并设有社区投稿、论坛交流及季度报告更新功能。 html网站免费设计导航入口在哪里?这是不少网页设计爱好者…

    2025年12月23日
    000
  • 如何用HTML插入标签云组件_HTML CSS3变换与随机颜色生成算法

    使用HTML构建标签结构,CSS3添加旋转与过渡效果,JavaScript生成随机HSL颜色并设置字体大小,实现动态交互的标签云组件。 要在网页中实现一个动态的标签云组件,结合 HTML、CSS3 变换和随机颜色生成算法,可以按照以下步骤操作。这个组件不仅能提升页面视觉效果,还能通过色彩和旋转增加交…

    2025年12月23日
    000
  • 如何在Go Gin应用中集成前端JavaScript模块(如Sentry)

    本文探讨了在Go Gin框架下,通过HTML模板服务前端页面时,如何有效集成JavaScript模块(如Sentry)。针对浏览器不直接支持Node.js模块导入语法的问题,文章详细阐述了利用CDN引入Sentry SDK的解决方案,并提供了具体的代码示例,帮助开发者实现前端错误监控功能,避免了复杂…

    2025年12月23日
    000
  • html官网浏览入口_html网站设计免费平台

    html官网浏览入口在https://www.codepen.io,该平台支持实时预览代码、创建Pen项目、Fork开源示例,可添加外部资源,具备点赞评论收藏等社区互动功能,设有挑战活动与作品集分类,开放API接口,界面简洁适合初学者,在线编写无需配置环境,支持多种预处理器和响应式测试。 html官…

    2025年12月23日
    000
  • HTML数据怎样进行情感分析 HTML数据情感挖掘的实现路径

    答案是:从HTML中提取有效文本并进行情感分析需先清理标签获取正文,再经文本预处理、分词与去噪后,应用词典、机器学习或深度学习模型判断情感倾向,最终整合结果并可视化,实现舆情监控与评价分析。 对HTML数据进行情感分析,核心在于从网页内容中提取有效文本,并在此基础上应用自然语言处理技术判断情感倾向。…

    2025年12月23日
    000
  • HTML5 section怎么用_HTML5内容分区标签应用场景说明

    在HTML5中,标签用于定义文档中具有明确主题的独立内容区块,需包含标题以体现其结构性与语义性,常用于文章章节、产品模块等场景,区别于无语义的和可独立分发的。 在HTML5中,section 标签用于定义文档中的一个独立内容区块。它不是简单的容器,而是有语义的结构化标签,表示文档中一个主题性的分区,…

    2025年12月23日
    000
  • htm算法 前景如何_分析HTM算法应用前景

    HTM算法在实时异常检测、预测性维护等时序数据场景中具备应用价值,其无需大量标注数据的特性适合工业监控、网络安防等领域;但受限于生态薄弱、性能不及主流模型及工程实现难度,短期内难以成为主流,更可能作为边缘计算或AI系统补充技术,在特定专业领域持续发展。 HTM(Hierarchical Tempor…

    2025年12月23日
    000
  • html如何修改日期样式

    在html中,可以使用“::-webkit-datetime-edit”伪元素选择器来修改日期格式,只需要用该选择器选中元素,在设置具体样式即可,具体语法为“::-webkit-datetime-edit{属性:属性值}”。 本教程操作环境:windows7系统、CSS3&&HTML…

    2025年12月21日
    100
  • 单选框的type属性值为什么

    单选框的type属性值为“radio”。html type属性可以规定要显示的输入框“”元素的类型;值为“radio”时显示为单选框、“checkbox”时显示为复选框、“select”时显示为下拉式选框等等。 本教程操作环境:windows7系统、HTML5版、Dell G3电脑。 在HTML中,…

    2025年12月21日
    000
  • HTML中type是什么意思

    在HTML中,type是类型的意思,是一个标签属性,主要用于定义标签元素的类型或文档(脚本)的MIME类型;例在input标签中type属性可以规定input元素的类型,在script标签中type属性可以规定脚本的MIME类型。 本教程操作环境:windows7系统、html5版、Dell G3电…

    2025年12月21日
    000
  • HTML中ul标签如何去掉点?HTML无序列表的样式实例解析

    本篇文章主要讲述的是关于html中的ul标签的默认小点给取消掉,还有关于html的无序列表ul标签的样式解释,给出了ul标签中的type属性三种值的介绍。现在就让我们一起来看本篇文章吧 首先这篇文章一开始我们就开始介绍在html中是怎么把ul标签的点给去掉的: 大家应该都使用过ul无序列表标签,ul…

    2025年12月21日 好文分享
    000
  • html中的ol标签如何去掉标号呢?标签的使用方法总结

    本篇文章介绍了html的ol标签是怎么去掉序号标号的,这里还有代码的详细解释,还有介绍了关于html ol有序列表标签如何更改序号,下文介绍了三种序号,大家也可以自己去想填写怎样的序号。现在来看这篇文章吧 一、我们先看看html中的ol标签是如何去掉标号的呢: 我们都知道html的ol标签是个有序列…

    2025年12月21日 好文分享
    000
  • HTML ul标签的什么意思?HTML ul标签的作用详解

    本篇文章主要的为大家讲解了关于html ul标签的三种重要的用法,还有关于html ul标签的解释,包含li标签的还有type属性对ul标签的使用情况,好了,下面大家一起来看文章吧 首先让我们先来解释一下HTML ul标签的意思: ul标签定义的是表格当中无序列表,表格当中的无序列表都是在 标签之中…

    2025年12月21日
    000
  • javascript框架和库是什么_如何选择React、Vue或Angular?

    JavaScript框架与库分别提供按需调用的功能集合和约束性开发结构;React是UI组件库,生态灵活但需自行整合工具;Vue渐进式易上手,兼顾原型与工程化;Angular是全功能TypeScript框架,适合强规范企业级项目。 JavaScript框架和库是封装好的代码集合,用来简化前端开发——…

    2025年12月21日
    000
  • React应用生产环境环境变量配置深度指南

    本文针对react应用在生产环境中无法读取`.env`文件配置的环境变量问题,深入剖析其工作原理、常见原因及排查方法。通过详细的步骤和示例代码,指导开发者正确配置和使用环境变量,解决api调用层面的`null`响应问题,确保应用在生产环境下的稳定运行。 在React应用开发中,环境变量(如API密钥…

    2025年12月21日
    000
  • JS注解怎么实现文档化_ JS注解生成开发文档的流程与工具

    JSDoc是一种JavaScript结构化注释规范,通过@param、@returns等标签描述代码元素,并借助工具生成HTML文档,结合IDE支持和CI/CD可提升团队协作效率。 JavaScript本身不支持原生注解(Annotation)像Java那样的语法,但通过约定的注释格式和配套工具,可…

    2025年12月21日
    000
  • JS注解怎么标注联合类型_ JS联合类型的注解书写与使用技巧

    在JavaScript中可通过JSDoc使用联合类型注解,如string|number表示多类型支持,结合@param、@typedef等标签提升代码可读性与编辑器提示,适用于函数参数、返回值等场景。 在JavaScript中,虽然原生不支持类型注解,但在使用JSDoc配合现代编辑器(如VS Cod…

    2025年12月21日
    000
  • JavaScript数学计算与数值分析库

    math.js适合日常复杂计算,numeric.js专精数值分析,simple-statistics用于统计分析,TensorFlow.js适用于AI与大规模数值运算。 JavaScript虽然原生支持基本的数学运算,但在处理复杂数学计算、数值分析或科学计算时,依赖第三方库能大幅提升开发效率和计算精…

    2025年12月21日
    000
  • 构建基于Vuetify的所见即所得(WYSIWYG)编辑器

    本文探讨了如何利用vuetify的现有组件快速构建一个功能性的所见即所得(wysiwyg)编辑器。我们将重点介绍v-textarea作为内容输入区,以及v-btn-toggle和v-btn作为格式化工具栏的实现方式,并提供示例代码以帮助开发者理解其核心逻辑。同时,文章也提及了脱离框架,从零开始构建w…

    2025年12月21日
    000
  • 浏览器端基于face-api.js的多人脸识别系统构建与优化

    本教程详细探讨了在浏览器中使用face-api.js构建多人脸识别系统时,如何解决人脸误识别的问题。核心在于正确地为每个用户生成独立的标签化人脸描述符(labeledfacedescriptors),并利用facematcher进行高效准确的匹配。文章提供了完整的svelte代码示例,涵盖模型加载、…

    2025年12月20日
    000

发表回复

登录后才能评论
关注微信