如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

程序猿 • 2025年11月11日 05:43:44 • 用户投稿 • 阅读 1

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

编辑 | ScienceAI

深度学习模型由于其可以从海量数据中学习潜在关系的能力而在科学研究领域产生了深远影响。然而，纯粹依赖数据的模型逐渐显露出其局限性，包括对数据的过度依赖、泛化能力的限制以及与现实物理世界的一致性问题。这些问题推动着研究者探索更具解释性和可解释性的模型，以弥补数据驱动模型的不足。因此，结合领域知识和数据驱动方法，构建更具可解释性和泛化能力的模型成为当前科学研究的重要方向。这种

例如，美国OpenAI公司开发的文本到视频模型Sora因其出色的图像生成能力而备受赞誉，被认为是人工智能领域的重要进展。尽管能够生成逼真的图像和视频，Sora在处理物理定律方面仍存在一些挑战，比如重力和物体碎裂等。虽然Sora在模拟现实场景方面取得了显著进展，但在理解和准确模拟物理规律方面还有改进的空间。AI技术的发展仍需要不断努力，以提高模型的全面性和准确性，从而更好地适应各种现实世界的情境。

解决这一问题的一个潜在途径是将人类知识融入深度学习模型中。通过结合先验知识和数据，可以增强模型的泛化能力，从而产生能够理解物理规律的「知情机器学习」（Informed machine learning）模型。这种方法有望提高模型的性能和准确性，使其能够更好地应对现实世界中的复杂问题。通过将人类专家的经验和洞察力融入机器学习算法，我们可以建立更加智能和高效的系统，从而推动人工智能技术的发展和应用。

目前，对深度学习中知识的确切价值仍然缺乏深入探讨。在确定哪些先验知识可以有效地整合到模型中以进行“预学习”方面，存在着一个急需解决的难题。同时，盲目地融合多项规则可能导致模型的失效，这一点也是需要引起重视的。这些限制给数据与知识关系的深入探索带来了挑战。

针对这一问题，东方理工（EIT）和北京大学的研究团队提出了「规则重要性」的概念，并开发了一套框架，能精确计算每个规则对模型预测精度的贡献。该框架不仅揭示了数据和知识之间的复杂相互作用关系，为知识嵌入提供了理论性指导，还有助于在训练过程中平衡知识和数据的影响。此外，该方法还可用于识别不恰当的先验规则，为交叉学科领域的研究与应用提供广阔前景。

这项研究题为“Prior Knowledge’s Impact on Deep Learning”，已于2024年3月8日在 Cell 出版社旗下的跨学科期刊《Nexus》上发表。该研究受到了 AAAS（美国科学促进会）和 EurekAlert! 的关注报道。

在教授孩子拼图时，既可以让他们通过反复试验来找出答案，也可以用一些基本的规则和技巧来引导他们。同样地，将规则和技巧——比如物理定律——融入到人工智能训练中能让它们更贴近现实，运作更高效。然而，如何评估这些规则在人工智能中的价值，一直是困扰研究者的难题。

鉴于先验知识的丰富多样性，将先验知识融入深度学习模型是一个复杂的多目标优化任务。研究团队创新性地提出了一个框架，以量化不同先验知识在提高深度学习模型方面的作用。他们将此过程视为充满合作与竞争的博弈，通过评估规则对模型预测的边际贡献来界定其重要性。首先生成所有可能的规则组合（即「联盟」），并对每个组合构建模型，并计算均方误差。

为降低计算成本，他们采用了一种基于扰动的高效算法：先训练一个完全基于数据的神经网络作为基线模型，然后逐一加入各个规则组合进行额外训练，最后在测试数据上评估模型表现。通过比较模型在包含和不包含某个规则的所有联盟中的表现，可以计算出该规则的边际贡献，进而得出其重要性。

图示：规则重要性的计算流程（来源：论文）

通过流体力学的算例，研究人员探讨了数据与规则间的复杂关系。他们发现，在不同任务中，数据和先验规则的作用完全不同。当测试数据与训练数据分布相近时（即 In-distribution），数据量的增加会削弱规则的作用。

然而，当测试数据与训练数据分布相似度较低时（即 Out-of-distribution），全局规则的重要性被凸显出来，而局部规则的影响则被削弱。这两类规则的区别在于：全局规则（如控制方程）影响整个域，而局部规则（如边界条件）仅作用于特定区域。

知我AI

一款多端AI知识助理，通过一键生成播客/视频/文档/网页文章摘要、思维导图，提高个人知识获取效率；自动存储知识，通过与知识库聊天，提高知识利用效率。

26 查看详情

图示：规则重要性与数据量之间的关系（来源：论文）

研究团队经数值实验发现，在知识嵌入中，规则间存在三种相互作用效应：依赖效应、协同效应和替代效应。

依赖效应指某些规则需依赖其他规则才能有效；协同效应表明多条规则共同作用的效果超越各自独立作用时的总和；替代效应则显示一条规则的功能可能被数据或其他规则替代。

这三种效应同时存在，并受到数据量的影响。通过计算规则重要性，可清晰展示这些效应，为知识嵌入提供重要指导。

在应用层面，研究团队试图解决知识嵌入过程中的一个核心问题：如何平衡数据与规则的作用，以提升嵌入效率并筛选出不适宜的先验知识。在模型的训练过程中，该团队提出了一种动态调整规则权重的策略。

具体而言，随着训练迭代步的增加，逐渐增大正重要性规则的权重，同时减小负重要性规则的权重。这种策略能够根据优化过程的需求，实时调整模型对不同规则的关注度，从而实现更加高效和准确的知识嵌入。

此外，向 AI 模型传授物理定律可以使它们「更加贴近现实世界，从而在科学和工程领域发挥更大作用」。因此，该框架在工程、物理和化学领域具有广泛的实际应用。研究人员不仅优化了机器学习模型来求解多元方程，还准确识别出对薄层色谱分析预测模型性能有提升效果的规则。

实验结果显示，通过融入这些有效规则，模型的性能得到了显著提升，测试数据集上的均方误差从 0.052 降低至 0.036（减少了 30.8%）。这意味着该框架可以将经验性见解转化为结构化知识，从而显著提升模型性能。

总体而言，准确评估知识的价值有助于构建更契合现实的AI模型，提高安全性和可靠性，对深度学习发展具有重要意义。

图示：通过规则重要性以识别有效的规则（来源：论文）

接下来，研究团队计划将他们的框架开发成可供人工智能开发人员使用的插件工具。他们的最终目标是开发出能够直接从数据中提取知识和规则，进而自我完善的模型，从而打造一个从知识发现到知识嵌入的闭环系统，使模型成为真正的人工智能科学家。

论文链接：https://www.cell.com/nexus/fulltext/S2950-1601(24)00001-9

AAAS 报道链接：https://www.eurekalert.org/news-releases/1036117

以上就是如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/619338.html

sora 理论

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

详细介绍ThinkPHP5中如何调用方法

上一篇 2025年11月11日 05:42:48

DeepSeek怎么用快捷键操作 DeepSeek常用快捷键一览及操作演示

下一篇 2025年11月11日 05:43:49

html的基础理论

本篇文章给大家分享的是关于html基础理论知识，内容很不错，有感兴趣的朋友可以看一下 HTML 语义化 HTML标签的语义化是指：通过使用包含语义的标签（如h1-h6）恰当地表示文档结构 css命名的语义化是指：为html标签添加有意义的class 为什么需要语义化：立即学习“前端免费学习笔记（…

程序猿
用户投稿 2025年12月21日
0000
Sora怎样用物理模拟生成逼真_Sora用物理模拟生成逼真【逼真生成】

Sora可通过集成物理引擎与动态系统提升视频真实感：一、利用刚体动力学模拟物体运动，结合物理引擎计算位置姿态，并将结果作为条件输入扩散模型，确保运动符合牛顿定律且帧间连续；二、应用流体动力学求解纳维-斯托克斯方程，模拟水、烟、火等现象，通过多分辨率网格与中间表示图支持生成网络；三、引入柔体与布料模拟…

程序猿
2025年12月2日 • 用户投稿
0000
谷歌10M上下文窗口正在杀死RAG？被Sora夺走风头的Gemini被低估了？

要说最近最郁闷的公司，谷歌肯定算得上一个：自家的 Gemini 1.5 刚刚发布，就被 OpenAI 的 Sora 抢尽了风头，堪称 AI 界的「汪峰」。具体来说，谷歌这次推出的是用于早期测试的 Gemini 1.5 的第一个版本 ——Gemini 1.5 Pro。它是一种中型多模态模型（涉及文本…

程序猿
2025年12月2日 • 用户投稿
2000
南大俞扬深度解读：什么是「世界模型」？

随着媒体狂炒Sora，OpenAI的介绍材料中称Sora是「world simulator」，世界模型这个词又进入视野，但很少有文章来介绍世界模型。这里回顾一下什么是世界模型，以及讨论Sora是不是world simulator。什么是world models/世界模型当AI领域中讲到世界/w…

程序猿
2025年12月2日 • 用户投稿
1000
Sora无法替代人类！亚马逊工程师断言：实际工作冲突不可能靠AI解决

这一周，OpenAI视频AI工具Sora一出现，可谓是炸翻了天。「饭碗保不住了」的恐惧，真实地击中了许多人。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片不过，亚马逊的一位工程师Cameron Gould则认为，其实并不必对AI如…

程序猿
2025年12月2日 • 用户投稿
0000
OpenAI承诺多举措加强Sora监管严控深度伪造风险 !

近日，OpenAI与美国演员工会（SAG-AFTRA）等机构联合发布声明，宣布建立深度协作机制，重点防范其AI视频生成工具Sora可能带来的深度伪造滥用风险。![图片](https://example.com/sora_image1.jpg)Sora是OpenAI推出的文本生成视频模型，自亮相以来便…

程序猿
用户投稿 2025年12月2日
0000
Sora提示优化怎么迭代_Sora提示词迭代优化视频质量指南

明确答案：通过细化场景、动作、镜头语言和分层结构优化提示词可显著提升Sora视频质量。具体包括指定时间、气候、材质；定义行为路径与情绪；运用摄影术语控制视角；构建模块化提示结构并排除干扰元素。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ …

程序猿
2025年12月2日 • 用户投稿
0000
OpenAI联手多方严控Sora深度伪造风险，采取三大措施加强监管

近日，人工智能（AI）研究机构OpenAI与美国演员工会（SAG-AFTRA）、知名演员布莱恩·克兰斯顿以及多个表演者权益组织联合发布声明，宣布达成深度合作，旨在共同应对旗下AI视频生成工具Sora可能带来的深度伪造（Deepfake）滥用风险。Sora是OpenAI推出的一款基于文本生成视频的先进…

程序猿
用户投稿 2025年12月2日
1000
快手可灵AI聚焦影视制作，三季报亮眼加速构建AI应用生态

近日，快手召开了2025年第三季度业绩电话会议。针对当前备受关注的视频生成领域竞争态势以及可灵AI未来的技术演进方向，公司相关负责人在会上作出回应。目前，视频生成赛道已吸引众多互联网巨头与初创企业纷纷入局。这一现象不仅反映出该赛道具备广阔的发展前景，也说明行业整体仍处于技术快速迭代和产品形态持续探索…

程序猿
用户投稿 2025年12月2日
0000
用户投稿

欧洲首款 HBM 内存数据中心推理处理器 VSORA Jotunn8 流片，台积电 5nm 制程

11 月 24 日消息，台积电参股的 ASIC 设计服务企业创意电子 GUC 今日宣布，其参与的 Jotunn8 成功准时流片 (tape-out)，这款来自 VSORA 的芯片也是欧洲首款配备 HBM 内存的数据中心推理处理器。 VSORA Jotunn8 专为 AI 推理工作负载而设计，以创新架…

程序猿
2025年12月2日
0000
用户投稿

快过 ChatGPT，蚂蚁灵光 AI 助手上线 4 天下载突破 100 万

蚂蚁灵光上线 4 天下载量突破 100 万，冲上 App Store 中国区免费榜第六，灵光首个百万下载速度超过 ChatGPT、Sora2、DeepSeek 等全球主流 AI 产品。 11 月 18 日，蚂蚁集团官宣推出全模态通用 AI 助手“灵光”，首批上线三大功能 ——“灵光对话”、“灵光闪应…

程序猿
2025年12月2日
2000
想训练类Sora模型吗？尤洋团队OpenDiT实现80%加速

Sora 在 2024 年初的惊艳表现成为了新的标杆，激励着所有研究文生视频的人士争相追赶。每个研究者都怀着复现 Sora 成果的渴望，争分夺秒地努力着。根据 OpenAI 披露的技术报告，Sora 的一个重要创新点是将视觉数据转换为 patch 的统一表示形式，并通过 Transformer 和…

程序猿
2025年12月1日 • 用户投稿
0000
AI视频又炸了！照片+声音变视频，阿里让Sora女主唱歌小李子说RAP

sora之后，居然还有新的ai视频模型，能惊艳得大家狂转狂赞！ ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片有了它，《狂飙》大反派高启强化身罗翔，都能给大伙儿普法啦（狗头）。这就是阿里最新推出的基于音频驱动的肖像视频生成框架，EM…

程序猿
2025年12月1日 • 用户投稿
1000
让Sora东京女郎唱歌、高启强变声罗翔，阿里人物口型视频生成绝了

有了阿里的 emo，ai 生成或真实的图像「动起来说话或唱歌」变得更容易了。最近，以 OpenAI Sora 为代表的文生视频模型又火了起来。除了文本生成视频，以人为中心的视频合成一直备受关注。比如，专注于“说话人头部”的视频生成，其目标是根据用户提供的音频片段生成面部表情。在技术层面上，生成…

程序猿
2025年12月1日 • 用户投稿
0000
字节万卡集群技术细节公开：2天搞定GPT-3训练，算力利用率超英伟达Megatron-LM

随着对sora技术分析的展开，ai基础设施的重要性愈发凸显。来自字节和北大的一篇新论文在此时吸引关注：文章披露，字节搭建起的万卡集群，能在1.75天内完成GPT-3规模模型（175B）的训练。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜…

程序猿
2025年12月1日 • 用户投稿
0000
周鸿祎2024大模型预测已验证八条称Sora出现超出预料

“我讲课不割韭菜，宗旨是免费、分享、科普、交流。ai时代技术发展迅速，ai知识普及尤为重要。”2月29日，360公司创始人周鸿祎免费课正式开启，全网多平台直播了ai系列第一讲“预见agi”，千万网友观看。免费课上，周鸿祎系统分享了对ai新发展趋势的洞察、企业拥抱ai的建议，并现场演示了大模型重塑的两…

程序猿
2025年12月1日 • 用户投稿
2000
《妈妈咪呀》国际女星一夜被AI端掉饭碗！

前几天，OpenAI刚宣布进军好莱坞，并放出一波导演艺术家们体验Sora的震撼视频。仅仅几天的时间，已经有国际著名明星，饭碗一夜之间被AI端掉了！ ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 她，就是音乐剧《妈妈咪呀》的主演——Sara…

程序猿
2025年12月1日 • 用户投稿
1000
【Multi-Agent实战】如何用 LangChain 打造一个 Multi-Agent 实战项目

【multi-agent】一、如何用 langchain 打造一个 multi-agent 实战 ✍ 前言这篇就是给已经玩过 langchain tools + agent 的同学看的进阶篇：你已经玩过 time / weather 这种自定义工具；也看过 AgentType.CHAT_ZERO…

程序猿
2025年12月1日 • 用户投稿
0000
北航打破模态壁垒，跨可见光-红外模态的通用物理对抗攻击方法来了

近年来，针对视觉感知系统安全性评估的探索逐步深入，先后有研究者成功实现基于眼镜、贴纸、衣服等不同载体的可见光模态安全评估技术，也有一些针对红外模态的新尝试。但是它们都只能作用于单一模态。随着人工智能技术的发展，可见光 – 热红外成像技术已同时应用于治安监控、自动驾驶等诸多安全关键任务中…

程序猿
2025年12月1日 • 用户投稿
1000
「场景控制传送门：四合一物体传送，上交&蚂蚁出品」

在常见的图像编辑操作中，图像合成是指将一张图片的前景物体与另一张背景图片结合，生成一张合成图的过程。合成后的图像在视觉效果上类似于将前景物体从一张图片传送到另一张背景图片上，如下图所示图像合成在艺术创作、海报设计、电子商务、虚拟现实、数据增广等领域被广泛使用通过简单的剪切粘贴得到的合成图可能会存…

程序猿
2025年12月1日 • 用户投稿
0000

发表回复

登录后才能评论

如何把大量物理知识塞给AI？EIT和北大团队提出「规则重要性」概念

关于作者

相关推荐

发表回复