NeurIPS 2024 | 用LLM探寻隐秘的因果世界

利用大型语言模型揭示隐藏因果关系的挑战与突破

因果关系的发现与分析是科学研究的核心,但现有的因果发现算法依赖于预先定义的高级变量,而这些变量在现实世界中往往匮乏。尤其对于图片、文本等高维非结构化数据,更是如此。香港浸会大学等机构的研究人员在NeurIPS 2024发表论文《Discovery of the Hidden World with Large Language Models》,提出了一种名为COAT的新型框架,旨在利用大型语言模型 (LLM) 来克服这一难题,从而更有效地识别现实世界中的因果关系。

论文链接:https://www.php.cn/link/2fdddc426480d46ce18affae5e455c82

代码链接:https://www.php.cn/link/5807f0ed140fffaa1f35f16baf72e31b

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

NeurIPS 2024 | 用LLM探寻隐秘的因果世界

研究背景

科学进步依赖于对关键变量及其因果关系的识别。传统的因果发现方法 (CDs) 依赖于人类专家提供的高质量变量,但在实际应用中,这些变量往往难以获得。例如,分析用户评分的电商卖家,只能获取用户评论等非结构化数据。因此,高级变量的匮乏限制了 CDs 方法的应用范围。

LLM 在理解非结构化数据方面展现出强大的能力,并能解决各种复杂任务。一些研究表明,LLM 可以回答因果问题,但现有方法主要将其作为因果变量的直接推理器,可靠性存疑,且缺乏对因果发现理论保证的充分讨论。因此,如何可靠地利用 LLM 揭示现实世界的因果机制成为一个关键问题。

COAT框架:LLM作为表征辅助工具

本研究的目标是利用 LLM 为非结构化数据构建结构化表征,该表征由一系列高级变量组成,能够捕捉目标信息并具有可解释性。为此,研究人员提出了 Causal representatiOn AssistanT (COAT) 框架。用户只需提供目标变量,COAT 就能迭代地寻找构成目标变量马尔可夫毯 (Markov Blanket) 的高级变量集。然后,任何合适的因果发现算法都可以用于进一步分析因果结构。

数据与目标

目标变量 (Y): 例如,消费者对产品的评分或患者的疾病类型。非结构化数据 (X): 例如,用户评论或医学图像。数据集: 由 (X, Y) 样本组成。

目标是找到一个映射函数,将非结构化数据 X 映射到高级变量集 h(X),从而构成 Y 的马尔可夫毯。

LLM 的作用:变量提出与取值解析

COAT 将映射函数分解为一系列高级变量,每个变量将原始观测映射到预定义的值空间。这些变量由 LLM 通过自然语言定义,并具有明确的物理含义。例如,“甜度”可以定义为:1 (满意),-1 (失望),0 (未提及/无法判断)。

COAT 框架包含以下步骤:

变量提出: 使用 LLM 根据样本数据提出潜在的高级变量。取值解析: 使用 LLM 为提出的高级变量解析所有样本的取值。因果发现: 使用因果发现算法 (例如 FCI) 分析结构化数据,构建因果图。反馈: 基于因果发现结果,构建反馈,引导 LLM 进一步寻找高级变量。

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图1. COAT框架示例

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图2. COAT变量提出环节Prompt示意

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图3. COAT框架总结

因赛AIGC 因赛AIGC

因赛AIGC解决营销全链路应用场景

因赛AIGC 73 查看详情 因赛AIGC

理论分析与实验结果

研究人员定义了感知分数和能力分数来衡量 LLM 提出高级变量的能力。通过理论分析和在 AppleGastronome (美食家对苹果评分) 和 Neuropathic (神经性疼痛诊断) 两个数据集上的实验,结果表明:

COAT 能够有效识别高级变量并构建因果图。COAT 的反馈机制能够有效提升变量识别能力。相比于直接使用 LLM 推理因果关系,COAT 能够获得更准确的结果。

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图5. AppleGastronome数据样例

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图6. AppleGastronome相关因果图

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图7. AppleGastronome实验结果

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图8. LLM相关能力实验评估

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图9. LLM标注噪声独立性检验

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图10. AppleGastronome数据集上COAT因果结构识别评估

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图11. Neuropathic数据样例

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图12. Neuropathic相关因果图

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图13. Neuropathic实验结果

NeurIPS 2024 | 用LLM探寻隐秘的因果世界 图14. COAT探究ENSO因果机制

结论与未来展望

COAT 框架有效地结合了 LLM 和因果发现方法的优势,能够处理非结构化数据,并为因果发现提供支持。这项研究为构建用于因果发现的强大基础模型开辟了新的方向。

引用信息

@inproceedings{causalcoat2024,
title={Discovery of the Hidden World with Large Language Models}, author={Chenxi Liu and Yongqiang Chen and Tongliang Liu and Mingming Gong and James Cheng and Bo Han and Kun Zhang},year={2024},booktitle={Proceedings of the Thirty-eighth Annual Conference on Neural Information Processing Systems}}

以上就是NeurIPS 2024 | 用LLM探寻隐秘的因果世界的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/285890.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
江南百景图解锁苏州府攻略
上一篇 2025年11月4日 18:23:37
剑网3焚心千焰动态面挂全貌 三色绝焰限时66折
下一篇 2025年11月4日 18:23:38

相关推荐

  • 开源免费PHP工具 PHP开发效率提升利器

    推荐开源免费PHP开发工具以提升效率:VS Code、Sublime Text轻量高效,PhpStorm专业强大;调试用Xdebug、Kint、Ray;依赖管理选Composer;代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer;数据库管理可用%ignore_a_1%MyA…

    2026年5月10日
    000
  • 松下案例入选《2025企业社会责任竞争力指数报告》

    松下案例入选《2025企业社会责任竞争力指数报告》松下案例入选《2025企业社会责任竞争力指数报告》松下案例入选《2025企业社会责任竞争力指数报告》松下案例入选《2025企业社会责任竞争力指数报告》

    11月14日,中国新闻社《中国新闻周刊》在北京成功举办了第二十一届企业社会责任系列活动·2025责任之星特别节目。活动以“致明天:焕新责任竞争力”为主题,汇聚了来自政府、企业及学术界的多位代表,共同探讨新时代下企业如何通过责任创新打造核心竞争力。松下电器(中国)有限公司总裁赵炳弟作为企业界代表受邀出…

    2026年5月10日 用户投稿
    000
  • 谷歌浏览器如何截图 谷歌浏览器页面截图技巧

    谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧

    使用谷歌浏览器的开发者工具截图步骤:1. 按ctrl+shift+i(windows/linux)或cmd+option+i(mac)打开开发者工具。2. 点击右上角三个点,选择”更多工具”,再选择”截图”。3. 选择截取整个页面。推荐的谷歌浏览器扩展…

    2026年5月10日 用户投稿
    100
  • JavaScript计算器开发:解决数值显示与初始化问题

    本教程深入探讨了使用JavaScript构建计算器时常见的数值显示异常问题,特别是由于类属性未初始化导致的`Cannot read properties of undefined`错误。我们将详细分析问题根源,并通过在构造函数中调用初始化方法来解决该问题,同时优化显示逻辑,确保计算器功能稳定且界面显…

    2026年5月10日
    000
  • NextAuth getToken 在服务端返回 null 的问题排查与解决

    问题描述 在使用 Next.js 和 NextAuth 构建应用程序时,有时需要在服务端获取用户的身份验证信息。getToken 函数是 NextAuth 提供的一个便捷方法,用于从请求中提取 JWT (JSON Web Token)。然而,在某些情况下,尤其是在使用 getServerSidePr…

    2026年5月10日
    000
  • HTML文档如何工作?如何编辑HTML格式文件?

    HTML文档如何工作?如何编辑HTML格式文件?HTML文档如何工作?如何编辑HTML格式文件?HTML文档如何工作?如何编辑HTML格式文件?HTML文档如何工作?如何编辑HTML格式文件?

    浏览器解析和渲染html的过程包括:1. 解析html构建dom树;2. 结合css构建渲染树;3. 布局计算元素位置;4. 绘制像素到屏幕。编辑html可使用记事本、vs code、sublime text等文本或代码编辑器,其中vs code因语法高亮、自动补全和插件生态成为主流选择。标准htm…

    2026年5月10日 用户投稿
    000
  • html标签如何读_HTML标签(语义化/结构)阅读与理解方法

    答案是掌握HTML标签的语义化含义与结构作用。理解HTML需从语义化入手,使用如article、nav、header等标签准确表达内容意义,提升可访问性、SEO和代码可维护性;阅读时应从外到内分析结构,识别页面骨架,区分语义标签与非语义标签(如div、span)的合理使用场景,避免仅凭外观选择标签,…

    2026年5月10日
    000
  • GolangWeb项目异常捕获与日志记录

    答案:通过中间件使用defer和recover捕获panic,结合zap等结构化日志库记录请求链路信息,为每个请求生成trace ID,实现异常捕获与可追踪日志,提升系统稳定性与可观测性。 在Go语言Web项目中,异常捕获与日志记录是保障系统稳定性和可维护性的关键环节。Go本身没有像其他语言那样的t…

    2026年5月10日
    000
  • Python官网用户调查的参与方式_Python官网反馈提交详细教程

    答案是通过访问Python官网新闻页面、邮件邀请链接或GitHub仓库提交反馈。具体为:访问官网查找用户调查公告,或点击邮件中的专属链接参与,在GitHub的cpython仓库提交技术建议,并注意如实填写问卷与保护隐私。 如果您希望参与Python官网的用户调查并提交反馈,可以通过官方指定的渠道完成…

    2026年5月10日
    000
  • 我有时使用 awk 而不是 Python 的四个原因

    Python 是一门强大的编程语言,但在某些特定场景下,Awk 的优势更为显著,尤其体现在可移植性、生命周期、代码简洁性和与其他工具的互操作性方面。 Python 脚本通常具有良好的可移植性,但并非总能在所有环境中完美运行,例如流行的 Docker 基础镜像 (如 Debian 和 Alpine)。…

    2026年5月10日
    000
  • Go语言连接外部MySQL数据库:DSN配置与常见错误解析

    本文详细阐述了go语言使用`go-sql-driver/mysql`驱动连接外部mysql数据库的正确方法。重点介绍了数据源名称(dsn)的规范格式,特别是主机地址部分的配置,以避免常见的“getaddrinfow: the specified class was not found.”等网络解析错…

    2026年5月10日
    000
  • Tensorflow 音乐预测

    在本文中,我展示了如何使用张量流来预测音乐风格。在我的示例中,我比较了电子音乐和古典音乐。 你可以在我的github上找到代码:https://github.com/victordalet/sound_to_partition i – 数据集 第一步,您需要创建一个数据集文件夹,并在里面…

    2026年5月10日
    000
  • 李彦宏:2025年是萝卜快跑的扩张之年 将寻找合作方

    百度计划2025年大力扩张自动驾驶出行服务平台“萝卜快跑”。百度ceo李彦宏近日在业绩会上宣布,将与电信运营商、出租车公司及其他车队运营商合作,扩大市场份额,让更多用户体验自动驾驶技术。 这对于萝卜快跑而言是至关重要的发展阶段,预计未来车队规模和服务量将实现飞速增长。 ☞☞☞AI 智能聊天, 问答助…

    2026年5月10日
    000
  • 为什么专注如此重要?

    在快节奏的数字时代,程序员能否保持专注直接影响着代码质量、项目进度和错误率。 高效专注,才能在开发过程中游刃有余。本文将分享一些实用技巧,助您提升编程专注力,高效完成任务。 专注力为何如此重要? 专注力是程序员的核心竞争力。编码需要高度集中,处理细节、逻辑和问题,稍一分神就可能导致错误百出,返工耗时…

    2026年5月10日
    000
  • 学习了Python的Flask后,Go语言的Web框架该选Gin还是Beego?

    学习编程时,选择合适的框架至关重要。许多开发者在掌握Python Flask后,转向Go语言Web开发时,常常在Gin和Beego之间难以抉择。本文将深入分析,助您做出明智选择。 虽然网上搜索结果多建议使用Go原生标准库http,但实际上所有框架都是对http的封装。虽然使用http开发灵活,但工作…

    2026年5月10日
    000
  • JavaScript动态下拉菜单:实现日期选项与价格计算关联

    在现代web应用中,动态生成表单元素并使其具备交互逻辑是常见的需求。特别是在需要根据用户选择调整价格或服务参数的场景下,下拉菜单()常被用来展示一系列选项。本教程将指导您如何利用javascript动态生成一个包含日期选项的下拉菜单,并为每个选项关联一个具体的数值(如剩余天数),进而实现一个基于用户…

    2026年5月10日
    000
  • 如何在不暴露密钥的情况下,在客户端创建 Stripe Payment Link

    本文介绍了在纯静态网站环境下,如何利用 Stripe Payment Link 实现商品售卖,并着重讨论了在不暴露 Stripe 密钥的前提下,客户端创建 Payment Link 的可行性。分析了直接在客户端使用密钥的风险,并提出了预先生成 Payment Link 或使用后端服务动态生成 Pay…

    2026年5月10日
    000
  • 解决Go语言中GOPATH未设置错误及工作区配置指南

    本文旨在解决go语言开发中常见的“gopath not set”错误,并提供详细的go工作区配置指南。内容涵盖`gopath`环境变量的设置、go项目目录结构、`path`变量的扩展,以及一些高级配置技巧,旨在帮助开发者建立一个高效、规范的go开发环境,确保包的下载、编译和运行顺利进行。 Go语言在…

    2026年5月10日
    000
  • html函数如何实现动态内容显示 html函数在网页交互中的核心应用

    JavaScript函数通过操作DOM实现动态内容更新与交互,如显示时间、实时搜索、增删元素及加载数据,使网页具备动态功能。 HTML 本身没有“函数”的概念,它是一种标记语言,用于定义网页结构。真正实现动态内容显示和交互功能的是 JavaScript。通常所说的“HTML函数”其实是 JavaSc…

    2026年5月10日
    000
  • 掌握 JavaScript 中的高阶函数

    现代 javascript 开发严重依赖函数式编程,掌握其基本思想将极大提高你的编码能力。 高阶函数是这个范式最有力的武器之一。为了帮助您掌握它们,本文将介绍它们的定义、应用程序和独特的实现。 1. 函数式编程 函数式编程是一种编程范式,强调: 纯函数:没有副作用的函数,对于相同的输入返回相同的输出…

    2026年5月10日
    000

发表回复

登录后才能评论
关注微信