速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

编辑 | 白菜叶

机器学习为快速准确地预测结合亲和力提供了巨大的希望。然而,目前的模型缺乏稳健的评估,无法完成(命中到)先导化合物优化中遇到的任务,例如对一系列同类配体的结合亲和力进行排序,从而限制了它们在药物发现中的应用。

牛津大学的研究团队首先提出了一种新的基于注意力的图神经网络模型 AEV-PLIG(原子环境向量-蛋白质配体相互作用图),以解决这些问题。其次,他们提出了一种新的、更真实的分布外测试集(out-of-distribution test set),称为 OOD 测试。

研究人员在这个包含 CASF-2016 和用于自由能扰动 (FEP) 计算的测试集上,对该模型进行基准测试,突显了 AEV-PLIG 的竞争性能,同时对具有严格基于物理的方法的机器学习模型提供了现实的评估。

团队还展示了如何利用增强数据(使用基于模板的建模或分子对接生成)来显著改善结合亲和力预测相关性和 FEP 基准上的排名。

该研究以「Narrowing the gap between machine learning scoring functions and free energy perturbation using augmented data」为题,于 2025 年 2 月 8 日发布在《Communications Chemistry》。

图片

预测蛋白质与配体结合时自由能的变化是计算小分子药物发现的基石。它在命中识别过程中至关重要,在命中识别过程中,人们旨在识别对目标具有高亲和力的结合物,以及在命中到先导和先导优化过程中,必须优化结合亲和力以及与安全性和生物功效相关的许多其他特性。

机器学习算法和架构可以预测这些特性,但是由于缺乏相关数据,其应用受的了限制。基于结构的方法需要准确的结合亲和力测量以及以足够分辨率解析蛋白质-配体复合物(尤其是结合口袋)的相应三维 (3D) 结构。

增加训练数据的数量和多样性的一种策略是使用数据增强,其中生成合成数据来模拟真实世界的观察或通过修改现有的实验确定的示例。这类方法已被证明可用于计算机视觉和自然语言处理应用。

然而,由于一些固有的复杂性和物理化学限制,从头生成有意义的生物和化学数据可能具有挑战性。

新策略

在最新研究中,牛津大学的研究人员提出了多种策略来增强机器学习(ML)评分功能的适用性并对其性能提供更现实的评估,特别关注药物发现应用。

他们提出了一种新颖的结合亲和力预测方法 AEV-PLIG,将原子环境向量 (AEV) 与蛋白质-配体相互作用图 (PLIG) 相结合,采用注意力 GNN 架构来捕捉决定结合亲和力的复杂相互作用。

图片
图示:AEV-PLIG 架构。(来源:论文)

研究人员将 AEV-PLIG 与 RFScore、Pafnucy、OnionNet-2、PointVS、SIGN、AEScore 一起进行了评估,使用了多种旨在评估 OOD 数据(OOD 测试)和药物相关系统(FEP 基准)或惩罚记忆(0 配体偏差)的性能的基准,结果显示其性能明显差于广泛使用的评分函数基准 CASF-2016。

算家云 算家云

高效、便捷的人工智能算力服务平台

算家云 37 查看详情 算家云

在比较不同的 ML 模型时,AEV-PLIG 表现良好,但没有一个模型在所有基准测试中取得明显更好的性能,这凸显了需要一组多样化的测试用例来评估新模型、特性和架构。

图片

图示:AEV-PLIG 模型在 FEP 基准测试中的性能。(来源:论文)

这些策略共同缩小了与 FEP 计算的性能差距(FEP+ 在 FEP 基准上实现了加权平均 PCC 和 Kendall 的 τ 0.68 和 0.49),同时速度提高了约 400,000 倍。

这些测试集最初设计用于对 FEP 的性能进行基准测试和验证,它们不仅为 CADD 应用提供了更真实的预测准确性指示,而且还可以直接比较当前基于 ML 和 MD 的方法。

图片
图示:FEP+ 与 AEV-PLIG 模型针对 FEP 基准中具有 25 个或更多配体的目标进行性能比较。(来源:论文)

鉴于生化领域普遍存在数据稀缺的问题,研究人员探索了使用增强数据,通过对实验结合数据进行训练的模型,但使用基于模板的比对或对接来建模 3D 蛋白质-配体结构。

事实证明,这种数据增强策略是一种有效的方法,可以显著提高 AEV-PLIG 在药物发现系统中的排名能力,其中通过引入小的结构修改来串联设计化合物,旨在增加它们对特定目标的结合亲和力。

研究人员表示,额外的增强数据可以提高未来的性能;鉴于最近引入了精确的(蛋白质-配体)结构预测模型,例如 AlphaFold 3、Umol 和 NeuralPlexer,这些数据很快就会随时可用。

结语

总而言之,AEV-PLIG 在各种基准测试中始终表现出与各种其他基于 ML 的方法相当或更好的性能。使用增强数据进行训练还提供了一种非常有效的方法,可以显著提高药物发现中经常遇到的同类系列的预测相关性和排名。

此外,AEV-PLIG 比 FEP 快几个数量级,需要的每个系统准备最少,并且产生绝对结合亲和力而不是相对自由能差异。

这项研究强调了捕捉蛋白质-配体相互作用的新特征化的潜力、对更强大基准的需求,以及增强数据在训练基于 ML 的评分函数以实现快速准确的结合亲和力预测的新兴作用。

论文链接:https://www.nature.com/articles/s42004-025-01428-y

以上就是速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/278903.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
遇事不慌,先记录:mysql in慢查询优化
上一篇 2025年11月4日 15:38:55
模拟器变声软件使用指南
下一篇 2025年11月4日 15:39:02

相关推荐

  • 松下案例入选《2025企业社会责任竞争力指数报告》

    松下案例入选《2025企业社会责任竞争力指数报告》松下案例入选《2025企业社会责任竞争力指数报告》松下案例入选《2025企业社会责任竞争力指数报告》松下案例入选《2025企业社会责任竞争力指数报告》

    11月14日,中国新闻社《中国新闻周刊》在北京成功举办了第二十一届企业社会责任系列活动·2025责任之星特别节目。活动以“致明天:焕新责任竞争力”为主题,汇聚了来自政府、企业及学术界的多位代表,共同探讨新时代下企业如何通过责任创新打造核心竞争力。松下电器(中国)有限公司总裁赵炳弟作为企业界代表受邀出…

    2026年5月10日 用户投稿
    000
  • 动态更新圆形进度条:JavaScript成绩计算器集成指南

    本文档旨在指导开发者如何将JavaScript成绩计算系统与动态圆形进度条集成,实现可视化展示平均成绩。我们将详细讲解如何修改现有的JavaScript代码,使其在计算出平均分后,能够动态更新圆形进度条的进度,从而提供更直观的用户体验。本文档包含详细的代码示例和注意事项,帮助开发者轻松实现这一功能。…

    2026年5月10日
    000
  • html标签如何读_HTML标签(语义化/结构)阅读与理解方法

    答案是掌握HTML标签的语义化含义与结构作用。理解HTML需从语义化入手,使用如article、nav、header等标签准确表达内容意义,提升可访问性、SEO和代码可维护性;阅读时应从外到内分析结构,识别页面骨架,区分语义标签与非语义标签(如div、span)的合理使用场景,避免仅凭外观选择标签,…

    2026年5月10日
    000
  • 我有时使用 awk 而不是 Python 的四个原因

    Python 是一门强大的编程语言,但在某些特定场景下,Awk 的优势更为显著,尤其体现在可移植性、生命周期、代码简洁性和与其他工具的互操作性方面。 Python 脚本通常具有良好的可移植性,但并非总能在所有环境中完美运行,例如流行的 Docker 基础镜像 (如 Debian 和 Alpine)。…

    2026年5月10日
    000
  • 深入理解 Laravel Session::put:避免常见陷阱与实现表单限流

    本文旨在深入探讨 laravel 框架中 `session::put` 方法的正确用法及其常见误区。针对用户在实现表单提交限流时遇到的问题,详细阐述了 `session::put` 必须提供键值对的原理,并提供了如何在控制器中利用会话机制有效防止重复提交的实战代码示例。通过本文,读者将掌握 lara…

    2026年5月10日
    000
  • 李彦宏:2025年是萝卜快跑的扩张之年 将寻找合作方

    百度计划2025年大力扩张自动驾驶出行服务平台“萝卜快跑”。百度ceo李彦宏近日在业绩会上宣布,将与电信运营商、出租车公司及其他车队运营商合作,扩大市场份额,让更多用户体验自动驾驶技术。 这对于萝卜快跑而言是至关重要的发展阶段,预计未来车队规模和服务量将实现飞速增长。 ☞☞☞AI 智能聊天, 问答助…

    2026年5月10日
    000
  • 为什么专注如此重要?

    在快节奏的数字时代,程序员能否保持专注直接影响着代码质量、项目进度和错误率。 高效专注,才能在开发过程中游刃有余。本文将分享一些实用技巧,助您提升编程专注力,高效完成任务。 专注力为何如此重要? 专注力是程序员的核心竞争力。编码需要高度集中,处理细节、逻辑和问题,稍一分神就可能导致错误百出,返工耗时…

    2026年5月10日
    000
  • 优化 Laravel Eloquent 查询:高效构建用户排行榜数据

    本教程详细讲解如何优化 Laravel Eloquent 查询以高效生成基于关联记录计数的排行榜。通过识别并消除冗余的 whereHas 子句,并巧妙利用 withCount 的条件闭包,我们能显著提升查询性能,大幅缩短数据获取时间,从而改善用户体验并降低数据库负载。 在 laravel 应用开发中…

    2026年5月10日
    000
  • 使用 React 和 Pushpad 进行 Web 推送通知

    本教程演示如何在React网站上轻松实现用户订阅网页推送通知功能。我们将创建一个React组件,方便用户订阅/取消订阅推送通知。 我们将使用Pushpad SDK来创建和管理推送订阅。 一、配置Pushpad JavaScript SDK 首先,在网站根目录添加名为service-worker.js…

    2026年5月10日
    000
  • 它的未来:自动化和人工智能如何改变发展

    自动化与人工智能:IT领域的未来发展 自动化和人工智能(AI)正在深刻地改变着软件开发和IT专业人员的工作方式。从自动化重复性任务到将AI工具融入开发流程,这些技术为IT行业带来了新的机遇和挑战。 1. DevOps中的自动化:简化开发流程 自动化正在彻底改变开发人员管理开发和部署流程的方式。持续集…

    2026年5月10日
    000
  • 为什么 TypeScript 比 JavaScript 更好

    javascript 长期以来一直是 web 开发的基石,支持从小型脚本到大型应用程序的各种项目。然而,随着项目规模的扩大,javascript 的动态类型和缺乏结构性可能会成为开发的瓶颈。typescript 应运而生,它凭借静态类型检查和强大的工具集,迅速成为许多开发者构建可靠、可扩展应用程序的…

    2026年5月10日
    100
  • Laravel Session::put 正确用法详解与常见误区规避

    本文详细探讨了 laravel 中 `session::put` 方法的正确用法,特别指出在仅提供键名而未指定值时可能导致会话数据未被正确设置的问题。通过示例代码,阐述了如何为会话数据赋予明确的值,并演示了如何正确地检查和获取会话数据,以确保会话管理功能按预期工作,有效避免常见的会话操作错误。 La…

    2026年5月10日
    000
  • 官方41币是什么?如何在Solana上购买41官方币?购买指南

    官方41币是Solana链上高风险迷因代币,需用Phantom等账户准备SOL并经Jupiter等DEX兑换,全程自主掌控私钥与助记词,交易不可逆。 官方41币是在solana网络上的社区驱动型数字资产的一种部署,通常被视为一种迷因(meme)代币。获取它需要准备一个兼容solana的数字资产容器,…

    2026年5月10日
    100
  • javascript如何实现游戏开发_有哪些流行的游戏引擎

    JavaScript游戏开发核心是利用和Web API实现交互动画,原生可零环境起步,Phaser适合2D实战,Three.js/Babylon.js专注3D,Kaplay.js主打极简创意。 JavaScript实现游戏开发,核心是利用浏览器原生能力(尤其是和Web APIs)构建可交互、有动画、…

    2026年5月10日
    100
  • 反应性组件热加载与状态保存

    现代网络开发追求快速、流畅的用户体验。然而,传统的全页刷新机制在应用代码更改时会清除用户输入、身份验证数据和导航历史,迫使开发者每次更新后都重新搭建测试环境。热重载技术应运而生,它在保持应用状态的同时实时更新代码,显著提升了开发效率。 热重载允许开发者实时查看UI更改并进行测试,无需重置应用。Rea…

    2026年5月10日
    000
  • Laravel 8中Firebase Storage文件条件删除策略与实践

    本文针对Laravel 8环境下Firebase Storage无法直接按目录批量或条件删除文件的限制,提出了一套基于元数据管理的解决方案。通过在数据库中记录文件信息,结合Laravel的Artisan命令和Cron任务,实现对过期文件的精准识别与逐个删除,确保存储资源的有效管理。 Firebase…

    2026年5月10日
    000
  • 每个开发人员都应该知道的顶级美食

    JavaScript,全球最流行的编程语言之一,其影响力持续增长。ES6(ECMAScript 2015)为JavaScript引入了诸多令人兴奋的新特性。本文将介绍十个JavaScript开发者必须掌握的ES6高级特性,助您在编程领域保持领先地位。无论您是新手还是资深开发者,这些特性都能提升您的J…

    用户投稿 2026年5月10日
    000
  • 什么是IRYS?如何参与和领取空投活动?IRYS价格详情、代币经济和空投指南

    irys是一个构建在solana网络上的中心化知识图谱项目,其代币$irys可通过完成指定任务领取空投。代币价格由市场决定,其经济模型设计旨在激励社区参与和网络发展。 欧易官网: 欧易官方app: 币安官网: 币安官方app: gate.io官网: gate.io官方app: 一、IRYS项目及其核…

    2026年5月10日
    000
  • 前端基本面20

    前端开发实践:自动完成功能设计与实现 本文探讨如何设计和实现一个高效的前端自动完成功能,并重点关注其架构、API设计、性能优化和用户体验。 1. 数据序列化 (JSON.stringify) 在处理自动完成功能的数据时,JSON.stringify 用于将 JavaScript 对象转换为 JSON…

    2026年5月10日
    000
  • Cookie币前景分析_2025-2030年COOKIE价格走势展望

    COOKIE币价格受市场情绪、技术发展和生态应用影响,近期波动明显。当前价格约0.067美元,24小时换手率超74%,流通市值约6710万美元,显示高交易活跃度;其价值支撑于代币经济模型及AI服务落地进展,需警惕团队抛压与市场高波动风险。 COOKIE币价格走势受市场情绪、技术发展和生态应用影响,近…

    2026年5月10日
    000

发表回复

登录后才能评论
关注微信