LLM破局泛化诊断难题，MSSP刊登北航PHM实验室健康管理大模型交叉研究

程序猿 • 2025年11月6日 20:37:20 • 用户投稿 • 阅读 1

论文作者来自杭州北航国新院、北航，主要作者：陶来发、刘海菲、宁国澳、曹文燕、黄博昊、吕琛（通讯作者）。吕琛教授：国家级领军人才、英国皇家航空学会会士；陶来发教授：国家级青年人才。

近日，《Mechanical System and Signal Processing》（MSSP）在线发表刊登北航 PHM 团队最新研究成果：基于大语言模型的轴承故障诊断框架（LLM-based Framework for Bearing Fault Diagnosis）。

这是北航 PHM 实验室在健康管理大模型领域的成功尝试，研究团队提出了基于大语言模型的轴承故障诊断框架，提升预训练大模型对振动数据的解析与泛化能力。

以轴承为例，他们探索并打通了基于预训练大语言模型解决泛化故障诊断难题的技术路线，初步展现了对跨工况、小样本、跨对象等泛化诊断任务的综合解决能力。

北航 PHM 实验室为业界学者应对故障诊断领域泛化痛点问题提供了新思路，也是深入开展大模型与健康管理交叉研究并建立健康管理大模型的重要基础与参考。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

论文原文：https://doi.org/10.1016/j.ymssp.2024.112127（MSSP 期刊）https://arxiv.org/abs/2411.02718（arXiv 预印）

背景介绍

健康管理（Prognostics and Health Management，PHM）是避免设备故障导致人员安全和经济财产损失的重要技术手段，而算法模型泛化性不足等瓶颈问题严重制约着 PHM 技术的发展应用。作为健康管理的重要环节，传统故障诊断也面临着跨工况适应能力、小样本学习能力和跨对象泛化能力等诸多挑战。

大语言模型（LLM）通过千亿级参数化的先验知识与深层次的模式识别能力，为提升故障诊断模型的泛化性提供了新的可能性。因此，团队整合 LLM 与传统故障诊断技术优势，以轴承为例探索并打通基于预训练大语言模型解决泛化故障诊断难题的可能性和技术路线，初步展现了对跨工况、小样本、跨对象等泛化诊断任务的综合解决能力。

分别开展了单数据集跨工况实验和全量及少量样本的跨数据集迁移实验，验证所提出框架同时完成三种泛化故障诊断任务的能力，证明 LLM 对输入的模式和形式具有良好的适应性。

主要创新及成果

为解决泛化诊断难题，论文提出基于 LLM 的轴承故障诊断框架，创新点主要包括振动数据特征的文本化处理和预训练模型微调方法。

针对轴承故障诊断中振动数据难以挖掘语义信息的问题，基于传统故障诊断的统计学分析框架，提出了一种融合时域和频域特征提取的信号特征量化方法，将时序数据进行文本化处理，旨在通过精简的特征选择高效学习小样本和多工况下的共性特征。

针对 LLM 在解析振动数据特征时泛化能力不足的问题，该团队采用基于 LoRA 和 QLoRA 的振动数据微调方法，有效利用预训练模型的深层语义理解能力，提高故障诊断的精确度并增强模型的泛化性能。

针对创新点的实验验证。通过单数据集实验、单数据集跨工况实验以及全量、少量跨数据集实验，该团队证明了所提出框架同时具备跨工况、小样本、跨数据集故障诊断能力。

可图大模型

可图大模型（Kolors）是快手大模型团队自研打造的文生图AI大模型

32 查看详情

研究团队采用 CWRU、MFPT、JNU、PU 四个轴承故障诊断公开数据集，分别针对基于特征的 LLM 故障诊断和基于数据的 LLM 故障诊断方法进行验证。

案例实验验证了所提出框架在三种泛化任务上的适应性，且经过跨数据集学习的模型同比获得 10% 左右的精度提升。

未来研究方向

1. 该框架更多地在特征提取和故障模式判别阶段将 LLM 与故障诊断相结合，未来可充分利用诊断领域知识和大模型架构知识，实现大模型与装备故障诊断的深度融合。

2. 论文以轴承为例，探索了预训练 LLM 解决泛化故障诊断难题新思路。未来可将其作为基础与参考，特异性设计模型结构，将框架拓展至其他领域对象，如动力、控制系统的电源、功能电路等。

3. 论文以故障诊断为例展示了 LLM 对传统健康管理手段的扩展能力，未来还可将技术延拓到预测、评估等典型健康管理领域，打通 PHM 开发方案生成、数据生成、能力生成、解决方案生成、验证评价、方案更新等技术流程，支撑装备 PHM 设计、诊断、评估、预测、决策、推荐、验证、更新等下游任务。

4. 论文利用 LLM 的文本处理能力及泛化性能，初步实现了基于预训练 LLM 的泛化故障诊断功能；未来将在此基础上，构建以健康管理领域多模态信息为基础、以 PHM 各种功能需求为主要业务、以生成涌现能力为目标的垂直领域健康管理大模型，实现以通用化、判别式、实战性为主要特点的健康管理领域新生态及根本性技术转变（参考 An Outline of Prognostics and Health Management Large Model: Concepts, Paradigms, and Challenges, https://arxiv.org/abs/2407.03374）。

也欢迎关注北航 PHM 团队提出的健康管理大模型进阶研究范式 roadmap！

论文链接：https://arxiv.org/abs/2407.03374

以上就是LLM破局泛化诊断难题，MSSP刊登北航PHM实验室健康管理大模型交叉研究的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/404364.html

大语言模型理论

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

红米15 5G新机相关信息曝光运行小米HyperOS 2.0

上一篇 2025年11月6日 20:37:19

cfcdk兑换码在哪里兑换-穿越火线cdk兑换码大全2023

下一篇 2025年11月6日 20:37:21

html的基础理论

本篇文章给大家分享的是关于html基础理论知识，内容很不错，有感兴趣的朋友可以看一下 HTML 语义化 HTML标签的语义化是指：通过使用包含语义的标签（如h1-h6）恰当地表示文档结构 css命名的语义化是指：为html标签添加有意义的class 为什么需要语义化：立即学习“前端免费学习笔记（…

程序猿
用户投稿 2025年12月21日
0000
ChatGPT哭了！马斯克新AI直接封神

近日，马斯克旗下的 xai 团队正式发布了其最新大语言模型 grok 4.1。距离今年7月推出 grok 4 不到五个月，此次更新却带来了用户能直观感受到的显著升级。马斯克本人在 x 平台上发文称，新版本将在速度与质量上实现双重跃升，而实际体验也印证了这一说法。 ☞☞☞AI 智能聊天, 问答助手, …

程序猿
2025年12月2日 • 用户投稿
0000
努比亚推出自研星云大模型：编程性能国内排名第一

7月23日消息，今天下午，努比亚举行努比亚ai+双旗舰新品发布会，推出自研的星云大模型。近年来，ai技术正值井喷式的爆发，努比亚定义了“al+”的产品战略和理念，联合ai大模型研发团队潜心钻研，重磅推出自研的星云大模型，提供了自然语言大模型、视觉大模型等一系列高度专业的ai大模型，模型能力行业遥遥领…

程序猿
2025年12月2日 • 用户投稿
0000
大语言模型中常用的旋转位置编码RoPE详解：为什么它比绝对或相对位置编码更好?

自2017年发表的“attention is all you need”论文以来，transformer架构一直是自然语言处理（nlp）领域的基石。它的设计多年来基本没有变化，随着旋转位置编码（rope）的引入，2022年标志着该领域的重大发展。旋转位置嵌入是最先进的 NLP 位置嵌入技术。大多数…

程序猿
2025年12月1日 • 用户投稿
0000
用大语言模型“练兵”！亚马逊新品未上AI新功能，但预告Alexa今年有长足进步

在chatgpt等生成式人工智能（ai）技术应用成为潮流的今天，亚马逊发布了几款硬件新品，虽然还没有赋予它们新的ai技能，但透露已经在用大语言模型（llm）“练兵”，承诺会让语音助手alexa逐步增加新的ai功能。美东时间5月17日周三，亚马逊推出两款新的Echo智能音箱——Echo Pop和Ec…

程序猿
2025年12月1日 • 用户投稿
1000
用户投稿

东软成立魔形科技研究院，积极布局大语言模型系统工程战略，迎接AI时代

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ %ignore_a_1%最近宣布成立东软魔形科技研究院，旨在持续探索人工智能技术的创新与应用，以推动大语言模型系统工程战略的实施，全面应对大模型时代带来的机遇和挑战东软魔形科技研究院将利用公司…

程序猿
2025年12月1日
0000
北航打破模态壁垒，跨可见光-红外模态的通用物理对抗攻击方法来了

近年来，针对视觉感知系统安全性评估的探索逐步深入，先后有研究者成功实现基于眼镜、贴纸、衣服等不同载体的可见光模态安全评估技术，也有一些针对红外模态的新尝试。但是它们都只能作用于单一模态。随着人工智能技术的发展，可见光 – 热红外成像技术已同时应用于治安监控、自动驾驶等诸多安全关键任务中…

程序猿
2025年12月1日 • 用户投稿
1000
「场景控制传送门：四合一物体传送，上交&蚂蚁出品」

在常见的图像编辑操作中，图像合成是指将一张图片的前景物体与另一张背景图片结合，生成一张合成图的过程。合成后的图像在视觉效果上类似于将前景物体从一张图片传送到另一张背景图片上，如下图所示图像合成在艺术创作、海报设计、电子商务、虚拟现实、数据增广等领域被广泛使用通过简单的剪切粘贴得到的合成图可能会存…

程序猿
2025年12月1日 • 用户投稿
0000
把LLM视作操作系统，它就拥有了无限「虚拟」上下文，伯克利新作已揽1.7k star

近年来，大语言模型（llm）及其底层的 transformer 架构已经成为了对话式 ai 的基石，并催生了广泛的消费级和企业应用程序。尽管有了长足的进步，但 llm 使用的固定长度的上下文窗口极大地限制了对长对话或长文档推理的适用性。即使是使用最广泛的开源 llm，它们的最大输入长度只允许支持几十…

程序猿
2025年12月1日 • 用户投稿
0000
谷歌发布能让 AI 自主判断输出准确性的模型训练框架 ASPIRE

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 谷歌近日发布新闻稿，宣布推出aspire训练框架，专为大语言模型设计。该框架旨在提升ai模型的选择性预测能力。 Qoder 阿里巴巴推出的AI编程工具 270 查看详情谷歌提到，当下大语言模型…

程序猿
2025年12月1日 • 用户投稿
1000
高性能 LLM 推理框架的设计与实现

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 一、大语言模型推理概要介绍与传统的 CNN 模型推理不同，大语言模型的推理通常会分成 prefill 和 decoding 两个阶段。每一个请求发起后产生的推理过程都会先经历一个 Prefil…

程序猿
2025年12月1日 • 用户投稿
2000
AMD与约翰霍普金斯大学联手：AI实验室copilot自动化科研，成本节约84%！

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 编辑 | 2049 科学研究，尤其是机器学习领域的研究，往往需要大量的时间和资源投入，从最初的构思到最终的结果产出，每一步都充满了挑战。近年来，大型语言模型（Large Language Mo…

程序猿
2025年12月1日 • 用户投稿
0000
未来已来：VS Code与大语言模型的深度融合

VS Code 融合大语言模型正重塑开发流程，从智能补全、自然语言交互到自动化文档生成，提升效率并解放开发者专注核心设计。 VS Code 正在悄然改变开发者的日常。它不再只是一个代码编辑器，而是逐渐演变成一个由大语言模型（LLM）驱动的智能编程助手。这种融合不是简单的功能叠加，而是从编码、调试到文…

程序猿
2025年11月28日 • 用户投稿
0000
Al Agent–大模型时代重要落地方向

一、LLM-based Agent 整体架构 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 大语言模型 Agent 的构成，主要分为以下 4 个模块： 1. 画像模块：主要描述 Agent 的背景信息下面介绍画像模块的主要内容和生成策略。…

程序猿
2025年11月27日 • 用户投稿
1000
五个时间序列预测的深度学习模型对比总结

Makridakis M-Competitions系列（分别称为M4和M5）分别在2018年和2020年举办（M6也在今年举办了）。对于那些不了解的人来说，m系列得比赛可以被认为是时间序列生态系统的一种现有状态的总结，为当前得预测的理论和实践提供了经验和客观的证据。 2018年M4的结果表明，纯粹的…

程序猿
2025年11月27日 • 用户投稿
0000
机器学习为未来核聚变发电厂寻找合适的氢同位素组合

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 编辑 | 白菜叶恒星的动力来源——核聚变——被提议作为人类未来的能源，并且可以提供清洁和可再生的能源，而无需与当前核裂变工厂相关的放射性废物。就像从太阳溢出能量的聚变过程一样，未来的核聚变设…

程序猿
2025年11月27日 • 用户投稿
0000
10万美元+26天，一个低成本千亿参数LLM就诞生了

包括仅解码器结构（如 GPT 和 LLAMA 系列模型）、仅编码器结构（如 BERT）和编码器 – 解码器结构（如 T5）以及它们的变体模型在内的大型语言模型（LLM）已经取得了非凡的成功，并已被广泛用于各种语言处理和多模态任务。尽管如此成功，训练 LLM 的成本还是过于高昂，以至于仅…

程序猿
2025年11月27日 • 用户投稿
0000
【论文解读】基于图的自监督学习联合嵌入预测架构

一、简要介绍 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 本文演示了一种学习高度语义的图像表示的方法，而不依赖于手工制作的数据增强。论文介绍了基于图像的联合嵌入预测架构（I-JEPA），这是一种用于从图像中进行自监督学习的非生成性方法。I…

程序猿
2025年11月26日 • 用户投稿
1000
AI炼金术革新化学：MIT学者使用生成式AI，六秒生成新化学反应

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 需要重新书写的是：编辑 | 凯霞化学从远古的「等价交换」炼金术开始，一直是一门研究和控制物质间相互作用的学科。通过不断解锁和利用新的化学反应，人们开发了许多新材料。这些新材料不仅为人们的生活带…

程序猿
2025年11月26日 • 用户投稿
2000
AI4Science的基石：几何图神经网络，最全综述来了！人大高瓴联合腾讯AI lab、清华、斯坦福等发布

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 编辑 | XS Nature 在 2023 年 11 月发表了两项重要研究成果：蛋白质合成技术 Chroma 和晶体材料设计方法 GNoME。这两项研究都采用了图神经网络作为处理科学数据的工具。…

程序猿
2025年11月26日 • 用户投稿
0000

发表回复

登录后才能评论

LLM破局泛化诊断难题，MSSP刊登北航PHM实验室健康管理大模型交叉研究

关于作者

相关推荐

发表回复