深度学习赋能机械装备健康监测
通讯作者:
作者简介 About authors
严如强,西安交通大学领军教授,思源学者,高端装备研究院国际机械中心主任,国际电气与电子工程师协会会士(IEEE Fellow)、美国机械工程师协会会士(ASME Fellow),IEEE Transaction on Instrumentation and Measurement主编,主要从事智能诊断与预测、智能制造与制造服务融合研究。
本文引用格式
赵锐, 陈正华, 周峥, 严如强.
1 装备健康监测:中国智造的私人医生
2015年5月,我国提出《中国制造2025》制造强国战略行动纲领,旨在巩固我国制造业地位,并在建国一百年之际跻身世界制造强国前列。纲领文件在传统制造业基础上,明确强调了中国智慧制造,暨中国智造对国家产业结构调整的重要性和迫切性。有别于制造,智造是传统中低端制造业的升级和延伸,通过制造技术与信息技术的融合,赋予传统机械装备感知、分析、推理、决策和控制等高端功能。
机械装备是实现中国智慧制造的基础和前提,是各工业领域和产业环节的基础设施。机械装备在使用过程中,往往受到诸如振动、热疲劳、强应力、腐蚀、磨损、电磁干扰等多种环境因素和工艺因素的耦合作用影响,导致使用寿命和性能降低,甚至发生故障和事故,进而造成经济损失和人员安全隐患。机械装备健康监测作为中国智造强国战略的关键技术之一,可以通过监测装备关键运行参数实现故障诊断、预测和维护决策,并对发生故障的部件进行设计优化与改进升级,进而避免装备突发事故,提高社会经济效益。可以说机械装备健康监测技术是国之重器的保护伞和护身符。
2 机器学习:装备健康的智能管家
近年来,随着计算机性能的提高、传感技术的创新、物联网的普及和大数据分析算法的完善,硬件与软件的发展使得机械装备健康监测技术从传统机理模型向数据驱动模型转变。这种转变的需求和必要性来源于传统机理模型建模成本高、数学模型模糊和工况自适应性差等内生局限性,无法满足日益复杂的机械装备工况应用需求。
传感技术和物联网技术的快速发展赋能工业大数据引擎加速,使得基于数据驱动的机械装备健康监测有了坚实的硬件基础。基于数据驱动的机械装备健康监测技术利用先进数据处理算法、分析方法来提取、解析工业大数据隐含信息,可实现对机械装备运行状态的全天候健康监测和故障预测,建立自动专家决策、智能维护管理体系。
基于数据驱动的机械装备健康监测由特征设计、特征选取、特征提取、特征学习和特征模型训练等关键模块构成。其中,特征设计需要投入密集人力,难以自动化和规模化开展;尽管特征选取和特征提取可以通过数学模型自动完成,但是由于特征设计、特征选取、特征提取和特征模型训练是各自级联并且相互独立,导致难以实现同步优化获得最优表现;特征学习是该体系的关键节点,实现特征选取、状态预测强烈依赖于专家专业知识;特征模型训练(例如,支持向量机、随机森林、朴素贝叶斯模型)大多局限于传统机器学习模型的优化更新。
在过去十几年里,作为机器学习的一个分支,深度学习在人工神经网络的基础上不断发展、创新和完善,相继在图像处理、视频处理、语音识别、自动驾驶和机器翻译等领域取得了突破性进展和显著的经济效益。与此同时,在中国智造的时代背景中,深度学习也逐步成为工业机械装备传感数据挖掘的最有效手段,并应用于机械装备健康监测。
深度学习解决了基于数据驱动的机械装备健康监测技术的人工和专家依赖性问题。基于深度学习的机械装备健康监测系统不仅可以从数据中构建复杂的非线性关系,实现端到端的模型结构设计,也可以实现特征学习和模型训练的同步进行。图1给出了基于机理模型、基于机器学习和基于深度学习的机械装备健康监测技术关键技术对比。
图1
3 神经网络:深度学习的最强大脑
2015年以来,深度学习技术在机械装备健康监测领域中的应用受到业界和学者广泛关注。但零散的研究和示范性应用等缺乏系统性认知,在面临具体问题时,“选择什么深度学习模型?”成为工程师们面临的首要问题。在此情境下,我们课题组分析、讨论、归纳和综述了多种深度神经网络结构模型在机械装备健康监测系统中的适用性(MSSP, 2019, 115:213-237),包括:自编码器、受限玻尔兹曼机、卷积神经网络和循环神经网络四大类主流深度学习模型。希望可以为机械装备健康监测领域的广大研究人员和企业员工提供高效的入门指引和方法索引。
自编码器是提取机械装备数据特征的有效方法。在工程实践过程中,能够获得故障状态标签的机械装备数据十分有限,自编码器技术提供了不依赖于标签数据的特征提取方法。目前,自编码器相关的研究工作多数侧重于如何防止泛化能力缺乏引起的模型过拟合问题,避免训练样本层面表现良好,实测应用表现欠佳;在模型输入数据的选择层面,主流研究倾向于用多维度多传感器测试数据。这些数据一方面被用于支撑独立的特征提取,并输入到传统的机器学习模型(如支持向量机)开展预测和健康诊断,另一方面用于神经网络的预训练。
作为神经网络算法的重要方法之一,卷积神经网络是计算机视觉的常用模型,非常适合处理图像数据(二维数据)。这意味着,卷积神经网络同样可以处理基于时频的二维信息或更低维度的一维信息,进而开展机械装备健康状态数据分析。其主要优势体现在:卷积神经网络与无监督学习融合提高模型的泛化能力;卷积神经网络众多的超参和网络层数、卷积核的多样性、卷积核可调性、全联接层的位置可变性等为复杂机械装备的健康监测提供了较高的自由度和适应性。
与卷积神经网络不同,循环神经网络是一类以序列数据为输入,神经元按链式连接,并在序列的维度进行递归操作的神经网络,特别匹配机械装备状态数据的序列性特点。因此,循环神经网络在机械装备健康监测领域也有着不可替代的地位。典型的循环神经网络结构包括了长短期记忆网络和门控循环单元网络。
目前,一些结合卷积神经网络和循环神经网络的工作更具启发性。这种结合主要是通过时序传感器数据输入到卷积神经网络,然后卷积神经网络的输出作为循环神经网络的输入,最后去预测机械装备的状态。这种卷积神经网络和循环神经网络融合的数据分析技术可以有效地提取原始传感器信号的时空信息。
4 特征提取:神经网络的前沿阵地
基本的特征提取工作是基于深度学习机械装备健康监测应用的前提和基础。尽管深度学习可以理论上进行自动化数据驱动特征学习,但由于机械装备数据信噪比低、机械装备系统的复杂度高和所获得数据少的制约,原始数据的直接输入难以保证模型的应用效果。因此,非专家知识依赖的特征提取方法在原始信号处理及其后续深度学习模型嵌入环节显得尤为重要。常见的三类特征提取方法包括:
◆ 时序处理:统计层面的时序指标,例如均值、方差、极值和均方根等。
◆ 频域处理:通过傅里叶变换获得频域视角的数据特征(例如频域的多阶信息、频谱的偏度),描述机械信号的周期性特点。
◆ 时频处理:利用经验模态分解和小波变换获得机械装备状态信号的时频谱图,该方法可以将时序信号转换成二维的时频图像。
在实际应用层面,大部分的特征提取方法都属于上述三类方法。根据具体的应用和装备特点,上述方法可能被单独选取、组合或者协同应用,所获得的特征会被拼接整合,并输入给后续的深度学习模型。
基于充分的研究综述和扎实的前期研究工作,我们发现深度学习是机械装备健康监测的有效且通用的工具。其应用不仅局限于特种机械装备,事实上,只要能够提供稳定的传感器监测数据,深度学习方法在通用机械装备健康监测应用领域将大有可为。通过合理地设计深度神经网络结构,可以有效地实现机械状态监测、故障诊断、剩余寿命预测和故障维修决策等健康管理方法。
在我们报告的工作中,对不同的深度学习模型结构做了详细的实证研究。围绕制造业高速数控机床运行过程中的刀具磨损预测问题,通过7个力和振动传感器获得原始数据,利用数据驱动的传统机器学习模型和深度学习模型开展预测。为了保证比较的公平性,研究中所有模型均采用了同一组的特征:即时域,频域和时频特征。实证研究结果表明:(1)相较于传统的机器学习模型,深度学习模型可以显著提高模型准确度上限;(2)自编码器的预训练对于提高机械装备健康监测的效果有积极的影响;(3)合理的数据去噪技术既可以防止过拟合,也可以提高机械装备健康监测的效果;(4)通过恰当的超参选取,卷积神经网络和循环神经网络可以取得最优的表现。
5 热点与展望
基于课题组当时的研究和判断,面向深度学习在机械装备健康监测的应用,我们总结了一些可能的未来研究方向。近几年来这些方向被从事该领域研究的学者们证明是有效、可行并且正确的,但还没有被完全的探索,仍然是当前的研究热点。这些方向可以概括如下。
◆ 大规模数据集公开化:应用层面的历史经验表明,公开的大规模图像识别数据集ImageNet,极大推动了深度学习模型在机器视觉领域的发展。类似地,机械装备健康监测领域的“大规模公开数据集”将有效缓解深度学习的模型复杂度与数据集大小的矛盾,提高模型泛化能力和迁移能力。
◆ 专家知识数据化:尽管深度学习理论上可以自动有效地学习数据特征而不需要专家知识。但是在实际应用中,专家知识可以进一步提高深度学习模型的表现,同时降低对高质量大规模数据的依赖。因此,专家知识数据化可以让我们快速、高效地设计出更适合具体工况的机械设备健康监测深度学习模型。
◆ 分析结果可视化:深度学习往往被诟病缺乏可解释性,难以了解模型或者系统为什么做出这样的判断或者预测。缺乏解释性,用户只能根据预测的结果选择接受或者不接受。这既降低了用户对于模型的信任,也不利于这些模型在关键领域的推广。因此,一个有效并且有挑战的方向就是如何提高面向机械装备健康监测领域的深度学习模型可解释性,比如模型可视化,数据特征的可视化都是值得探索的方向。
◆ 模型算法兼容化:在机械装备健康监测领域,新装备、新工况、新环境是普遍应用情形。缺乏高质量有标注的训练数据是这些新应用场景的突出特点。由上述因素导致的数据分布的差异和采集样本的差异难以保障模型的准确性。迁移深度学习可以在深度学习的基础上,提高知识或者模型迁移的能力,从而使得模型兼容新装备、新工况、新环境等多种应用场景。因此,迁移深度学习也是一个非常有实际意义的研究方向。
◆ 数据标签均衡化:不均衡的数据标签也是一个常见的机器学习问题。例如在欺诈监测、异常检测中,异常样本要远远少于正常样本,而不均衡的数据样本会对模型的学习产生极大的制约。机械装备健康监测领域也将面临着同样的问题。因此,机械装备健康监测数据标签均衡化也是值得研究的方向之一。
随着深度学习在机械装备健康监测领域的不断探索,过去总结的研究热点在纵深方向上都有不同程度的推广发展,同时也涌现了很多有基础性研究价值的方向。因此,基于对当前研究领域的方向理解,结合课题组在深度学习机械健康监测的研究工作,我们总结了一些未来值得持续探索的研究方向。
◆ 知识数据双驱动:数据驱动的端到端模式是一把双刃剑,虽然提高了模型信息处理的效率,但也阻碍了人类对物理现象的学习认知。此外,深度学习的超参调优是一种启发式过程,限制了模型的性能上限,数据驱动的方法无法为提高深度学习的性能上限提供可靠的指导方向。有必要将人类的知识嵌入到深度学习的决策过程中,运用专家知识来解析深度学习的逻辑过程、加强对物理现象的理解,同时也为模型优化提供指导性建议。因此,构建知识数据的双驱动是解析模型、增强模型的有效手段,比如信号处理驱动的神经网络、物理启发的神经网络等。
◆ 模型可解释性:可解释性一直是深度学习在机械装备健康监测领域的研究热点,在决策伴随着巨大风险的场景中,深度学习的可解释性是评判结果可靠性的重要依据。在当前的研究中,对可解释深度学习的一种常用分类方法将其分为事前可解释性和事后可解释性。其中,事前可解释性可以理解为在模型设计之初就可以决定的可解释性,即主动改变网络结构或训练过程以获得更好的可解释性,例如可解释模块设计、具有引导性的正则化技术等方法;事后可解释是在模型训练完成后对模型进行解释,不会对模型的优化设计产生影响,例如特征分析、显著性分析等方法。这些技术对理解基于深度学习的机械装备健康监测方法、保障应用安全具有重要意义。因此,开展模型可解释性研究依旧是未来研究热点之一。
◆ 预测结果可信度:在不断提高模型诊断准确率的过程中,有些学者开始注意到诊断性能背后的可信度问题,尤其是当深度学习模型应用到实际场景中,模型预测结果的可信度,决定了用户决策的安全风险。虽然用户期望模型的所有预测结果都是可信的,但模型的不稳定性使其无法做出100%正确的预测。因此,模型有必要对其预测结果给出置信度,具体而言,对预测正确的结果,深度学习模型应该给予较高的置信度,对预测错误的结果,则应该给出较低的置信度。在这种情况下,用户的决策就可以仅采纳高置信的预测而拒绝低置信的预测。所以可信深度学习也是值得探索的方向之一。
◆ 模型设计协同化:当深度学习模型作为一个决策模块嵌入到用户的健康管理系统框架中时,深度学习模型需要与用户的组织架构、决策体系进行必要整合。但由于数据采集的离散性、模型结构的多样性、系统平台的安全性,单个深度学习模型的设计需要考虑多方面因素进行协同设计。例如在多用户的场景下,各用户的数据包含了关键使用信息,直接的数据聚合会带来隐私泄露的问题,深度学习模型需要考虑多方安全计算问题。因此,对模型设计进行系统性协同优化也是一个值得研究的方向。
6 智造强国时代的使命担当
从我们的这篇文章发表至今,非常欣喜地看到越来越多且越来越高质量的基于深度学习的机械装备健康监测研究的相关进展。我们坚信在当今海量数据和越来越强的计算能力的驱动下,深度学习会在根本上推动和改变机械装备健康监测这一领域的智能化发展。我们也非常幸运地看到我们的工作在这波浪潮中留下了一点点的印记,激励着我们自己和学者们去探索和解决机械装备健康监测的难题。我们将满怀着热情、期待、理想、责任和智造强国时代的使命担当,继续前行。