对XGBoost中的超参数进行协调优化,能提升液压器故障诊断性能吗

在阅读此文前,麻烦您点击一下“关注”,方便您进行讨论和分享,给您带来不一样的参与感,感谢您的支持。

文| 晓山青

编辑| 晓山青

●—≺ 摘要 ≻—●

针对注塑机液压系统故障隐蔽且难以准确诊断的问题,提出一种基于改进XGBoost的液压系统故障诊断方法,通过改进Tent混沌映射改善麻雀搜索算法(SSA)的全局寻优能力。

并采用改进SSA对XGBoost中的超参数进行协调优化,弥补传统XGBoost凭经验设定超参数的不足。

●—≺ 针对液压故障的诊断 ≻—●

随着工业技术日益成熟,液压和电子控制等技术结合更加紧密,设备出现故障的原因越来越复杂,发生的故障更难以诊断和排除,而液压系统较机械、电气系统出现的故障更为隐蔽。

当采用传统技术诊断时,会占用大量的维修时间,造成巨大的经济损失。

注塑机作为将高分子材料制成各类塑料制品的主要成型设备,在塑料工业发展中占有重要地位。

液压系统作为注塑机的核心部件,其能否稳定运行直接关系到注塑机性能的优劣。

调研某注塑机维修厂的维修数据发现,其253条液压系统历史维修记录中,阀门滞后故障为70次。

冷却效率降低故障为63次,泵泄漏故障为55次,液压储能器降压故障为50次,其他故障共15次。

分析以上数据可知,液压系统阀门切换故障发生的频次较高,其一旦发生故障将影响注塑机液压系统的稳定性,导致达不到正常工作的注塑压力。

而且排查液压系统阀门故障需要花费大量的人工检修时间,严重影响企业的生产效率,因此实现对液压系统故障的快速诊断显得尤其重要。

针对液压系统故障隐蔽难以准确诊断等问题的研究,提出了一种基于PID控制的注塑机液压系统故障诊断方法,通过快速调节伺服控制器的PID参数完成了对注塑机液压系统振荡的消除。

提出了一种基于改进径向基函数(RBF)神经网络的故障诊断方法,实现了对液压系统泵源故障和管道故障的准确分类与预测。

通过利用XGBoost诊断算法对注塑机液压系统进行故障诊断,克服了传统诊断模型泛化能力弱的缺点。

但许多学者在实际应用中发现,XGBoost算法受超参数的约束导致其在故障诊断方面的性能不能得到最大化。

将参数优化后的XG¯Boost应用于注塑机液压系统故障诊断,以验证SSA优化XGBoost算法具有一定的可行性,可以实现对液压系统故障的准确诊断。

●—≺ 几种基于改进SSA优化算法 ≻—●

XGBoost算法

XGBoost是基于决策树模型的梯度提升算法,它被广泛应用在滚动轴承故障诊断、发动机故障预测等领域。

假设注塑机液压系统的故障数据集为E={(xi,yi):xi∈Rm,yi∈R},其中Rm为特征空间,数据子集xi对应的标签为yi,则T棵回归树最终的故障预测结果为:

式中:y^i为第i个样本最终的预测结果,ft为独立的回归树函数,F为树的集合,ft(xi)为第t棵回归树上xi样本的预测值,对目标函数定义如下:

式中:Obj为损失函数;yi为第i个样本集的真实标签:∑ni=1l(yi,y^i)为损失函数。

T为叶子节点的数量:wj为第j个叶子节点的权重;γ和λ为惩罚项,控制模型的复杂度,通过加入二阶泰勒展开式,进行k次迭代训练,可改写目标函数如式(3)所示:

式中:gi为损失函数的一阶导函数,Ij表示属于第j个叶子节点的所有样本xi划入到一个叶子节点中的样本集合。

hi为损失函数的二阶导函数,对式(3)求偏导,将等于0时的wj值代入得到式(4),以该式判断树的结构好坏。

式中Obj的值越小代表树的拟合精度越好。

麻雀搜索算法

SSA是一种受到麻雀种群捕食机制启发而提出的群智能优化算法,基本SSA可描述为具有预警机制的探索者和追随者模型。

在整个麻雀种群中,拥有较高能量储备(适应度)的个体被定义为发现者,发现者所占比例通常取为20%,其位置更新公式如式(5)所示:

式中:xtij为第t代中第i个麻雀在第j维中的位置;t为算法当前迭代次数;α为0~1中的随机数;niter,max为算法的迭代次数最大值。

R2∈[0,1],为种群的预警值;SE∈[0.5,1],为种群的安全值;Q为服从正态分布的随机数;L为所有元素均为1的1×d的矩阵,其中d为待优化问题变量的维数。

除发现者外,剩下个体均为加入者,其位置更新如式(6)所示:

式中:xtw为当前最差位置;n为麻雀个体的数量;xt+1b为当前最优位置;A是元素值为1或-1的1×d的随机矩阵,A+=AT(AA+)-1。

除加入者和发现者外,在种群中随机选择10%~20%的麻雀作为预警者,预警者位置更新描述如下:

式中β为步长控制参数,服从N(0,1)正态分布;K为一个介于-1和1之间的随机数。

σ为一个确保分母不是0的极小常数;fi为第i只麻雀的适应度值;fb、fw分别为当前最优适应度值、当前最差适应度值。

改进Tent混沌初始化种群

Tent混沌映射是一种分段线性的一维映射,其产生的伪随机序列具有运算速度快、序列分布均匀的特点,更适合大数据集的运算处理。

Tent混沌映射定义如式(8)所示:

式中xn为第n次映射的函数值,n为当前映射次数。针对Tent混沌映射的范围较小、涉及参数少,同时会有小周期和不稳定周期点等问题。

提出利用随机函数rand(0,1)改进Tent混沌映射,改进后的Tent映射特性如图1所示。

利用改进Tent混沌映射对SSA中的种群进行初始化,以弥补SSA易陷入局部最优的缺点,改进后的麻雀初始种群计算式为:

式中:zn+1为第(n+1)个粒子的初始位置,rand(0,1)为[0,1]中的随机数,N为混沌序列中的粒子个数,lb和ub分别为搜索空间的下限和上限。

SSA优化XGBoost模型

鉴于XGBoost的超参数繁多,全部优化既会对计算机造成较大的运算负荷又会导致过长的参数寻优时间。

本文最终选取4个对XGBoost模型性能影响较大的超参数进行优化,XGBoost各超参数拟定的参数寻优空间见表1。

SSA优化XGBoost的故障诊断模型流程图如图2所示。具体步骤如下:

利用改进Tent混沌初始化麻雀种群数量,设置搜索空间维度N、最大迭代次数P等。

对XGBoost的4个超参数进行初始化并给定寻优范围;对分别代表XGBoost超参数的4只麻雀的适应度进行计算并记录此刻的位置。

在迭代过程中更新发现者、加入者以及侦察者的位置,对麻雀新位置的适应度值进行计算,若为最优则更新到此位置。

更新整个麻雀种群的适应度值及其位置;判断是否完成迭代,若不满足返回步骤(4)继续迭代。

迭代完成最终得到XGBoost最优超参数组合,更新超参数建立最佳XGBoost故障诊断模型。

实验验证及分析

本文所用数据集来源于Kaggle机器学习平台,该数据集是由专业的企业工程师,在注塑机液压系统真实生产场景下通过搭建实验平台所获得,总计2205组数据。

每组数据包含17个属性列1个标签列,属性列包含6个压力传感器(PS1~PS6),4个温度传感器(TS1~TS4)。

2个体积流量传感器(FS1、FS2)和电机功率传感器(EPS1)、振动传感器(VS1)、效率系数传感器(SE)、冷却效率传感器(CE)以及虚拟冷却功率传感器(CP)各1个。

1个标签列为2号三位四通电磁换向阀门故障类型,各传感器在实验平台中的布局如图3所示。

为了获得更好的基分类器,在这里将2205组故障数据随机划分成训练集(1764组故障数据)和测试集(441组故障数据)。

注塑机液压系统液压阀门故障类型标签分别为阀门正常、阀芯磨损、阀芯泄漏和阀芯卡死4种情况,依次编号为0、1、2、3。训练集和测试集样本分布见表2。

对于模式识别系统,一个好的学习样本能让分类器得到更好的训练效果,由于样本中是否存在不相关或冗余信息直接关系到分类器的性能,因此进行特征选择尤其重要。

在XGBoost集成算法中,如果一个特征被评选为分割点的次数越多,则可以认为这个特征越重要。

将预处理之后的17个传感器数据作为XGBoost模型的特征输入,对每个传感器的重要性进行评分并筛选,结果如图4所示。

根据信息价值相关性理论可知,Score值低于100的特征影响力可以忽略不计,所以将样本中的TS4、TS3、PS6、PS4为4个特征剔除,以便提高模型训练速度与诊断精度。

通过Python对XGBoost编程,将441组测试样本分别输入到优化前后的XGBoost模型中,得到图5所示的注塑机液压系统阀门故障诊断准确率对比图。

从图5可知,改进XGBoost故障诊断模型在4种故障类型上的诊断准确率,均优于XGBoost故障诊断模型,其中“阀芯磨损”故障诊断准确率改善最为明显,提高了2.9%。

从图6可以看出,改进XGBoost模型经过7次迭代后,其训练误差趋向收敛。

未经过优化的XG¯Boost模型经过60次迭代误差才趋向收敛,即经过参数优化之后的XGBoost故障诊断模型具有更快的收敛速度。

只凭借准确率的高低与收敛速度的快慢无法判定出算法的性能,因此需要绘制算法的受试者工作特征曲线(ROC)。

通过对比曲线并计算显现区域面积(AUC),从而综合判定出算法的性能优劣,AUC数值越大,诊断模型性能越好。

通过比对图7中XGBoost改进前后的ROC,可以看出改进XGBoost的AUC值高达0.9977。

相比于XGBoost有所提高,说明改进XG—Boost模型在对注塑机液压系统进行诊断分析方面具有更好的性能。

●—≺ 结论 ≻—●

本文给出的机器学习参数优化方案普适性较强,为提高SSA的寻优性能、优化XGBoost的超参数提供了一种新的解决方法。

经实验论证得出以下结论:改进Tent混沌映射可以有效提高麻雀个体和算法整体的搜索能力;经过参数优化之后的XGBoost故障诊断模型具有更好的诊断性能。

但是,目前的研究工作仅通过较为简单的实例来验证方案的可行性,要真正地体现实践应用价值,还需要尽可能和相关企业联合做些试验进行验证。

根据平台规则,您关注+点赞评论会保持铁粉身份,更好为您推荐优质内容

---END---

展开阅读全文

页面更新:2024-02-09

标签:故障诊断   参数   种群   麻雀   样本   混沌   算法   液压   函数   模型   故障   性能

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top