风电机组齿轮箱故障预警的方法有哪些?随机森林估算法有何优势?

文|聪聪

编辑|聪聪

«——【·前言·】——»

风能是一种重要的绿色能源,已被世界各国广泛利用,随着风电装机容量的不断增加,风电场的运行和维护成本也随之上升。

风电机组关键部件中最易损坏是齿轮箱,一旦齿轮箱损坏,就会出现维修成本高、维修过程复杂等问题。

因此,在风机齿轮箱失效之前,对其进行有效的识别和早期的故障预警,可降低经济损失,延长风机的使用寿命。

目前,已有基于BP神经网络、极限学习机、贝叶斯方法、支持向量回归等对风电机组齿轮箱进行评估。

但是,BP神经网络参数多、学习速度慢;极限学习机的非线性能力差并且预测结果不稳定;贝叶斯方法需要有大量样本支撑,不能满足实际需求。

本文提出一种随机森林袋外估计灰狼算法优化支持向量回归相结合的风电机组齿轮箱故障预警方法。

运用随机森林袋外估计提取特征变量,并采用滑动平滑滤波对输入变量进行滤波处理。

构建灰狼算法优化支持向量回归模型,基于时移滑动窗口确定阈值的范围实现风电机组齿轮箱故障预警。

«——【·算法原理·】——»

在选取输入变量特征时,并非状态参数特征量越多,准确度就越高,过多的特征量会提高模型的复杂性,造成训练效果较差。

由于随机森林可以处理高维数据,并且计算复杂度低,使其应用于特征提取方面具有较好的降维效果。

随机森林算法属于传统决策树的一种集成学习算法,一棵决策树的采样过程中,采样方式为有放回的随机抽样。

其中,有部分数据(约36.8%)未进入决策树的采样中,把这部分未采样的数据称为袋外数据。

用未赋予随机数的OOB数据在训练好的基学习器上运行,可得到袋外误差;然后把OOB数据样本中的每个特征赋予一个随机数,得到是加入随机数的袋外误差。

最后通过两种的袋外样本的误差,建立一个无偏估计评估变量重要性计算公式为:

为解决线性不可分问题,通常方法是寻找核函数,把低维空间中线性不可分的样本集变成线性可分的,在这个过程中需要核函数,它能够使得一个低维的样本集向高维做映射。

支持向量回归算法中核函数选取高斯核函数为:

因此,为使得风电机组齿轮箱油温预测模型更加精确,必须要选择合适的参数。

灰狼算法是一种优化搜索方法,其灵感来自于灰狼的捕食行为。

灰狼捕食猎物的过程分狼群划分、围剿阶段、捕猎阶段和攻击阶段4个阶段。

在构建GWO模型的过程中,按照适应度值由高到低的顺序,将灰狼分为4个等级:α、β、δ、ω。

首先,狼群找到目标猎物,然后包围目标猎物:

其次,由α、β和δ狼领导,灰狼ω自动位置更新并进行猎捕。

最后,灰狼群体的攻击行为主要通过A来实现,当|A|>1时,表现灰狼在整个区域是分散的寻找猎物,希望找到更合适的猎物。

当|A|<1时,表现灰狼会集中精力在某一区域寻找猎物,狼群向猎物发起攻击。

SVR算法中惩罚因子c和核参数σ的数值选取能直接决定SVR算法的预测精度,因此,本文采用GWO算法对支持向量机回归参数进行优化。

为了验证GWO算法的优势,本文选取了蝴蝶优化算法和粒子群算法进行比较,通过单峰、多峰和定维多峰3种基准测试函数对3种算法进行测试,算法的输入参数如下。

单峰基准测试函数为:

多峰基准测试函数为:

定维多峰基准测试函数为:

由上表可知,GWO算法对3种验证函数平均适应度值均达到最低,其中对F1(x)优化结果较PSO算法提高15个数量级。

F2(x)优化结果较PSO算法提高23个数量级;F3(x)优化结果较BOA算法提高183个数量级。

适应度标准差值越小,证明其稳定性越高,因此,在多数情况下GWO算法的标准差适应度值最低,所以GWO优化稳定度最高。

其中GWO算法对F1(x)的优化结果较PSO算法提高16个数量级,对F2(x)的优化结果较PSO算法提高22个数量级。

综合PSO、GWO和BOA算法的寻优曲线及测试运行50次的标准差适应度和平均适应度结果可知,GWO算法相比BOA算法和PSO算法,寻优能力最好且最稳。

因此,采用GWO算法对支持向量回归模型进行参数优化。

本文以齿轮箱油温为研究对象,利用随机森林袋外估计与灰狼算法优化支持向量回归模型对齿轮箱故障进行预警,其具体内容为:

(1)运用随机森林袋外估计算法选择与齿轮箱油温相关性高的特征变量;采用滑动平滑滤波对输入变量进行滤波处理。

(2)设置灰狼算法的种群数量、优化参数的个数、参数取值范围和最大迭代次数。

(3)初始化SVR的参数,计算适应度值,使SVR算法每次迭代的均方根误差(meansquareerror,MSE)最小。

(4)根据灰狼个体的适应度值确定等级,然后更新其位置信息。

(5)根据α,β,δ的位置信息更新ω的位置。

(6)更新a、A、C,确定新的Xα、Xβ和Xδ。

(7)当迭代次数满足要求时停止迭代,获得最优参数c和σ,否则跳至(6)。

(8)得到最优参数,用于模型预测。

(9)基于时移滑动窗口模型对GWO⁃SVR模型的齿轮箱油温偏差值进行分析,确定预警阈值。

«——【·实例验证·】——»

如某风场发生故障,选取故障前24h的数据采集与监视控制系统监测数据。

数据采样间隔为1min,共采样1440组数据,风电机组状态参数为20。

由于风电机组各个状态参数的单位不统一,将其进行归一化处理:

结合随机森林袋外估计进行特征选择的方法,对上述的状态参数进行筛选,选取能反映齿轮箱油温变化的状态参数作为输入变量。

随机森林袋外估计算法主要两个参数为叶子节点数和决策树的数量,对这两个参数进行寻优,达到最佳的状态特征参数的提取。

采用均方差作为随机森林袋外估计寻优的评价指标。

可得叶子节点数的选择对状态特征提取影响不大,但是叶子节点数为5收敛速度最快,因此叶子节点数为5。

当决策树数量CART<10时,MSE下降速度很快,但决策树数量CART>20时,MSE基本稳定,因此决策树选为20棵。

通过上述对随机森林袋外估计算法中两个主要参数进行寻优选择,得出最优参数是叶子节点数为5,决策树的数量为20,作为参数输入可得到状态特征参数的重要性排序图。

基于随机森林袋外估计的状态特征参数选择,最终选取前4个的状态特征参数为齿轮箱后轴温度、齿轮箱进口油温、发电机v2绕组温度和偏航方位角,构建特征集。

本文使用具有相同窗口大小的移动平均值生成具有相同平滑度的多个新时间序列。

对于窗口大小为l的滤波器,对第i个数据到第i=l-1的齿轮箱油温数据进行滤波,滤波处理后的数据如下公式:

通过滑动平滑滤波,对所有特征参数进行滤波处理,滤波器的窗口大小为3,对1440组数据进行滤波处理。

通过对比分析风电机组齿轮箱油温预测值曲线与真实值曲线故障前的变化趋势,得出风电机组齿轮箱油温异常状态。

当风电机组齿轮箱正常工作时,模型对齿轮箱油温数据的预测值与真实值应基本重合,在齿轮箱临近发生故障时,预测的齿轮箱油温曲线与真实齿轮箱油温曲线会在某一时间点发生明显的偏离趋势。

该偏离趋势表示为齿轮箱油温预测值与实际值的残差波动,当偏差波动范围超出一定范围,则对风电机组齿轮箱的工作状况做出故障警示。

设模型输入向量为X={x1,x2,x3,x4},Y={y1}为输出变量,齿轮箱后轴温度、齿轮箱进口油温、发电机v2绕组温度、偏航方位角和齿轮箱油温依次作为模型的输入向量变量与输出向量。

将总样本的80%(1152组数据)作为训练集建立GWO⁃SVR模型,狼群算法中参数设置为种群大小为5,迭代次数为200,搜索空间为[0,20]。

通过灰狼算法对SVR的惩罚因子c和核函数参数σ进行寻优,得到最优的预测模型。

得到SVR模型中两个重要参数对预测结果的影响图后,将预测值和实际值之间的差异定义为loss,loss越小,差异越小,相对来说模型预测的效果就越好。

在模型适应度值图中,当迭代次数达到100时,适应度值趋于平稳,GWO⁃SVR模型训练集精度达到99.93%,可得出SVR算法中惩罚因子c为19.87和核函数参数σ为20。

经过模型的训练和参数调优,可得到最优的GWO⁃SVR预测模型,选取剩余20%(288组)数据输入到惩罚因子为19.87和核函数参数为20的GWO⁃SVR模型中进行验证,得到GWO⁃SVR模型输出的齿轮箱油温预测值与真实值的偏差图。

建立滑动窗口模型,从而实现风电机组齿轮箱油温异常状态预警,设滑动窗口宽度为h,时间增量为Ω,第k时刻的窗口内输入tk-h~tk之间的数据,即Sk。

采用平均绝对误差P(tk)作为状态识别指标,其表达式如下:

基于统计学中的区间估计理论,无需选取置信下限,只需选取置信上限Pth,区间[0,Pth]为状态指标P置信度为1-α的置信区间。置信上限Pth采用式计算:

为验证所提出预警方法的有效性,将GWO⁃SVR模型输出的齿轮箱油温偏差作为时移滑动窗口模型的样本量,通过对齿轮箱油温偏差数据进行时移滑动确定出状态识别指标。

风电机组齿轮箱在正常状态工作时,平均绝对误差曲线应该低于阈值上限,当齿轮箱油温偏差数据的平均绝对误差均超过阈值上限,立即发出故障报警。

选取滑动时间窗口宽度为5;时间增量为1;置信度为0.0005。通过式(20)可知齿轮箱油温的预警阈值为7.6773℃。

将距离相关系数GWO⁃SVR模型、Pearson⁃GWO⁃SVR模型、OOB⁃SVR模型与本文OOB⁃GWO⁃SVR模型的预警时间进行对比。

相关系数-GWO⁃SVR模型距风电机组齿轮箱发生故障大约早23min,Pearson⁃GWO⁃SVR模型距风电机组齿轮箱发生故障也大约早33min。

OOB⁃SVR模型距风电机组齿轮箱发生故障大约早61min,本文使用的OOB⁃GWO⁃SVR模型距风电机组齿轮箱发生故障大约早87min。

«——【·结语·】——»

本文提出一种基于OOB⁃GWO⁃SVR的风电机组齿轮箱故障预警的方法,实现了风电机组齿轮箱超温故障报警并得出如下结论:

(1)随机森林袋外估计算法不需要单独划分交叉验证集,直接使用袋外数据验证特征变量的重要性,并建立VI作为评估特征变量重要性指标,其中对算法的叶子节点数与决策树数量进行寻优处理,可提取到最佳的特征向量。

(2)通过将GWO算法与BOA算法和PSO算法进行比较分析,得出GWO算法的稳定性与收敛速度最优,因此,采用GWO算法对SVR模型中惩罚因子和核函数宽度系数进行优化处理,有效地提高了预测模型的准确率。

(3)本文模型与OOB⁃SVR、Pearson⁃GWO⁃SVR和距离相关系数GWO⁃SVR相比较能够提前发现风电机组齿轮箱早期故障,可以有效地降低风电机组齿轮箱出现停机带来的损失。

«——【·参考文献·】——»

[1] 董开松,李涛涛,尹浩霖.风力发电机组故障分析与智能诊断[J].高压电器,2016,52(10):176⁃181.

[2] 李辉,邓奇.基于改进LMD方法的风电机组齿轮箱故障诊断研究[J].自动化仪表,2021,42(3):60⁃65.

[3] 王新.基于SCADA数据的风电机组轴承故障预警[D].重庆:重庆交通大学,2020.

[4] 乔海升,赵文升.基于支持向量回归和聚类算法的主蒸汽压力优化[J].广东电力,2022,35(7):72⁃78.

[5] 莫赞,刘希良,谢海涛.基于混合梯度下降算法的支持向量机参数优化[J].网络新媒体技术,2014,3(2):54⁃58.

[6] 杜聪,邵建华,杨薇,等.网格搜索法优化的支持向量机室内可见光定位[J].激光杂志,2021,42(3):104⁃109.


展开阅读全文

页面更新:2024-05-21

标签:齿轮箱   机组   算法   故障   向量   灰狼   模型   特征   森林   优势   参数   方法   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top