基于非线性状态估计算法在大数据云平台系统的风电机组故障预警模型研发与应用.docx

资源描述

《基于非线性状态估计算法在大数据云平台系统的风电机组故障预警模型研发与应用.docx》由会员分享，可在线阅读，更多相关《基于非线性状态估计算法在大数据云平台系统的风电机组故障预警模型研发与应用.docx（9页珍藏版）》请在第壹文秘上搜索。

1、【摘要】提出一种基于非线性状态估计算法（NSET）,结合现有大数据云平台系统的Spark内存批处理的大数据处理框架，建立风电机组故障预警算法。以大数据云平台系统中风电机组SCADA数据作为数据源，通过算法模型分析处理传动链大部件设备异常表征，形成故障预警记录。将目标设备监测参数的前一时刻也作为模型训练的特征参数之一，组成非线性状态估计算法的记忆矩阵，并应用归一化方法对算法模型进行处理。故障预警记录提交给风电场运维人员进行设备故障事前检修，通过实际应用验证所提算法能够提前预警潜在故障，可以有效地降低设备停机时长。近年来，风力发电发展迅猛，风机装机容量快速增长，风力发电在改善我国能源结构中发挥越来

2、越重要的作用。随着风电机组大规模地投入运行，以及风电场特殊的选址和负荷的不稳定机组某些部件例如齿轮箱、发电机、主轴等传动链设备容易发生故障，造成故障停机，严重影响发电量，造成不必要的经济损失。因此，有必要对风电机组提出有效的预防性检修策略，对关键故障部件进行状态监测和故障预警。如果在故障发生前做出预测，就能够提前制定检修计划，合理安排检修人员与物资，减少因风电机组突然停机造成的损失,降低发电成本,保证机组安全稳定运行,从而提高风电场的竞争力。如今，风电场监控与采集系统（SCADA）在机组状态监测的广度和深度不断加强，现已积累了海量的运行数据,但未能充分利用，如何挖掘不断增长的海量状态监测数据,

3、进行快速有效的故障预警成为了热点研究方向。本文针对SCADA存储的海量设备监测数据,提出一种基于非线性状态估计算法（NSET）,结合现有大数据云平台系统的Spark内存批处理的大数据处理框架，建立一种风机故障预警模型。该模型利用平台存储的海量风机监测数据，并在SPark分布式编程模型下，建立机组的关键参数NSET预测模型，通过模型预测值和实际值的残差,判断机组运行的健康状态，达到风机故障预警的目的。2 .基础算法2.1 非线性状态估计算法(NSET)NSET建模需要用到的参量包括系统总体观测矩阵P、训练矩阵K、过程记忆矩阵D以及观测矩阵Xobs和预测输出矩阵Xesto设系统总体观测矩阵PnXb

4、形式如式(1),其中n表示时间状态，b表示每个时间的观测变量数。一=X(1),X(2),/(孙孙玉/=巧I%(1)与2%.其中矩阵的行向量为某一给定参数Xi在某个观测时间段内的所有观测值，可表示为,(2)Xi=区(。%0.3(芍)(2)矩阵的列向量为某一时刻tj所有观测参数的观测值，可表示为，(3)XG)=再G),与(G)()r(3)从总体观测矩阵P中选取一段时间的参数记为历史观测矩阵,代表各个观测参数的健康状态。K可表示为，(4)(4)K=XQ),X(2),X(K)如再J_ilx22从历史观测向量即训练矩阵K中选择出一部分满足条件的状态数据即可构成过程记忆矩阵D0过程记忆矩阵D可表示为，(5

5、)D=X(1),X(2).,X(D)如再=X21%-%XTa%NEST模型的输入是具有一定时间长度的观测向量Xobs,输出为当前系统的状态估计矩阵Xest,对任意输入的一个观测向量Xobs,NEST模型都相应的生成一个与Xobs维数相同(设维数为m)的权值向量W使得(6)XW=Z)JF(6)犷=b%W2,叫J其中过程记忆矩阵和状态估计相似性测度的大小可依靠权值向量W表示，对应的权值wi越大，则x*j与Xj越相似。设观测矩阵和状态估计矩阵的残差为E,若要满足相似性最大，则残差E取最小为：(7)min=min(XoM-XE|)(7)=min(IX(ASWI)若使8最小，则需要求一的极小值，令宗=0

6、,则Ir=(DT0T(ZTX)(8)由式(8)可知，W存在的前提是矩阵DTD可逆，这就要求数据间不存在相关性，但实际风电系统等大多数系统的数据很难保证不存在相关性，为解决这一问题，采取非线性运算符代替传统的点积方法，使其可求并具有更为直观的物理意义。由于本文所研究的内容更加侧重状态与模型间的空间距离，所以选择两向量间的Eucliden距离作为非线性运算符，即J)=y(-yi)2(9)从该运算符可以直观地看出两向量间的欧氏距离与相似度成正比，距离越近，相似度越大。则式(8)可改为WDmXDXJ(10)I则系统的当前状态估计封轼可写瓦=Z)(Z0D)-1(ob)(11)上式即为NSET模型最后预测

7、输出矩阵计算公式。2.2 归一化数据预处理的第一步是数据归一化，本文应用均值归一化方法对NSET模型的输入数据做归一化处理。归一化后的数据不带单位量纲，有助于使用算法去异常值。其中均值归一化方法：其中，和。分别是数据X的均值和方差，为归一化后的数据。3 .大数据云平台系统及Spark批处理介绍3大数据云平台系统为有效存储和管理日益剧增的风电机组生产数据，公司利用大数据技术建立了以hadoop为基础的大数据云平台系统，图1为大数据云平台系统基本框架结构，通过将风电机组的生产运行数据、生产管理数据、振动监测数据，等结构化及非结构化数据，利用开源的Hadoop中的HDFS作为底层分布式文件系统，hi

8、ve作为数据仓库，M叩RedUCe和SPark作为离线批处理计算框架，ZookeePer提供协同调度。大数据云平台系统支持友好的二次开发，协助公司开展风电机组预警算法的开发部署。批处理MapReduceZKeeperWEYarnH。FS分布式文件系统生产运行数据个生产管理数据71关说部位监测数据1：大数搪云平台系统基本框架结构3.2SPark批处理Spark是由加州大学伯克利分校的实验室开发的一种重要的分布式计算系统。它基于RDD(弹性分布式数据集),在Hadoop的基础上进行了架构上的改良，Spark成功的构建起了一体化、多元化的大数据处理体系。Spark是一个开源的集群计算系统，它基于内存

9、计算,把中间数据放在内存中,对于迭代计算等复杂计算有较高的计算效率。作为一个并行的、容错的数据结构，RDD允许用户将数据显示地存储到磁盘和内存并根据需要对数据分区。同时，RDD还提供了转换和动作两类丰富的操作来处理这些数据。作为spark的核心,RDD同时也是整个spark的架构基础。它有如下特性：它的数据结构存储是不变的，可以支持跨集群的数据分布，能够根据记录的关键值对结构进行分区，提供了粗粒度操作，并且这些操作都支持分区，它可以将计算过程的中间数据存储在内存中，从而能够降低延迟性执行。Spark运行架构如图2,任务控制节点(DriverProgram)通过集群资源管理务(ClusterMa

10、nager)把划分好分区的任务集发送到集群的运行作业任务的节点(WorkerNode),每个节点上执行相应的进程(EXeCUtor)。图2：Spark运行架构图4 .预警模型研发4.1 模型功能介绍风机齿轮箱是整个机组非常重要的大部件之一，一旦发生故障，修复工作往往需要耗费大量时间与设备成本。本文预警模型以齿轮箱作为研究对象，依据NSET算法建立模型，对齿轮箱高速轴驱动端轴承温度值进行预测，进而与实际值做对比，以此来对齿轮箱健康状态情况进行判断，最终实现齿轮箱高速轴驱动端轴承温度预警。4.2 预警建模原理模型选用河北省张家口某风电场2017年2月份至2018年3月份的实际风电场SCADA系统中

11、Imin级数据作为研究基础，从风电场24台风机中选择3台工）兄相对稳定，机组状态相对健康的风机作为建模研究对象。选择系统中的风速、发电机转速、有功功率、齿轮箱高速轴驱动端轴承温度、齿轮箱高速轴驱动端轴承温度上一时刻温度、机舱温度六个参数作为故障预警模型的输入，通过NSET算法离线计算出可代表风机全工况健康状态下的记忆矩阵。将记忆矩阵布置在大数据平台系统的数据库中,利用平台中风机风速、发电机转速、有功功率、机舱温度4个测点的准实时的数据（本预警模型选用前一天存储的历史数据）作为模型输入，与记忆矩阵进行计算，进而输出前一天时序下风机齿轮箱高速轴驱动端轴承健康工况下温度的预测值。通过预测值减前一天实

12、际值得出温度残差，比较残差大小判断齿轮箱高速轴驱动端轴承温度是否异常，若残差大于20。C此实际值视为异常，当异常值占比全天数据值超过20%时，产生预警记录。4.3模型部署与设定自动定期任务基于以上模型原理将模型以python计算机语言和shell脚本语言部署于大数据云平台系统中开发者平台中如图3所示，选择大数据云平台中定义好的风电场ID和时间跨度参数设置，按天建立周期系统任务，任务每天定时在大数据云平台自动运行，并将前一天预警结果通过可视化方法展示在平台上，并推送给现场人员查阅，方便其及时安排检修。torgt_coltan*wnecvwgrtAWfMBysVvgencsnspcvtVtrart

13、aaBefland0vg4WtnatCaBcaOilavg*colun三*sityyyywn1.htnti*trcet.coluanMbk-me=,rirx1.toutpuj81uans三r.id,i,code,deviation,yyyyBB1.site*,splitC9*qarSeIUanS*sito,idlvtg.id,heoodetection,Btdoteoccurro(ihp_datc.alAm*.split(e)config* t.higthreshold*:100.* gpIcnrthreshold*:-40.9Uaperaturedeviationthreshold*:X“p

14、rrcEtcount*:SO1* c.cabir*IhokSitlwperti*：CaBWg以心SiuturbinesEnviroosat炎瓯toYWdrrare0dtIDttflDiUntorrtviron99tXe4?”IXCtUnlMooryjHitrtxwHQPd.rareslt三CoobiDeVholeSiteTefsp.”F.9fesdb.ao.dontO1.rwmeYbJian-Chwng=JE名Bl等号不能有空格三hodoop-qee11ae=roQt.Vindcnsighthadoop_queuenAne=root.dbaJianhivejath三userhiveVarebOUsSCDaBe)db三hodoop-fiIesysteBsKdfs：titanhadoop.filesyste=hdf$:hbjthdfs.user三l(ounAA*)hiv.

展开阅读全文