欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
计算机论文
当前位置:首页 > 计算机论文
组合核支持向量机在放电模式识别
来源:一起赢论文网     日期:2015-03-20     浏览数:3351     【 字体:

 摘要 传统的单一核函数 SVM 无法实现局部放电中的多特征空间向量的映射分类,且目前SVM 大都采用不同尺度的径向基函数作为核函数,核的调整空间较为有限,无法针对不同特征空间的放电参数达到普适的效果。针对上述问题,本文提出一种基于多分组特征的组合核多分类SVM 的局部放电识别方法。该方法首先完成多类特征空间在不同类型 SVM 核函数中的映射分类,再采用骨干粒子群(BBPSO)优化方法选取最佳核参数,并求解核函数权值系数,最终形成最优核函数组合分类模型。实验结果表明,该方法对多个特征空间数据具有普适性,且融合效果理想,分类精度高于误差反向传播神经网络(BPNN)和 SVM 识别方法。

关键词:局部放电 组合核 支持向量机 骨干粒子群 模式识别

1 引言

局部放电故障监测不但可以快速获取高压设备的内部绝缘状况,及时反映设备劣化程度,而且对于设备的可靠性进行正确的评估具有重要意义 [1] 。其中特征提取和放电模式识别是其中最重要的两个环节。在众多的特征参数提取方法中,统计特征 [2,3] 、单次脉冲信号特征 [4] 、放电图像灰度特征 [5] 和小波特征 [6] 被证明具有良好的辨识能力。分类器的设计是模式识别领域中非常重要的环节,众多学者将各种模式分类器应用到局部放电的模式识别中,并取得了良好的应用效果。文献[7]应用扩展型神经网络来识别变压器放电的不同类型,但是无法克服神经网络收敛速度慢,以及容易陷入局部极小的缺点。

文献[8]中将二分类 SVM 进行多次分类组合,对实验及现场环境下的多源局放电信息进行监测和识别,该方法存在以下问题:不同核函数和参数的 SVM 性能存在很大差异;基于单核函数的参数优化方法由于核函数的格式固定,训练后的参数对样本数据仍然具有较强的敏感性,推广能力和鲁棒性较差。文献[9]选取一组不同宽度的径向基核函数,在参数未知的情况下,通过调整权值,找到最合适的参数,但是单一的径向基核函数能否在多个样本空间中达到分类最优没有得到证明,值得进一步研究。

传统单一核函数 SVM 一般只能反映某一类数据表现的放电特性,对局部放电的模式识别存在的困难有:①同一放电类型信号采集方法的多样性造成的信号采集困难;②PD 特征参数提取方法的多样性造成的参数提取困难;③放电机理相近的不同放电类型,特征对比度低,容易造成误分。针对以上问题,本文提出了基于分组特征组合核支持向量机(CKM-SVM)的局部放电模式识别方法。首先对实验条件下获取到的局部放电信号进行分析对比,利用四种不同的特征提取方法构造 4个特征空间,并对每个特征空间选用相应的核函数进行空间映射,之后利用改进骨干粒子群优化算法对核参数及组合核参数进行寻优配置,利用得到的最优参数构造 CKM-SVM 分类模型,最后利用该分类模型实现四种放电类型的识别,结果验证了该方法的有效性和实用性。

2 CKM-SVM 算法

给定特征空间 s 的样本数据集 X S =1{ , } ni i ix tx R D s {1,2, S} t {1,2, C} ,其中 n 为样本数, D 为特征向量的维数, k 为类别数。对于有 S种样本数据的 CKM-SVM ,组合核矩阵可表示为1( , ) ( , )SS S Si j l i jlK x x K x x  1 )式中, S 为基核的数目,对应组合参数为 {β 1 , β 2 β S } β s 0 11Sss ( , )S S Si jK x x 为基核,如图 1 所示。对每个基核分别进行核参数优化,用于处理单类特征参数。定义分类结果向量 Y S ={y i |i=1,2, k} 。为了表示方便,参照文献 [10] ,定义向量 v j ,其中 j=1,2, k ,并且 v j 的第 j 项为 1 ,而其余项为 −1/(k  1) 。例如,当放电样本 i 属于 4 种放电类型中的第 1 种时(即 t = 1 ,则 v i = [1,  1/3,  1/3,  1/3] 。相应定义和为零的向量 f(x) = [ f 1 (x), , f k (x)] ,作为分离系数,即对于任意 x R D ,均存在1( ) 0kiif x,保证了某样本只属于 k 类中的一类。这里仿照二分类 SVM ,定义k 分类的 Hilbert 空间 H k j 的积空间为11( ) ( ( ),... ( )) ({1} )jkk kjf x f x f x H  式中, H k j k 分类的 Hilbert 空间。因此对于任意一个 f j (x) 可以表示成 h j (x)+b j h j (x) H k j 。在错分的惩罚权值相同的情况下, k×k阶惩罚因子系数矩阵 Q,除对角线为 0 外,其他为 1 0 1 11 0 11 1 0        Q 2 )定义映射函数 L( y i ) ,当样本 y i 属于第 j 类时,k 维向量 L( y i ) 的第 j 项为 0 ,而其余项为 1 ,即矩阵Q 的第 j 列。 CKM-SVM 模型可表示为21 11 1( ) ( ( ) )2Kn ki i i ji jHL y f x y hn     3 )作为一个 n × 1 阶单位向量, ξ . j 表示第 i 行为 ξ .j n × k 阶矩阵的第 j 列。则式( 3 )可写为  . . .1 1112k kST Tj j j jl lj jlCL c c Kn        4 )采用拉格朗日泛函方法求解二次优化问题,引入非负拉格朗日函数 α .j =(α 1j ,…α nj ) T γ .j =(γ 1j ,…γ nj ) T将泛函关于 ξ .j β .j c .j 求极值,式( 4 )可表示为. . . . .1 1 11( ) ( ) ( )2k S kT Tj l l j j j jj l jK c y              5 )式( 5 )中所求的最优解记为.j  .jc jb l  . j  . j,则最优解满足如下条件:.1( )Sjj l l j j jlb e K c y             6 . . .( )j j j jL        j = 1 k 7 )最优超曲面的决策函数为s *s11( )= ( , )nSj j ijl lSlf x b c K x x      8

3 实验平台设计和特征提取

3.1 实验平台设计实验中局部放电模型被放置在油箱中,通过低压套管接地。如图 2 所示,在接地线上产生的脉冲电流由抑制检测频带为 500k 16MHz 的电流传感器和 300 3 000MHz 的超高频传感器进行测量。图 2 局部放电实验接线图注:1—交流电源 2—升压变压器 3—保护电阻4—耦合电容器 5—高压套管 6—小套管7—放电模型 8UHF 传感器 9—电流传感器Fig.2 Connection diagram of PD experiment 2 中,耦合电容器采用耐受电压为 100kV 500pF 的高压耦合电容。升压变压器由自耦调压器和无晕试验变压器两部分构成。最后通过局部放电分析仪( TWPD-2E )采样和存储。 4 个放电模型放置在油箱中,分别是:①悬浮放电;②针板放电;③沿面放电;④气隙放电,如图 3 所示。实验中对 4 个放电模型各测试 40 次,测试电压见表 1

共采集脉冲电流和 UHF 原始放电数据各 160组,其中分别随机选取 80 组用来训练,另外 80 组用于测试。

3.2 局部放电分组特征实验中提取两路信号,脉冲电流信号和超高频信号。针对两路采集信号提取特征参数,其中对脉冲电流信号提取统计特征参数和矩特征参数,对 UHF 检测信号提取时域特征参数以及小波包基特征参数,并利用不同的核函数分别对相应特征空间进行映射,最后将这些核函数组合成为多核 SVM 分类器。局部放电特征存在多源性,特征量的提取是放电模式识别的关键步骤。本文采用四种特征提取方法进行参数提取,包括时域波形特征 [12] 、灰度矩特征 [13] 、统计特征 [14] 及最优小波包基 [15,16] 。其中波形特征法针对单个放电脉冲进行特征提取;频域特征法对经过傅里叶变换后的放电信号进行特征提取;统计特征法对 50 个工频周期内的放电信号进行统计参数提取;最优小波包基是对 UHF 信号进行分解,利用熵最小原则选取最优小波包基,再用最优小波包基对 UHF 信号进行分解,得到小波包系数。最后利用信号在各频带投影序列的能量值,以及在各尺度下的模极大值和绝对平均值构造完整的特征空间。

3.2.1 统计特征参数( PRPD )对局部放电 PRPD 模式的最大放电量相位分布H qmax (φ) 、平均放电量相位分布 H q (φ) 、放电次数相位分布 H n (φ) 及局部放电幅值分布 H n (q) 四个不同二维图谱分别提取出包括偏斜度 S k 、陡峭度 K u 、放电量因数 Q 、相位不对称度 Φ 和互相关因数 CC 16个统计算子,见表 2 。表 2 中, “ + ” ”分别表示谱图的正负半周;dnP 表示特征空间 d 中的第 n 个参数; S k1 S k5 分别表示最大放电量分布的正半周偏斜度、负半周偏斜度,平均放电量分布的正半周偏斜度、负半周偏斜度和放电次数的偏斜度; K u1 K u5 分别表示最大放电量分布的正半周陡峭度、负半周陡峭度,平均放电量分布的正半周陡峭度、负半周陡峭度和放电次数的陡峭度; Q max Q mean 分别表示最大放电量和平均放电量; Φ max Φ mean 分别表示最大放电量和平均放电量分布的相位不对称度; C max C mean 分别表示最大放电量和平均放电量分布的互相关因数。

3.2.2 脉冲波形特征参数( PW )利用高速采样和宽带检测技术可以记录实验中放电脉冲的时域波形,如图 4 所示。PD 信号波形的时域、 频域等特征量可作为分类器学习的输入样本,变量的基本意义见表 3

3.2.3 灰度矩( GM )特征灰度矩特征法首先对 50 个工频周期内的局部放电信号统计得到描述放电幅值、相位和放电次数的三维统计图谱 H n (q,φ) ,再利用其在 φ  q 二维平面上的投影形成局部放电灰度图像。为了避免更高阶矩计算复杂和物理含义不明确的弊端,这里采用正半周 ( , )nH q 和负半周的 ( , )nH q 6 个矩特征参数,包括代表图像灰度重心的横纵坐标xfxfyfyf以及代表灰度图像主轴方向的特征参数mfmf,见表4 3.2.4 最优小波包基系数针对 4 种常见 PD 模型,作者采用 5 阶高斯函数构建了相应的数学模型,其数学表达式为22( )1( ) eiix bnciif x a  9 )式中, a i 表示波峰的高度; b i 表示波峰所在位置的横坐标 x 的值; c i 反映了波峰的陡度; n 表示放电脉冲极值的个数。对放电模型进行 4 层分解后得到了最优小波包基 {db 2 db 10 } ,见表 5

4 基于 CKM-SVM 的局部放电模式识别

4.1 识别流程CKM-SVM 模型既可以对放电源的单次放电所提取的不同特征空间数据进行融合,也可以融合多次放电的统计数据。基于 CKM-SVM 的局部放电模式识别流程如图 5 所示。应用 CKM-SVM 进行组合特征空间的局部放电模式识别流程如下:( 1 )分析实验数据,确定 S 类典型故障类型。( 2 )特征提取,根据实验中采用的数据采集方式,确定特征空间数量 D 。( 3 )将第( 2 )步中提取的 D 个特征空间与选取的 S 类核函数进行融合,构造 CKM-SVM 模型。( 4 )利用粒子群优化方法确定核参数及惩罚因子,使 CKM-RVM 模型针对所研究的特征对象达到最优。( 5 )实验中获取 4 类放电各 80 组样本数据,从每一类放电中随机选取 40 组对模型进行训练。( 6 )用剩余的 40 组数据样本对模型进行测试。

4.2 核函数选择由于核函数的引入,所需的特征空间( k 分类的 Hilbert 空间)并不需要明确的定义,而是通过式( 8 )所示的核函数推导而得,因此核函数的选择是决定特征空间的关键因素。常用的核函数有以下4 种。( 1 )多项式函数为 ( , ) , 1dT Tk x x x x   2 )高斯径向基函数 (RBF) 22( , ) exp2TT x xk x x       3 )多层感知机函数( Sigmoid 函数)  ( , ) tanh ,T Tk x x x x b    4 )样条函数为31( , ) 1 , 0.5 , min( , ) min( , )6T T T T Tk x x x x x x x x x x    通过对比以上 4 类核函数的测试结果,来确定对应局部放电特征空间的核函数。多项式核函数的参数 d 决定了支持向量机的性能,参数过小会影响非线性系统的辨识率,过大会造成空间复杂度过高。应用 RBF 核函数作为多核学习支持向量机算法中的基本核函数, 待确定的参数包括 σ 与惩罚参数C ,最优值分别记为 σ* C* Sigmoid 函数具有较强的全局辨识能力,当在ρ 0 并且 b 0 的情况下满足正定核函数的条件作为 SVM 的核函数。无穷样条函数中没有待确定的参数,阶数过低会降低辨识率,阶数过高会造成支持向量个数过多,无法控制复杂度。

5 基于 BBPSO 算法的核参数优化

5.1 BBPSO 算法多核支持向量机的构造涉及到 4 个核函数的多个核参数的群体优化,本文采用骨干粒子群算法 [11] Bare-bones Particle Swarm Optimization BBPSO )进行参数寻优。骨干粒子群算法最早由 Kennedy 2003 年首次提出,之后众多学者对其进行了研究,并取得了较好的应用效果。 BBPSO 算法利用一个关于粒子全局极值点和个体极值点的高斯分布完成粒子位置的更新2, , ,( 1) ( ( ), ( ))i j i j i jx t N t t     10 )式中,, , ,( ) ( ( ) ( ))/2i j i j g jt p t p t    是高斯分布的均值;2, , ,( ) ( ) ( )i j i j g jt p t p t    是高斯分布的标准差。BBPSO 在经过一定周期的搜索后, 其搜索机制与 PSO 算法的相似。在没有新信息被引入的情况下, Gbest 模型最优粒子和 Pbest 模型粒子的搜索空间有限,易陷入停滞点,很大程度上束缚了算法中其他粒子的搜索范围。而且, BBPSO 算法是以全局极值点为中心的结构,群体中的信息交流速度快且方向单一,这使得粒子快速的聚集在一个较小的搜索区域内,群体多样性因此降低,导致出现早熟收敛现象。由此可以通过定义惰性粒子及其动态初始化策略来解决上述问题。

5.2 改进惰性粒子及其初始化策略在进化过程中,经常出现粒子位置、个体极值与全局极值非常相近的情况,导致在粒子群更新公式的作用下,粒子的位置更新概率逐渐趋于零,最终粒子将停止进化。如果在算法收敛之前有些粒子已经停止进化,则称这些粒子为惰性粒子,因为这些粒子对整个算法寻找最优解的贡献相对较小。惰性粒子的量化定义: 如果粒子累计 η 代个体适应度值未改善,则称其为惰性粒子, η 称为惰性系数。为避免惰性粒子过多影响种群的多样性和算法的搜索效率,本文提出一种随机初始化策略。每次迭代时,重新初始化惰性粒子的位置。随机初始化后的粒子,将忘记以前的记忆,选择当前位置作为它的个体极值。这样可以帮助惰性粒子逃离全局极值点的束缚,进而提高粒子的搜索效率。由式( 10 )得知, BBPSO 算法的每个粒子向它的个体极值和全局极值的加权平均收敛,且最终收敛到同一点。由于采用优势粒子保存策略,随进化代数的增加,粒子个体极值和全局极值之间距离将不断缩短。进而,在算法中后期种群多样性消失的速度也随着变快。为均衡保持种群的多样性,给出惰性系数的一种动态调整策略,公式如下:max/min max min( )et t         11 )式中, t max 是算法的最大迭代次数; t 为当前代数;ε 为调整下降速度的参数;     表示向下取整。

5.3 算法步骤( 1 )初始化粒子群中的粒子位置、个体极值和全局极值,设置算法参数,包括种群规模、最大迭代次数和惰性系数的上下阈值等参数。( 2 )计算每个粒子的适应值,按下式更新惰性粒子 q 和其他粒子的个体极值。p q (t+1)=x q (t+1) 12 p t i qx t f p t f x t    ≤>(13)(3)初始化惰性粒子的停滞代数,更新其他粒子的停滞代数,如果粒子适应度得到改善,则该粒子的停滞代数减 1;否则加 1。(4)按下式更新全局极值:( ) ( ( )) ( ( 1))( 1)( 1) ( ( )) ( ( 1))g g ggg g gp t f p t f p tp tp t f p t f p t       ≤>(14)式中,gp=arg min{ f (p i )i = 1,2,,N}。(5)更新粒子位置。如果粒子为惰性粒子,则重新初始化其位置、个体极值和停滞代数;否则,按式(10)进行位置更新。(6)若满足停止条件(适应值误差小于设定阈值或迭代次数超过最大代数) ,搜索停止,输出全局最优位置和全局最优适应值。否则,返回步骤(2)继续搜索。

6 实验结果分析

本文对实验获取到的 4 类局部放电信号进行分析,分别为悬浮放电、针板放电、沿面放电和气隙放电, 对每种类型的放电信号分别提取 80 组数据进行分析,并对每组数据分别提取 4 种局部放电特征参数,分别是时域波形特征、统计特征、灰度矩特征和小波域特征。首先按照式(14)对特征参数进行归一化处理。minmax miniix xxx x i=1, 2,, N 15)式中,ixx i 分别表示归一化前、后的样本值;x min x max 分别表示样本的最小值和最大值。单核 SVM 应用于不同放电特征时,分类效果有较大差异。识别结果见表 6。由表 6 可见,对于局部放电时域特征和统计特征,SVM 的最佳核函数均为 RBF 核函数;对于频域特征,SVM 最佳核函数为 RBF 核函数;对于小波域特征,SVM 的最佳核函数为多项式核函数。 由以上分析可得到各放电特征的最优核组合,见表 7。根据表 7 的最优组合构造 CKM-SVM 分类模型,并对参数利用改进骨干粒子群算法进行优化配置。文中设定粒子种群数为 30  =1c 1 =c 2 =2,最大迭代次数 N=50,采用 5 折交叉验证的平均正判率作为适应度函数。经过 20 次计算求均值,获得最优参数:SVM的惩罚因子 C*=1;对于 Sigmoid 核函数,ρ*=1b*=2;对于获取到的最优组合核参数β 1 =0.2,β 2 =0.2,β 3 =0.5,β 4 =0.1。将参数优化之后的 CKM-SVM 分类器应用于测试样本,结果如图 6 所示。由图 6 可见,四种单核支持向量机用于不同特征参数的局部放电模式识别时,识别准确率差异很大,即单一核函数应用于不同特征空间时,无法保证稳定的高识别率;而优化之后的 CKM-SVM 不但保证了在每个特征空间提供最佳识别率,而且在灰度矩特征空间中把识别正确率从 95%提高到97.5%。为了研究放电类型对分类器的影响,本文分别采用 BPNN、单核 RBF-SVM CKM-SVM 三种分类器对四种放电类型进行分类测试,结果见表 8。由表 8 可见,对于 4 种放电模式 160 个测试样本,CKM-SVM 的识别率达到 96.25%,高于 RBF-SVM 92.5% BPNN 90.00%。在对每一类放电的 40 个测试样本中, CKM-SVM 的识别率均高于BPNN 和单核 SVM 的识别率, 其中针板放电的识别率达到 100%,其他 3 种放电的识别率也达到 95%。经过对实验结果的分析表明,由于 CKM-SVM 融合了多组特征的局部放电信息,能够更为全面的描述放电特征,CKM-SVM 识别方法明显优于 BPNN RBF-SVM 分类器。

7 结论

本文设计实现了一种基于多核多分类方法的CKM-SVM 分类器,实验中,把采集到的 4 个特征空间的特征数据作为分析对象进行局部放电模式识别研究,得出以下结论:(1)多核 SVM 融合了多组局部放电特征,能够较为全面的描述局部放电信息。(2CKM-SVM 分类器针对每个放电特征空间分别选取最优核函数,并利用改进的骨干粒子群优化算法实现了核参数的优化配置。(3)实验结果表明,CKM-SVM 分类器可以通过不同核函数融合任意多组放电特征信息,识别精确度优于 BPNN 和单核 SVM,具有较好的实用性和推广性。

参考文献[1] 王国利 , 郝艳捧 , 李彦明 . 电力变压器局部放电检测技术的现状和发展 [J]. 电工电能新技术 , 2001,20(2): 52-57.Wang Guoli, Hao Yanpeng, Li Yanming. Present andfuture development of partial discharge detection inpower transformers[J]. Advanced Technology ofElectrical Engineering and Energy, 2001, 20(2): 52-57.[2] 满玉岩 , 高文胜 , 高凯 , . 发电机局部放电的统计特征识别 [J]. 电工技术学报 , 2006, 21(4): 41-45.

[返回]
上一篇:基于仿生模式识别的未知推荐攻击检测
下一篇:基于互信息量的生物信息数据特征标注方法