支持向量机在输电线路故障识别中的应用研究

更新时间:2023-12-17 19:31:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

分类号 TM7 密级 UDC

硕 士 学 位 论 文

支持向量机在输电线路故障识别中

的应用研究

学 位 申 请 人: 马新明

学 科 专 业: 电力系统及其自动化 指 导 教 师: 王成江 副教授

二○一○年五月

A Dissertation Submitted in Partial Fulfillment of the Requirements for

the Degree of Master of Science in Engineering

Research on Application of Support Vector Machine in Fault

Identification for Transmission lines

Graduate Student:

Ma xinming

Major: Power System and its Automation Supervisor: Associate prof. Wang chengjiang

China Three Gorges University Yichang, 443002, P.R.China

May, 2010

三峡大学学位论文原创性声明

本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果,除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明,本人完全意识到本声明的法律后果由本人承担。

学位论文作者签名:

日 期:

I

内 容 摘 要

随着电力系统电网规模的不断发展,对输电线路的安全运行和供电可靠性的要求亦越来越高。输电线路作为电力系统传输电力的关键设备,在电力系统的安全运行中起着至关重要的作用,其发生的各种故障将会直接威胁着电力系统的安全运行,这些故障若不及时排除就将会对电力系统产生严重的甚至是灾难性的后果,而且其引起的经济损失也将会越来越大。输电线路故障的迅速排除是电力系统安全、可靠和经济运行的重要保证。当输电线路一旦发生故障时,将会在较短的时间段内给出大量的故障信息,如果单凭运行工作人员的工作经验进行故障分析,其正确性和快速性将会很难得到保证。因此及时、准确的判断并识别出这些故障就显得尤为重要,并且对电力系统管理人员恢复决策的制定和电力系统的安全运行具有重要意义。

支持向量机(Support Vector Machine)是基于统计学习理论基础上提出的一种新的模式识别方法。它基于结构风险最小化原则(SRM准则),并且兼顾训练误差和泛化能力,在解决小样本、非线性等模式识别问题中表现出其独有的优势。

本论文在研究支持向量机的二叉树分类的基础上,结合输电线路故障的特点,考虑其不同故障发生的优先级后,设计了基于SVM的改进二叉树输电线路故障多类分类器的模型,通过仿真实验选择了最小二乘支持向量机(LS-SVM)算法和线性函数转换表达式的归一化算法,并利用电力系统分析综合程序(PSASP)软件仿真小样本短路电流数据和短路电压数据,结合MATLAB7.0软件编写分类程序,对所建立的故障分类模型进行训练,得到了九个二分类SVM的判别函数系数矩阵和判别函数,再利用这九个判别函数系数矩阵重新编写故障分类器程序,最后利用测试样本对故障分类器进行测试,并且和其他SVM算法与BP神经网络算法等几种算法分类器的测试结果相比较。结果表明,在输电线路所有故障类型情况下,利用LS-SVM算法设计的改进二叉树输电线路故障分类器都具有很高的分类正确率,尤其是对两相接地和不接地短路电流分类的效果尤为显著,另外,本文所设计的故障分类器的数据预处理过程简单,分类步骤少,可以实现输电线路故障的快速分类。 关键词:支持向量机 二叉树 输电线路 故障识别

II

Abstract

With the development of power system, The requirements for the transmission lines safe operation and the reliability of power supply are also getting higher and higher.Transmission lines as the key equipment of power system, it plays a vital role in the operation of power system, a variety of its fault would be a direct threat to the safe operation of power system,if these fault would not be immediately removed then will produce serious and even catastrophic consequences for the power system, and its resulting economic loss will also be more greater. The rapid transmission line fault exclusion is an important guarantee for the power system security, reliable and economic operation. When the transmission line occurs fault, woule have a large number of fault information in a short time, if only have the experience of the workers to analysis, its speed and accuracy would be difficult to be guaranteed. Therefore, timely and accurate judgments, and identify these failures is particularly important. It have a great significance for power system management to making the decision of the restoration and the safe operation of. power systems.

Support Vector Machine(SVM) is a new pattern recognition method based on statistical learning theory. It is based on the principle of structural risk minimization (SRM guidelines), and the balance between training error and generalization capabilities, It shown its unique advantage in addressing the small sample, nonlinear problems. In this paper, based on the study of binary tree SVM multi-classification and combination of the characteristics of transmission line fault, considering the priority of the different faults, the design improvements based on binary tree SVM classifier model of transmission line fault, by simulation experiments to chosen least squares support vector machine (LS-SVM) algorithm and a linear function of converting an expression of the normalization algorithm, and use the power system analysis software package (PSASP) software simulation small samples of short-circuit voltage short-circuit current data, combination of MATLAB7.0 to write the classification procedures and to training the fault classification model, and gain nine SVM discriminant function coefficient matrix, then take it to re-write classification program, finally, use obtained SVM classifier and other algorithm and BP neural network classifier algorithms to compare. The results showed that all the fault type in the transmission line cases, the use of LS-SVM algorithm is designed to improve the binary tree transmission line fault

III

classifier has high classification accuracy rate, especially for two-phase ground and not short-circuit ground effect is particularly significant, In addition, this paper designed fault classifier is have simple data pre-processing, classification steps small, can achieve the rapid transmission line fault classify.

Key words: SVM Binary tree Transmission line Fault identification

IV

目 录

引言 ................................................................................................................... 1 1 绪论 ............................................................................................................... 2

1.1 课题研究的目的和意义 .................................................................... 2 1.2 国内外研究现状 ................................................................................ 3 1.3 本文工作 ............................................................................................ 5 2 支持向量机理论 ........................................................................................... 6

2.1 统计学习理论概要 ............................................................................ 7 2.2支持向量机 ....................................................................................... 11 2.3 SVM多类分类方法 ......................................................................... 19 2.4本章小结 ........................................................................................... 20 3 输电线路的故障模拟 ................................................................................. 21

3.1电力的传输方式 ............................................................................... 21 3.2 输电线路的故障类型、现象、原因及特点 ................................... 22 3.3本论文采用的输电线路模型及仿真网络图 ................................... 25 3.4仿真软件和程序语言介绍 ............................................................... 28 3.5本章小结 ........................................................................................... 31 4 SVM在输电线路中的具体应用 ................................................................ 32

4.1 LS-SVM原理及LS-SVMMATLAB工具箱 ................................. 32 4.2二叉树及改进的二叉树多类分类算法 ........................................... 35 4.3 数据归一化算法选择及归一化程序 .............................................. 37 4.4 短路电流分类器训练及测试结果比对 .......................................... 39 4.5短路电压分类器训练及测试结果比对 ........................................... 43 4.6动态链接库文件的生成 ................................................................... 46 4.7本章小结 ........................................................................................... 47 5 总结 ............................................................................................................. 48

5.1 论文工作总结 .................................................................................. 48 5.2 前景展望 .......................................................................................... 48 参考文献 ......................................................................................................... 50 后记 ................................................................................................................. 54 附录 ................................................................................................................. 55

V

引 言

电力输电线路发生各种故障后,要求能够准确、快速地识别出所发生故障的类型,通常的做法是依据相应的逻辑关系设置门槛值来实现。然而发生故障时所获取的电压、电流信息一般都是受运行方式、故障位置和故障时刻等各种因素的影响,从而使整个故障数据类型一般是非线性可分的,各种故障数据之间通常不具有显著的线性划分界限。并且这些方法在数据预处理方面步骤较多,一旦其中某一环节出错,则对最后的分类带来很大的误差,而且前期数据处理过程多则意味着到最终分类的速度会变慢,这对输电线路发生故障后准确、迅速地识别故障类型是不利的,所以基于门槛值的逻辑判别方法就存在一定的缺陷。

本文在充分研究支持向量机(SVM)二叉树多分类的基础上,结合输电线路故障的特点,考虑不同故障发生的优先级后,设计基于SVM的改进二叉树输电线路故障分类器,借助它可以利用归一化后的短路电流数据和短路电压数据直接进行输电线路故障分类。通过仿真和编程验证,该方法处理过程简单、分类步骤少和分类正确率高等优点。

1

1 绪论

1.1 课题研究的目的和意义

随着现代电力网络规模的不断扩大,确保供电的可靠性和连续性是电力系统安全稳定运行的关健问题。输电线路作为输电系统中的枢纽干线,在电力系统中起着重要作用,其故障直接威胁着现代电力系统的安全运行,且引起的经济损失也越来越大。在电力系统发生事故的情况下,正确而快速的故障诊断,对于电力系统的恢复决策,提高供电可靠性具有重要意义[1,2],这也是国内外对电力系统故障诊断课题广泛研究的原因。

社会的发展推动着电力工业和输电线路的不断发展,随着电力负荷的不断增大,现代电力系统需要将大容量的电能输送到负荷中心。输配电系统是电力系统的重要组成部分,是发电厂与电力用户之间输送电能与分配电能的中间环节,包括各电压等级的输电线路和变电所,它们担负着输送电力的重要任务。随着社会的进步,用户对电能的可靠性特别是连续性的要求越来越高,然而电力系统的故障却是不可避免的,为了快速监测及消除故障确保系统安全稳定运行、增强供电的可靠性和连续性,就需要一个优质的故障诊断系统快速实现输电线路的故障定位和故障类型识别,以便于检修和事故后的快速恢复。

电力系统的任何地方都可能发生故障,而高压和超高压输电线是经常会发生故障的重要环节。高压输电线路是电力系统的命脉,其故障直接着威胁电力系统的安全运行。由运行经验统计表明,它是系统中故障率较高的设备,这是由它们所处的运行环境决定的。因为高压和超高压输电线路输电距离长,所穿越地区的地形往往比较复杂,运行环境较为恶劣,输电线路有时还会因雷电等过电压引起闪络,或者树木及鸟类以及人类活动等造成导体与导体之间、导体与地之间的短时接触,形成瞬时性故障。

在高压输电线路发生故障后,为了减少停电带来的损失,要求电力维修人员能够迅速到达现场,检修电路,恢复供电,而进行恢复处理的前提是准确而快速的检测出故障原因、故障设备、故障类型以及故障位置。在输电线路的故障诊断中,专业人员的经验和所掌握的专业知识对快速诊断故障起着决定性的作用,但是随着现代电力系统的复杂化和自动化程度的不断提高,一旦发生故障,在很短的时间内会有大量的报警信息传入控制中心[3,4],仅靠一、二位专家的经验往往难以进行快速、准确的故障诊断,并尽快解决。其次,单纯依靠人工全线检查故障有时是极其困难并且是非常费时的,所以必须要求在输电线路发生故障时,采取有效的方法,准确而迅速地判断故障类型。

本论文在充分研究支持向量机多分类的基础上,结合输电线路故障的特点,考

2

虑不同故障的优先级后,设计基于SVM的输电线路故障分类器,借助它可以利用归一化后的短路电流数据和短路电压数据直接进行输电线路故障分类。该分类器的数据预处理过程简单,分类步骤少,而且故障类型的识别不受故障过渡电阻、故障位置的影响,可以实现输电线路故障的快速分类。因此该课题研究具有重要的科学意义和应用前景。

1.2 国内外研究现状

目前传统的输电线路的故障类型识别主要有两种方法[5,6,7]:一种是采用相电流差突变量选相,另外一种是稳态故障量选相。

1.2.1相电流差突变量选相

突变量选相中,利用相电流差突变量的选相原理有两种:其中一种是采用正、负序故障电流序分量相对相位的关系来选相,这种选相原理是先假设正、负序电流分支系数相等,然后使得其推导过程简化。该选相原理在选相过程中裕度角比较小,选相精度不是很够,因此其可靠性比较低;而另一种是相电流差突变量选相元件,这种是利用单相接地故障时另外两相的相电流差突变量为零这一特点而进行选相的。但前提是这只在正序和负序分支系数相等的情况下才能成立,如果正、负序分支系数不同则会对选相结果的影响比较大。

目前普遍采用的相电流差突变量选相是在各种的不同故障时两相工频电流差的变化量幅值特征进行选相,再结合有无零序分量来区分是否两相短路或者两相短路接地。该方法在故障的初期灵敏度比较高,且不受负荷电流和过渡电阻的影响。但当保护位置在弱电源侧或者发生转换性故障时,则其灵敏度就会不足甚至会导致误选相。为了克服此类缺陷,可以采用相间电压突变量选相,该方法具有相电流差突变量选相的部分特点,又弥补了其自身的不足,但是在较长的线路末端故障时会可能存在其灵敏度不足的问题。补偿电压(相补偿电压和相间补偿电压)突变量选相同时具有相电流差突变量的优点和相间电压突变量选相的优点,其选相性能比较优越,近年来也获得了比较广泛的应用。

1.2.2稳态故障量选相

稳态故障量选相又包括两类,一类为阻抗选相,其方法主要依据阻抗测量元件的测量结果来确认不同故障相的,其在多数比较简单的故障类型情况下能正确地进行故障类型的识别,但是却会受到系统运行方式、故障点的过渡电阻的影响比较大。另一类方法是故障序分量选相,其实依据正序、负序及零序故障时的序分量电流相对于相位关系原理来进行故障类型的识别。这种方法受故障点过渡电阻的影响比较小,但是正序故障电流时的提取将会受到负荷电流的影响。

目前在国内数字式高压线路保护中则主要采用突变量选相和稳态量选相相结

3

合的方法,其是利用突变量元件来作为保护启动后的第一次选相元件,并且利用序电流的分区与阻抗比较的方法来作为振荡闭锁期间的故障选相元件。

无论是稳态故障量选相还是相电流差突变量选相,在原理上其都是设置基于门槛值方法,依据一定的逻辑关系去实现的。但是故障后所获得的电压、电流等信息会随着系统的运行方式、故障的位置、故障点的阻抗和故障时刻等因素而发生变化,这将会导致整个故障模式识别空间一般都是非线性可分的。因此在基于门槛值的方法有可能不会适应故障后的电流、电压的信息的变化,亦可以说如果依据故障后电压、电流或相位角等的信息来区分故障模式,则各种故障模式之间一般不具有明显的线性分界线,由于其相关的因素比较复杂,不易用数学模型来进行理论的描述,所以设置基于门槛值的方法存在着一定的缺陷。

随着人工智能理论与技术的发展,人工智能为输电线路的故障类型识别提供了一些新的方法。基于智能高新技术研发的各种高压输电线路故障分类器已经有了不少的研究,在基于模糊理论输电线路故障类型的识别方法中,将故障类型识别中的大量电气信息量进行模糊处理,从而在一定的程度上改进了线性划分方法中存在的局限性。支持向量机(Support Vector Machine)是基于统计学习理论的基础上提出的一种模式识别方法。它采用结构风险最小化原理(Structural Risk Minimization)简称SRM原则,兼顾训练误差和泛化能力,在解决非线性、小样本等的模式识别问题中展现出一定的优势。文献[7]用模糊逻辑规则对输电线路故障先进行了分层归类的处理,然后再利用它们之间的故障相别与相位角等的关系,设计出表示不同故障相别的样本数,最后利用SVM算法对样本数据进行训练,得到可以识别出不同输电线路故障类型的最优分类面。文献[8]是对发生短路后的三相短路电流信号进行分析计算,计算出每相的小波熵权,然后对故障类型进行识别。因此基于支持向量机的输电线路故障类型得识别方法,可以充分利用SVM在解决模式识别问题中的优势,并且故障类型的识别不会受到系统的运行方式、故障的过渡电阻、故障位置的影响,具有极高的可靠性。所以基于智能理论的故障识别方法,能够有效地处理故障模式与不同的影响因素之间的非线性关系,达到较高的识别率。在神经网络方法中,由于其依靠于给定的输电线路的系统结构,用涵盖整个故障模式空间的典型模式对网络进行训练实现的,所以在一定程度上受到输电线路的系统结构的制约,限制了该方法的通用性。此外,神经网络的学习算法是采用的经验风险最小化(Empirical Risk Minimization-ERM)原理,它并没有使期望风险值达到最小,即在有限的小样本上得到的小误差并不能保证其在测试集上的小误差,而且会影响到对所有故障类型识别的准确性。文献[9]运用了模糊神经网络、征映射神经网络和概率神经网络来进行故障类型的识别,取得了比较理想的结果,但其算法都是针对双端电源

4

网络中的简单输电线路进行故障识别,在此简单网络上选取训练和测试样本,训练神经网络,然后用于测试该简单网络的故障类型,但神经网络方法在训练时结果也不太稳定。

综上所述,不管是那种方法,都存在着数据预处理方面步骤较多,一旦其中某一环节出错,则会对最后的分类带来很大的误差,而且前期数据处理过程多则意味着到最终分类的速度会变慢,这对输电线路发生故障后准确、迅速地识别故障类型是不利的。

本论文就是在这样的情况下,提出一种简单而有效的输电线路故障诊断分类的方法,即基于SVM的改进二叉树输电线路故障诊断分类的方法。在输电线路发生故障时,能够快速的诊断出线路的故障类型,从而对运行维护人员起到智能助手作用。

1.3 本文工作

1)广泛阅读了输电线路故障诊断与识别相关著作和文献,了解了线路故障识别的国内外研究现状,进行了分析研究,找出问题所在;

2)研究支持向量机在电力系统输电线路故障识别中的应用,分别从基本概念、支持向量机算法、算法选择等方面进行了阐述,以及结合输电线路的故障特点对支持向量机的算法进行了改进;

3)利用电力系统分析综合程序(PSASP)软件模拟仿真了7-BUS和36-BUS输电线路的所有类型的短路电流故障数据和短路电压故障数据,并且选取合适的归一化方法对故障数据进行了归一化处理;

4)对SVM算法中的二叉树算法进行改进,结合输电线路故障类型发生的优先级建立故障分类模型;

5)以MATLAB7.0为编程工具,利用仿真得到的一部分故障数据对模型进行训练,最后得到输电线路的短路电流故障分类器和短路电压故障分类器,再利用剩余的一部分故障数据对两个故障分类器进行测试与验证,并且在每个故障分类器中得出九个二分类SVM的判别函数的系数矩阵;

6)利用得到的九个判别函数的系数矩阵重新编写SVM故障分类器程序,且将改进的SVM故障分类器的分类结果与利用BP神经网路和其他SVM算法建立的故障分类器的分类结果进行比较分析;

7)最后将在MATLAB7.0环境下的故障分类程序文件转换为动态链接库文件类型,即DLL文件,从而使故障分类程序脱离MATLAB7.0环境,以供下级程序的调用。

5

2 支持向量机理论

支持向量机方法[8,9] (Support Vector Machine,简称SVM)是基于统计学习理论的机器学习方法,它是建立在基于统计学习理论上的 VC 维理论和结构风险最小化原理(Structural Risk Minimization简称SRM原则)基础上,到目前为止,对于支持向量机还没有一个确定的定义。其基本思想[10] 可以概括为:首先通过非线性变换将输入空间变换到一个线性高维空间,然后在这个新空间中求取最优线性分类面。SVM是由vapnik在20世纪70年代提出的并且在90年代逐步完善的针对小样本数据的机器学习理论,目前已经在许多的智能信息的获取与处理的领域都取得了较为成功的应用。vapnik提出的SVM算法是基于统计学学习理论的一种模式识别方式,这种算法不仅是在于训练样本上追求准确性,而且在训练样本的准确性的基础上还考虑了基于学习空间的复杂性,即在训练样本学习的精度和学习空间的复杂性之间采取了一种折中,从而使所训练得到的分类模型对于未知的测试样本具有较好的推广或泛化能力。传统的学习理论是基于经验风险最小化(ERM准则)原则,并且是以大量的训练样本进行训练,然后找到一个能够准确的逼近这些训练样本的函数,该函数能够对未知的测试样本做出良好的预测。并且当学习能力过强,即会产生过学习情况,而此时训练得到的函数模型的复杂性就会很高,函数把训练样本数据中的噪声也全部的作为实际中的训练样本数据进行学习,因此推广或泛化能力极差。vapnik则提出了基于结构风险最小化(SRM准则)原则的算法,在函数集的复杂性和样本的复杂性之间采取了一种折中,并且在理论上给出了其推广误差的界,其推广误差的界可分为两部分:经验风险和置信范围。经验风险[11]即为传统学习机在训练样本数据上的误差;置信范围的度量则是以vapnik等提出的VC维理论为参数进行的,这种参数度量了函数集的复杂性。一个良好的学习机器需要在这二者之间做出一定的权衡,继而达到总的推广误差最小,此即为结构风险最小化原则。

SVM具有直观的几何意义,对于线性可分[12,13]情况:在给定的训练样本如:

(x1,y1),(x2y2),?(xn,yn)中且y∈{+1,-1},在寻找一个超平面w*x-b=0将其能够正确的分开,这样的超平面将不止一个,且往往很多,但其中与两类样本点的距离中最大的分类超平面将只会有一个,其将会获得最佳的推广能力:即最优分离超平面。这种最优分类超平面仅仅只由离它最近的样本数据点来决定,而与其它样本数据点无关,这些样本数据点即是所谓的支持向量,这也正是支持向量机名称的来源。如图2.1所示,其中位于H1线上的样本数据点和位于H2线上的样本数据点即为支持向量,而其他样本数据点为非支持向量,在分类过程中这些非支持向量可以被完全剔除掉,并且对分类器的分类结果没有直接的影响。

6

图2.1 支持向量机

H1 H H2

2.1 统计学习理论概要

2.1.1机器学习问题的表示

依据某些给定的训练样本数据来求出对某一个系统的输入与输出之间的特殊关系,并使这种关系能够做出极为准确的预测对未知的输出,这就是机器学习[14,15]问题的目的所在。

由训练器、产生器和学习机器三部分组成样本数据学习的机器学习模型。 图2.2是一个从样本数据学习的模型示意图:

产生器G

x训练器S yy学习机器LM 图2.2 从样本数据学习的模型图

在图2.2中的训练器S可以对输入的每个向量x返回一个比较明确的输出值y,固定而却未知的条件分布函数F(yx)是其产生输出的依据据。样本数据产生器G是能够从同样确定而未知的概率分布函数F(x)中可以单独产生随机的向量x?Rn。

依据联合分布函数

F(x,y)?F(x)F(yx) (2.1) 取样得到的L个数据对

7

(x1,y1),(x2,y2),?(xl,yl) (2.2)

从而构成训练函数集。学习机器LM能在一组函数集f(x,a),a?? (其中?是参数集合)中选择出使输出值y能够最好的接近训练响应值y的函数f(x,a0)。

必须对于任意输入的值x给出输出值y在训练之后的学习机器上,从而使得期望风险R(a)值最小,其表示为:

R(a)??L(y,f(x,a))dF(x,y) (2.3)

L(y,f(x,a))为其给定的输入值x下训练器的输出值y与学习器所给出的函数

f(x,a)之间的损失的期望值。此处的f(x,a),a??称作为预测函数集或者称作为学习函数集,在函数集中a为广义参数。亦可将预测函数称作为学习机器、学习模型或者学习函数等。

有不同的损失函数在不同类型的学习问题中。在构成三种最基本的机器学习的问题中:即函数逼近问题、概率密度估计问题和模式识别问题,可以通过定义不同的损失函数。

在两类情况下y={0,1}(或者y{-l,1}),输出的y是类别标号,预测函数称作为指示函数,损失函数可以定义作:

?0,y?f(x,a)L(y,f(x,a))???1,y?f(x,a) (2.4)

损失函数通常可以定义为使风险最小,也就是在贝叶斯决策函数中所得到的错误率为最小,在函数逼近问题中,输出的y是连续的变量。

L(y,f(x,a))?(y?f(x,a))2 (2.5)

依据训练样本数据来确定x的概率密度是概率密度估计问题中学习的目的。如果估计密度函数为p(x,a),那么其损失函数可以表示作:

L(p(x,a))??logp(x,a) (2.6)

2.1.2.经验风险最小化原则

使其期望风险最小化是机器学习问题的学习目标。而传统的机器学习方法采用的是基于经验风险最小化原理[16,17,18] (Empirical Risk Minimization,ERM准则),即是依据大数定律思想在概率论中,前提是假设概率都是均匀分布的,则用样本数据来定义的经验风险最小化为:

8

Remp(a)??L(y,f(x,a))iii?1nn (2.7)

来作为对式(2.3)的估算。

实际上用经验风险最小化原理来替代EMP是没有经过一些充分的理论的论证,而只是从直观上进行的合理的推算。但却在样本有限的情况下仍然有较好的识别效果,在没有经过理论保证的样本无穷大条件下所得到的学习机器。另外,大数定律只是一种说明在概率论中,在某些情况下,当样本数据趋于无穷大时,Remp(a)在概率意义上将会趋近于R(a),并且不能保证Remp(a)和R(a) 将会取得最小值在同一个点上。

2.1.3.结构风险最小化原理

在机器学习的过程中,对经验风险最小化原理以及其推广能力的相对分析的结论中得出,如果要得到良好的实际风险[19,20],依次可对未来样本产生较好的预测性,不仅要使其经验风险达到最小,而且还要使其VC维也要尽可能的小,从而来缩小置信范围。

事实上,经验风险最小化原理在当样本数据有限时是不合理的。在一些传统的学习方法当中,存在一些理论上的指导,普遍的做法都是根据经验和先验知识,采取人为的方法一次次的修改其算法和学习模型,从而来调整其置信范围,这种人为的方法一般比较适合于离线性训练在现有样本数据的情况下。如果当样本改变并且当样本数据更新了以后,继而出现所选择的模型将会出现了很大的偏差的问题,从而需要进一步的修改,于是就出现了一些自适应算法与其他算法等的修正算法,虽然出现了很多的算法但却从根本上没有解决问题。

如果存在一个比较复杂的,其置信范围较大的机器,即便是把经验风险最小化到零,其错误数目仍然有可能比较大在测试集上,这就是上文中所提到的过学习问题。所以为了防止出现过学习现象,就要构造一种在学习机器中VC维较小的方法,还要考虑的是如果函数集的VC维很小,则逼近真实的训练数据比较困难,这样就会出现了矛盾。随即又出现一个新的问题就是怎样能使这二者达到非常好的同一问题。

针对这两种矛盾,当构造学习机器的时候,可以采取两种不同的处理方法依据不同的侧重点:

1)首先制定一个确定复杂度的函数集合,并且实施经验风险最小化准则在此函数集合上。

在神经网络算法中,选择不同的网络算法结构依据需解决的问题和样本数据间

9

的具体情况。网络结构的容量随着结构算法模型的制定后亦为之确定,也就是明确了算法的置信范围,接着求出实际最小风险根据经验风险最小化准则。

2)确定一个经验误差最低底线,接着选择出VC维最小的函数集使其能够满足这个误差最低底线。

结构风险最小化原理的思路就是通过上述方法得到的。而支持向量机就是这种思路的具体实现,而且SVM只要清楚不同函数集的VC维的相对大小即可,不需要计算出VC维的具体大小的数值,

神经网路采取了保持置信范围恒定,并采取了使经验风险最小化的方法,支持向量机采取的是保持经验风险恒定不变或等于零,并采取了使置信范围最小化的策略。由此可以看出,支持向量机更侧重于对推广能力的良好获得。

对于SVM方法,在运用结构风险最小化准则时,为了使函数集VC维的大小方便比较,在文献[13]中提出了一种新的方法策略,即把函数集构造成一个函数的子集序列,并且让各个子集进行排列依据VC维的大小,这样置信范围就会在同一个子集中一样;并且寻找最小经验风险在每一个子集当中,一般其会随着子集复杂度的提高而随之减小。在子集当中选取经验风险最小Remp(a)与置信范围?(n/h)的之和最小的子集,将此作为期望风险最小化的模型。这种思想就是结构风险最小化原则(Structural Risk Minimization),简称SRM准则,其基本的思路[21,22]可以用下图2.3来表示:

风险

欠学习 过学习 真实风险界 置信范围 经验风险 h S1 S2 S3 图2.3 结构风险最小化示意图

10

从图2.3中可以看出结构风险最小化准则既是要选取合适的h,使经验风险和置信区间的和取得最小值。

有两个思路可以实现结构风险最小化准则:

1)求取最小经验风险值在每个子集当中,接着选取使置信范围和最小经验风险的和最小的子集。在对于子集数目不是很大的情况下,这种方法还可以行得通,但当子集数目趋向于无穷大情况时,这种方法就不可行了。

2)设计出函数集的某些模型使其在每个子集当中都能获得最小的经验风险,接着只需要采取适当的子集使置信范围达到最小,那么这个子集将使得置信范围和经验风险会同时达到最小。

支持向量机就是利用了第2个的思路实现了上述思想。

2.2 支持向量机

2.2.1SVM的理论基础

1)在传统的统计模式识别方法当中,只有在样本数据趋向于无穷大时,其识别性能才有理论上的保证。统计学习理论(STL)是研究在有限样本数据情况下的机器学习方法。支持向量机的理论基础就是基于统计学习理论;

2)传统的统计学习模式识别方法在进行学习时,是强调经验风险最小化准则。可是单一的经验风险最小化会产生“过学习问题”,导致其推广能力变得很差。推广能力也可以说是泛化能力[23,24,25],是学习机器(即预测函数,或称作学习函数、学习模型)对即将输出结果而进行正确的预测的能力,就是对未知测试样本数据进行预测时的精确度。“过学习问题”是在某些情况下,如果训练误差过小将反而会使其推广能力导致下降;

3)根据统计学习理论,由置信范围值和经验风险值两个部分组成学习机器的实际风险。而基于经验风险最小化准则的学习方法其推广能力会比较差是因为没有最小化置信范围值,而是只是注重了训练样本数据的经验风险最小误差;

4)而Vapnik所提出的支持向量机(Support Vector Machine--SVM)以置信范围值最小化作为其优化目标且以训练误差作为其优化问题的约束条件,即支持向量机是一种基于结构风险最小化准则的学习方法,从而使它的推广能力要明显的优于一些传统的机器学习方法;

5)由于SVM的解将是全局唯一的最优解,它的求解是最后转化为求解二次规划问题;

6)SVM可以使其推广运用到函数拟合等的其他机器学习问题当中,并在解决小样本情况、非线性情况及其高维模式识别问题中表现出了许多其独特的优势。

2.2.2 SVM方法的特点

11

(1)支持向量机的最终判别函数只是由少数的支持向量来确定的,计算的复杂性完全取决于其支持向量的数目,而不是样本数据空间的维数,因此,这在某种意义上避免了“维数灾难”问题。

(2)SVM的最终的结果将由少数的支持向量来决定,这不仅可以让我们“剔除”掉大量的冗余非支持向量样本、抓住关键样本数据,而且注定了此方法不仅是算法简单,而且是具有很好的“鲁棒”性,主要体现在:

1)增加和删除非支持向量样本数据对建立的模型没有直接的影响; 2)支持向量样本集具有一定的鲁棒性;

3)在一些相对成功的应用中,支持向量机方法对核函数参数的选取不敏感。

2.2.3 SVM基本原理

SVM是最新发展起来在统计学习理论的部分中,是Vapnik等人提出来的依据统计学学习理论中的结构风险最小化准则。Vapnik等在有限样本数据条件下机器学习当中的的部分根本性的问题进行了系统的理论研究,在支持向量机理论中取得了很好的解决,而且支持向量机还充分考虑到了其算法的推广性,因而统计学习理论和支持向量机被许多的人都认为是研究机器学习问题的一个框架。 2.2.3.1线性判别函数和判别面

线性判别函数(Discriminant Function)是指由x的各个分量的线性组合而成的函数。

g(x)?wTx?w0 (2.8)

对于两类问题情况的决策规则为: 如果g(x)>0,则判定x属于C1, 如果g(x)<0,则判定x属于C2,

如果g(x)=0,则可以将x任意分到某一类或者拒绝判定。如图2.4所示

图2.4 支持向量机分类原理图

下图2.5表示的是一个较简单的线性分类器,其具有d个输入单元,其中每个输入单元对应于一个输入向量在各维上的分量值。该图类似于神经网络中的一个神

12

经元。

g(x) output unit w0 wd w2 ….. ….. x1 x2 图2.5 SVM线性分类器

bias unit input units x0=l xd 其中方程g(x)定义了一个线性判定面,它把其中归类于C1中的点与归类于C2中的点分开来。

当g(x)是线性函数时,这个平面被称为“超平面”(hyperplane)。 但当x1和x2都在判定面上时即:

wTx1?w0?wTx2?w0 (2.9)

或者

wT(x1?x2)?0 (2.10)

这表示w和超平面上的任意向量正交,并且把w称作为超平面的法向量。其中:x1-x2表示超平面上的其中一个向量判别函数g(x)是一种代数度量,是其在特征空间中某点x到超平面距离。

总之:线性判别函数是利用一个超平面把特征空间分隔成不同的两个区域空间,其中由法向量w确定超平面的方向,其位置是由阈值w0来确定。判别函数g(x)与x点到超平面的代数距离(带正负号)是一种正比的关系。那么,如果x点在超平面的正侧时,则g(x)>0;如果x点在超平面的负侧时,则g(x)<0 。 2.2.3.2最优分类面

最优分类线(或最优分类面)就是要求分类线不但能将两类情况正确的分开(即训练错误率为0),而且使分类的间隔最大。将此推广到高维空间中时[26,27,28],最优分类线就变为最优分类面。距离最优分类超平面最近的向量称为支持向量。

13

最优超平面可以分为线性可分的和线性不可分的两种情况,而支持向量机方法在最初就是在线性可分的情况下提出来的。

为了不失普遍性地得出支持向量机中的最优分类超平面,在此我们讨论支持向量机的基本内容只是限定在二分类的范围内。我们所要获得的目标是将要确定一个判别函数,是由训练样本来确定此函数的,它可以完全的分开将两类训练样本数据,并且可以将未知的样本数据也能够正确的进行分类在训练后得到的分类器,即其具有良好的泛化性能或推广能力。

图2.6 最佳分类超平面

如上图2.6所示,如果要将两类样本数据分开,那么会存在有很多的线性分类器都可以将这两组数据正确的分开,可是却只有一条线性分类器可以使得两类点与他的距离(Margin)达到最大值,那么我们所要求的最佳分类超平面就是这个线性分类器。很显然,我们可以看出该分类超平面的边界与其它的亦可能正确分类的边界相比却具有更好的泛化能力或推广能力,这就是为什么SVM比其它分类方法优越的所在,即支持向量机不但寻求能够将样本数据能够正确的分开,而且还寻求一种最优的分类线或分类面。

从线性可分的情况下的最优分类面发展所得来的支持向量机, 其基本思想可用图2.7中的两维和两类样本数据的情况来加以说明的。在图中,方形点和圆形点代表这两类不同的样本数据点,H为分类线(当然亦是唯一的一条最优分类线),H1和H2是分别为过各类样本数据点中的离分类线(最优分类线)最近的样本数据点,并且是平行于分类线(最优分类线)的两条直线, 两条线之间的距离叫做分类间隔(margin)。如下图2.7所示:

14

H1 H H2 margin?2/w 图2.7 线性可分情况下的分类超平面

设线性可分情况下的样本数据集为(xi,yi),i?1,?,n,x?Rd,y?{?1,?1}。d维空间中的线性判别函数为:g(x)=wx+b,而分类面的方程为wx+b=0。首先我们可以对其进行归一化处理,使得所有样本数据都满足g(x)?1,那么这样分类间隔就将等于2/w。如果要求其分类间隔为最大,那么其实就是需要w值最小,而如果要求所得的分类面对所有样本能够正确的分类,那么就是要求要满足:

yi?wxi?b??1?0,i?1,?,n, (2.11)

因此在满足上式公式中的且使w值最小的分类面就是我们所要求取的最优分类面。在这两类样本数据点中距离最优分类面最近的数据点,且在H1和H2两类线上的训练样本数据点,就是使公式等号成立的那些样本数据点我们就称作为支持向量。

求取最优分类面问题可以转化为如下式(2.12)的约束优化问题:

minisesubjecttol12w?C??i2i?1yi?wxi?b??1??i?0 (2.12)

i?1,2,?,l公式(2.12)是一个二次凸规划的问题,由于其目标函数和约束条件都是凸的,依据最优化的理论,那么这一问题将会存在唯一的全局最小解。应用Lagrange乘子法且满足KKT条件(Karush-kuhn-Tucher):

12lL(w,b,a)?w??ai(yi((w?xi)?b)?1) (2.13)

2i?1这里的ai?0是拉格朗日乘子。

15

应用拉格朗日乘子法对其求极值,对其相应的w和b求偏导数,则可找到相应的对偶形式:

l??L(w,b,a)?w??yiaixi?0???wi?1 (2.14) ??L(w,b,a)l???yiai?0??wi?1?将得到的关系式:

w??yiaixi (2.15)

i?1l ?yiai?0 (2.16)

i?1l 代入到原始的拉格朗日函数中,可得到:

1L(w,b,a)?w 22??ai(yi((w?xi)?b)?1)i?1l

ll1l??yiyjaiaj(xi?xj)??yiyjaiaj(xi?xj)??ai (2.17) 2i,j?1i,j?1i?11l??ai??yiyjaiaj(xi?xj)

2i,j?1i?1在这里考虑Karush-Kuhn-Tucker互补条件,条件要求最优解ai*,(w*,b*) 必须满足:

lai*[yi(w?xi?b*)?1]?0,i?1,2,?,l (2.18)

这表明仅仅是函数间隔为1的输入点xi,也即最靠近超平面的点所对应的ai*为零,所有其它的点所对应的参数ai*为零。因此当要转换表达式到权重向量中时,只包括哪些最靠近于超平面的样本点在内,这也就是为什么要将这些样本数据点称作为支持向量的原因(支持向量机的由来也缘于此)。支持向量机决策的依据就是从训练样本数据中得到最后的支持向量,从而求取最优分类超平面的决策函数。

最后可得到解上述问题的最优分类函数为:

f(x)?sgn{w?x?b}?sgn{?ai*yi(xi?x)?b*} (2.19)

**i?1k16

上式(2.19)中a*与b*是确定最后最优分类超平面的参数,(xi?x)为其两个向量的点积。由上式可知:非支持向量所对应的ai都全部为零,所以求和只是对于少数支持向量而进行。

在线性不可分的情况下,可以在条件

yi[wxi?b]?1?0 (2.20)

中增加一个松弛项?i?0使其成为

yi[wxi?b]?1??i?0 (2.21)

将目标改为求

n12w?C(??i) (2.22) 2i?1使公式(2.22)最小,即折中考虑最小错分样本数和最大分类间隔,由此就可以得到广义的最优分类面。其中,C>0是一个常数,它是控制对错分样本数据的惩罚程度。

2.2.4支持向量机

上节所得到的最优分类函数为:

f(x)?sgn{w?x?b}?sgn{?ai*yi(xi?x)?b*} (2.23)

**i?1k该式只是包含有需待分类样本数据点和训练样本数据点中的支持向量的内积运算,由此可见如要解决一个特征空间中的最优线性分类问题时,我们只是需要知道在这个特征空间中的内积运算便可。

对于在非线性问题中,我们可以进行将非线性变换转化为在某个高维空间中的线性问题来解决,在变换空间求取最优分类面。但是这种变换相对是比较复杂的,所以在一般情况下是不容易实现这种思路的。

依据泛函的相关理论基础,只要存在一种核函数K(Xi,Yj)在满足Mercer条件时,它就会对应于某一变换空间中的内积。因此若要实现某一非线性变换后的线性分类时,只要在最优分类面中采取适当的内积核函数K(Xi,Yj)即可,而其计算的复杂度也不会增加的。相对应的分类函数也变为了:

f(x)?sgn{?ai*yiK(xi?x)?b*} (2.24)

i?1k17

这就是支持向量机。

x1x2 K(x1,x)xa1y1 由图2.8中可以看出,SVM所求得的决策函数在形式上与一个神经网络比较类似,其输出是由若干个中间层的节点依据线性而组合的,而在其中的每一个中间层的节点对应输入样本数据点与一个支持向量的内积运算,因此它也被称作为支持向量网络。

2.2.5 SVM核函数

采用不同的核函数k(x,xi)可以构造出实现输入空间中不同类型的非线性决策面的学习机,从而形成不同的SVM算法。在解决实际问题当中,通常是直接给出核函数[29,30]。常用的核函数有

1)线性核函数(linear kernel)

得到的是线性分类器

2)多项式核函数(polynomial kernel)

其中s,c,d为参数。线性核函数可以看做是多项式核函数的一种特殊情况。得到的是q阶多项式分类器

3)径向基核函数(radical basis function,rbf)

其中? 为参数,这种得到的是一种径向基函数分类器。 4)Sigmoid核函数(Sigmoid tanh)

xm K(xm,x) xamym图2.8 支持向量机网络示意图

k(x,xi)?(x?xi) (2.25)

k(x,xi)?(s(x?xi)?c)d (2.26)

k(x,xi)?exp{?x?xi2?2} (2.27)

k(x,xi)?tanh(s(x?xi)?c) (2.28)

18

K(x2,x) xa2y2

其中s和c为参数。这里支持向量机实现的就是包含有一个隐含层的多层感知器,隐含层的节点数是由算法本身自动确定的,而且其算法并不存在会困扰神经网络方法的局部极小点问题。

2.3 SVM多类分类方法

SVM最初是针对于二分类问题提出来的,但如何将二分类扩展到多类分类是SVM研究的一个非常重要的内容。利用二分类的SVM解决多类分类问题的方法大致有两种:一种方法是将多分类看作是二分类的组合,即基于SVM的二分类,用二分类来运用各种不同的方法组合成一个多类别的分类器,最终将多分类问题转化为二分类问题来解决;第二种方法是通过修改SVM的目标函数,从根本上解决支持向量机的多类别分类问题。由于后者所花的代价很高,因此只适合于解决小规模的问题,所以在解决多类别分类时通常多采用第一种方法。

假定多分类问题有k个类别S={1,2,3,?, k},训练样本为{xi,yi},i={1,2,3,?,I},其中yi∈S。有以下传统方法实现SVM的多类别分类。

2.3.1一对多SVM

“一对多”方法(one-against-rest method)针对不同的k类分类,需要构造k个SVM分类器,其中第一个SVM二分类将第一类别分开出来,第二个SVM二分类将第二类分开出来,依次类推则第m个分类器是将第m类与其余的类别分开,即将第m类重新标号为1,其它类重新标号为-1。完成整个分类过程则需要计算k个判别函数,这个方法的不足之处在于在改变其中的一类类别的不同识别顺序后容易使其类别的样本被归于其他的类别中去,降低分类的准确率,而且训练样本数据过大,训练困难,耗时多,所以其推广性较差。

2.3.2一对一SVM

“一对一”方法(one-against-one method)是从众多的样本中任意分别选取2个不同的类别构成一个单独的SVM子分类器,这样经过排列组合后将共有k(k-1)/2个SVM子分类器。在构成识别类别i和识别类别j的SVM分类器时,在样本数据集中选取属于类别i和属于类别j的样本数据作为训练样本数据,并且将属于类别i的样本数据标记为正,将属于类别j的样本数据标记为负,其它的每个二分类SVM的做法与此相同进行。在进行测试时,将测试样本数据对k(k-1)/2个SVM子分类器都分别进行样本数据的测试,并且累计相加各类别测试结果的得分,最后选择得分最高者所对应的类别为需测试样本数据的类别。但此法的不足之处是如果单个SVM二分类器不规范化,则会导致整个N类分类器将会趋向于过学习状态,推广误差无界,分类器在数目K随需分类类别急剧增加时,将会导致在决策时速度很慢。

19

2.4 本章小结

本章首先介绍了统计学习理论的概念,指出统计学习理论是针对有限样本的机器学习理论,具有比较坚实的理论基础。然后介绍了SVM的理论基础、特点、基本原理及其核函数等内容,并且介绍了SVM的多类分类方法,说明了SVM基于统计学习理论中的结构风险最小化原则,在小样本数据情况下具有很好的推广性能和泛化能力,尤其适合于电力系统这种要求高稳定性、不易得到大量的故障样本数据的系统中。

20

3 输电线路的故障模拟

电力一般是从远离市区的火力或水力等发电厂通过架空输电线或者电缆送给用户或负荷端,中间又以变电站为中枢点对电压进行升压和降压处理,其中也联接着其它许多的输电线路系统。并且其电力的传输是包含有大地的电路,但是与电缆不同,输电线路是裸露在自然环境当中的,其随时可能会遭遇到雷击等的突发事故。特别是在远距离的高压和超高压的输电线路系统中,当发生各种类型故障的时候,可能会给用电用户或负荷端造成大面积的停电和造成各种事故的发生,将会给人民生活和工业生产带来非常大的不便[31,32]。因此,必须找到一种合适而有效的事故识别方法,能够快速的发现故障,进而判断出故障类型,为最后确定其故障位置进而采用合适的故障处理手段提供一种依据,能在最短的时间内能够快速的解决线路上所发生的故障,并且把由于故障所带来的损失能够尽量降低到最低点。

为了解决上述的这些问题,首先我们要必须要对电力系统的远距离输电线路的结构和特点,及其可能会发生故障的原因和类型都要有所了解,在了解了输电线路的所有这些实际的情况后,我们才能对症下药,找到一个合理而有效地针对这些突发事故的处理方法。

3.1 电力的传输方式

现代电力的传输方式主要有两种[33,34]:交流输电方式和直流输电方式。而在我国直流输电方式采用的相对较少,大多采用的都是交流输电方式。

3.1.1交流输电方式

交流输电方式是通过升压变压器和降压变压器对电压进行有效的升、降压,现在是广泛地应用于电力系统的电力传输中。

在交流输电方式中现有单相2线制、单相3线制、三相3线制、三相4线制四种方式,这些方式中其各有其自己的适用场合。一般的对于家用电器比如照明灯或空调系统等的具有小功能电器的用电设备,大多都采用单相2线制或者单相3线制方式,而对于电动机,汽轮机等大型负荷或者更大一些的负荷,则应用三相3线制或者三相4线制方式。但是其中三相3线制交流输电方式被广泛地运用在各种场合,它有以下几个优点:

1)其可以很方便的从三相交流电中得到单相交流电;

2)当具有相同的电压等级和功率时,在1条线路上所送出的功率将是单相2线制的1.15倍;

3)其是产生动力源的主要旋转磁场;

4)在相同的电压等级、损耗和距离等条件下时,其所需要电力线路的电线重量是单相2线制的3/4。

21

基于以上的优点,普遍应用三相3线制作为电力的输电方式。在高压输电线路方面的配电线路及动力用的低压线路等当中,都采用三相3线制的方式。在本论文中也是采用三相3线制的交流输电方式。

3.1.2直流输电方式

直流输电方式也是一种比较适合于电力的输送,但其电压的升降不容易实现,在我国也有部分地区采用这种方式,其特点有:

l)直流输电方式不存在无功功率,而且其损耗小;

2)在相同的有效电压情况下时,与交流输电方式相比直流输电方式的振幅小,有利于绝缘;

3)没有电容电流,而且不会产生介质损耗,更有利于电缆的送电; 4)在送电端与受电端之间不会象交流输电时存在的相位差,其稳定输电的容量不会受限制,而且输电的稳定性更高。

3.2 输电线路的故障类型、现象、原因及特点

3.2.1输电线路的故障类型

在电力系统的电力传输中,输电线路上常见的故障类型有短路、断路和接地等几种故障类型,而其中最为常见的和对电力系统的影响和危害最大的是各种短路故障类型[35,36,37]。

l)短路故障类型

输电线路中在其中不同电位的两个点被导体连接或短接起来,从而造成了输电线路的非正常运行的故障。

2)断路故障类型

输电线路断路故障是指输电线路中的某一个回路在非正常情况下断开,使电流不能够在回路当中继续流通的故障,称为断路故障。如断线、接触不良等。

3)接地故障类型

输电线路中的某点在非正常接地情况下所形成的故障,称为接地故障。接地故障类型有单相接地故障、两相接地故障和三相接地故障三种类型。对于在中性点直接接地系统中的单相接地情况,实质是构成了单相短路故障。对于在中性点不接地中的单相接地情况,将使三相对地电压发生较大的变化,进而会造成电气绝缘击穿故障等。比较典型的断线故障和接地故障如图3.1所示。

22

发电厂升压变压器输电线路降压变压器 负荷

(a) 断线故障

负荷 发电厂升压变压器输电线路 降压变压器

(b) 接地故障

图3.1 断线故障和接地故障

3.2.2输电线路的故障现象、原因及特点

3.2.2.1短路故障的现象及其原因

(1)短路故障的现象

短路是指电力系统在正常运行情况以外的所有一切相与相之间或者相与地之间的短接情况。其中在三相系统中,ABC三相同时一起短接的情况称为三相短路,由于三相各阻抗相同,三相都对称,所以又称作为对称短路。在电力系统中发生在同一位置的不对称短路有:单相接地短路、两相接地短路以及两相短路,当在发生此类各种短路的故障中,三相系统是处于不对称状态的[38]。

在电力系统运行中,各种短路故障所发生的几率都是不相同的,其中单相接地短路故障发生的几率最高,约占65%左右,两相接地短路故障发生的几率约占20%左右,两相短路故障约占10%左右,三相短路故障发生的几率最小约占5%左右。

(2)短路故障的原因

电力系统短路故障发生的原因很多,既有客观的,也有主观的,而且由于设备的结构和安装地点的不同,引发短路故障的原因也不相同。但是,根本原因是电气设备载流部分相与相之间或相与地之间的绝缘遭到破坏。例如,架空线路的绝缘子可能由于受到雷击过电压而发生闪络,或者由于绝缘子表面的污秽而在正常工作电压下放电。再如发电机、变压器、电缆等设备中载流部分的绝缘材料在运行中损坏。有时因鸟兽跨接在裸露的载流部分,或者因为大风或在导线上浮冰,引发架空线路杆塔倒塌而造成短路。此外,线路检修后,在未拆地线的情况下运行人员就对线路送电而发生的误操作,也会引起短路故障。

总之,短路故障产生的根本原因则是在不同的电位导体之间的绝缘被击穿或者是相互的短接而形成的。

23

三相输电线路的短路故障通常是由如下原因造成的: l)线路受到外力的破坏;

2)杆塔倒塌造成的三相接地短路故障; 3)三相线路带地线合闸;

4)输电线路长时间的运行,造成其绝缘性能下降等原因。 两相短路故障的原因:

1)收到外力的作用,如导电物体搭在两根线上造成的两相短路;

2)线路的弧垂过大,当遇到刮大风时造成导线的摆动,从而导致两根导线相碰或者线路发生绞线形成的两相短路;

3)受到雷击导致两相短路等。 3.2.2.2断路故障的现象及原因

(l)断路故障的现象

断路故障是输电线路故障中最常见的故障类型,发生断路故障时较为基本的形式就是电路回路无电流,即回路不通。在一定的情况下,断路故障还有可能会引起过电压现象[39,40],而断路点所产生的电弧还有可能会引发火灾或爆炸事故等。

l)断路点电弧故障。输电线路的电路发生断线,特别是在线路上的那些似断非断或接触不良的位置点即那些有时通有时断开的断路点上,在断路点处断开的瞬间通常会产生电弧或者在断路点处产生高温,而这些有可能会导致一些重大的火灾,造成一定的经济损失。

2)三相电路中的断路故障。在输电线路的三相电路中如果发生了其中一相断路故障,则会出现使三相电路不对称和有可能会使电动机由于缺相运行而被损坏;在三相电路当中,如果零线发生了断路故障,那么其对负荷的影响将会很大。

(2)断路故障的原因

输电线路发生断路故障通常有以下的原因:

l)线路的导线连接头处可能存在接触不良或者已被烧断; 2)由于外力的作用从而导致了其中一相的断线; 3)在配电低压侧处,可能其中一相的保险丝被烧断; 4)线路中的其中一相导线因故而断开。 3.2.2.3线路接地故障原因

输电线路的接地故障通常有以下的原因:

1)输电线路的导线接头处由于氧化腐蚀等原因而脱落,从而导致了导线的断开而落地;

2)在输电线路附近存在的树枝等物体碰及线路的导线导致线路接地;

24

3)由于输电线路的电气元件长期运行而导致绝缘能力的下降,从而对附近物体的放电;

4)线路被外部原因或自然因素等破坏从而导致导线的断开而落地。 3.2.2.4 输电线路故障的特点

输电线路的短路有单相接地、两相接地、两相不接地短路和三相短路4种类型。而单相接地又可以分为A相对地短路(AG),B相对地短路(BG)和C相对地短路(CG);同样地,两相短路又分AB,BC,CA三种类型;两相接地又有ABG,BCG,CAG三种类型,因此,输电线路故障分类是一个多层多分类问题。

统计分析表明,电力系统中不同类型故障的发生概率是不相同的,其中单相接地短路最多,占到总故障的80%左右,两相短路次之,三相短路出现的概率最小;然而,不同故障的危害程度及其出现的概率刚好相反,三相短路的后果最为严重,单相接地短路的后果相对较轻。这就要求我们对不同类型的故障设置不同的分类优先级。

两相短路和两相短路接地的识别是常规方法的一个难点,通常是靠实测或分解电流中的零序分量,利用有无零序电流,判别是接地还是非接地故障,这样做的结果是增加了硬件投资或者计算步骤,实际上,短路相电流里就包含有零序电流的信息,如果能够不通过零序分量,而直接用短路相电流进行两相短路的识别,必将提高计算速度,为此,本设计中将考虑两相短路的直接识别问题。

3.3 本论文采用的输电线路模型及仿真网络图

3.3.1本论文采用的输电线路模型

本论文是针对一个较为典型的输电线路模型而进行设计的。下图3.2为该输电线路模型的结构图。本模型是采用的三相3线制的交流输电方式,供电的额定电压为500kV。 母 线 A 侧 #1 #2 线路段1 #n 母 线 B 侧 线路段2 图3.2 输电线路模型结构图

在图3.2中选取母线A侧到母线B侧的线路1段作为数据模拟段,并且从线路的0%到100%处随机选取几个模拟点,模拟单相接地故障、两相短路故障、两相短路接地故障和三相短路故障。并且模拟所有故障类型的短路电流故障数据和短路电压故障数据。最后将一部分样本数据作为训练数据,剩余样本数据作为测试数据,

25

以验证故障分类器的合理性和正确率。

3.3.2输电线路故障类型判别方法

在上几节中叙述了输电线路的基本结构和输电线路的各种故障类型等的基本信息后,本节描述本故障分类器进行故障识别的几个基本前提。

1)输电系统是线性电路;

2)在输电线路发生事故前的瞬间,系统是三相平衡的或者是基本平衡的; 3)所要识别的故障均为线路故障,不存在其他的输电设备故障形式。 基于以上3个前提,输电线路故障识别的推理将会变的条理有序。下面是输电线路上的故障数据信息与故障识别之间的的关系问题。

故障类型的判别:本论文故障分类器是通过仿真输电线路其中一条线路上的短路电压和短路电流的所有故障类型数据,而所仿真得到的故障数据包含了关于线路故障的全部信息,下面是他们之间的具体关系,而此关系亦是故障识别的准则所在。

(1)单相接地故障的确定

结合上几节中的输电线路模型内容,当在输电线路的某一相线路上中的某一点发生了单相接地故障时,其所产生的故障特征是该故障相的短路电流将会远远大于非故障相得正常电流数据,而且其对地电压数据将远远小于正常相的对地电压数据。则可判断出该相是否发生了单相接地故障。

(2)相间故障的确定

当发生了相间故障时所产生的特征是非故障相电流数据远远小于故障相的电流数据。因为非故障相电流是该相的对地电容电流,而故障相的电流则是发生相间故障时由电源提供的短路电流。则可判断出是哪两相发生了相间故障。

(3)三相接地故障的确定

当输电线路发生三相故障时,其所产生的故障特征是在故障点的同一侧的三相电压数据和电流数据为相同的数据,依据此原则,即可判断出是否发生了三相故障。

(4)断路故障的确定

当在输电线路上某一相的某一点发生了单相断路故障时,其所产生的故障特征是故障相的电流很小,几乎趋近于零,故障点两边的电压为额定供电电压。依据此原则,即可判断出是否发生了断路故障。

在本论文中因为断线故障数据在PSASP软件中无法仿真得到,故本论文中只考虑单相接地、两相短路、两相短路接地、三相短路故障一共十种故障类型的识别分类问题。

3.3.3利用PSASP实际仿真网络模型图

本论文采用的网络模型图是PSASP自带的7-BUS和36-BUS的算例。网络模型

26

图如下图3.3所示,其中输电线路母线电压均为500kV。

(a) 7-BUS网络图

(b) 36-BUS网络图 图3.3 系统仿真图

27

对图3.3所示的7-BUS和36-BUS网络的短路,分别在图(a)的B3和B4母线之间的500kV的线路以及图(b)的B22和B23母线之间的500kV的线路上模拟短路故障,利用PSASP软件计算和记录故障线路的故障点处的两端的短路电流和短路电压标么值。为了保证所设计的故障分类器在不同节点的系统中和同一系统中的不同位置发生短路时的故障分类器的应用通用性,在同一系统中分别改变线路参数,改变各发电机的出力和选用不同节点算例进行模拟短路测试,分别记录测试线路长度从0%到100%的随机不同的地方作为短路点分别记录不同点的短路电流和短路电压故障数据,并将其中的一部分数据作为训练样本数据,剩余的部分数据作为测试样本数据,以验证所得分类器的合理性和正确性。在分类器通用性方面,本论文选用7-BUS网络图的部分故障数据作为训练样本数据,再利用36-BUS网络图的所有故障数据作为测试样本数据,依次验证故障分类器的通用性。

3.4 仿真软件和程序语言介绍

3.4.1运行环境

本论文运行环境采用的是Windows XP开发平台。Microsoft Windows XP秉承了Windows2000的安全性和可靠性,并且集成了Windows2000的易用性,为各个行业的用户提供了一种简单有效而且强大的计算平台。是一个适合于多任务和环境的桌面操作系统。WindowsXP具有如下的特点。

1)稳定性更强; 2)安全性更强;

3)更好的应用程序恢复功能。

总之,windowsXP具有功能强大,使用和维护比较简便,系统更加稳定等优点。其不但提供了数据库、服务器和通信平台的光链集成,与当前绝大多数的网络协议相兼容,与客户机可以协同工作。并且它也支持网络并行软件PVM和MPI,具有更加强大的网络功能。

3.4.2 PSASP6.2仿真软件

电力系统分析综合程序(Power System Analysis Software Package)简称PSASP。由中国电力科学研究院设计开发的一套功能强大、使用方便的电力系统分析程序软件,它具有我国的自主知识产权,是资源共享、高度集成、使用方便和开放的大型电力系统分析软件包。

PSASP包括有固定模型库、电网基础数据库以及用户自定义模型库等部分,可以进行电力系统的输电、配电和供电系统的各种短路计算和分析。

PSASP的结构、功能及特点: (1)PSASP具有三层的体系结构

28

1)第一层是模型和公用数据的资源库;

2)第二层是基于第一层的资源库的应用程序包; 3)第三层是分析工具和最后的计算结果库。

(2)PSASP 各种计算的公用数据是由文本和图形两种数据输入编辑方式的电网基础数据库来支持的,其中包含有变压器、发电机、负荷、交流线、直流线等电网结构的一些基本元件。有文本和图形两种输入编辑方式,PSASP提供了各种用于计算和分析的基本数据支持,可以从中抽取计算基本的数据,直观方便,而且还提供了功能强大的用户自定义模型方法。

PSASP 提供了功能非常强大的用户自定义(UD)建模方法,为研究电力系统新设备、新装置的自行建模提供了很好的工具。近些年来在国内许多大学和科研单位都应用PSASP 的UD建模方法做出了大量的研究工作。

用户自定义建模方法是在可以不用了解程序内部结构和编程设计的条件下,用户可以按照自己所需计算和分析的要求,设计各种所需的电网模型,并且可以灵活模拟大量的系统元件、自动装置和控制功能。为PSASP扩充其功能,为用户开放提供了强有力的工具。

PSASP可使用户建立任何元件的模型(负荷、电源、各种控制保护装置元件等),作为各种计算的模型库,直观方便的文本和图形两种模型编辑方式调用简单,计算快速,基于公用资源的交直流电力系统分析程序包,有以下应用功能:潮流计算、网损分析、暂态稳定、电压稳定、短路电流、短路电压、静态安全分析、静态和动态等值、小干扰稳定、直接法暂态稳定、参数优化协调、最优潮流和无功优化、继电保护整定与仿真等。 PSASP的主要特点:

1)PSASP提供了实用的用户程序接口(UPI)环境,使的可以让PSASP模块联合用户程序模块共同运行,共同完成用户所需的计算任务;

2)交直流混合电力系统、固定模型库和用户自定义模型库支持、提供用户程序接口,实现与用户程序联合运行、文本和图形两种运行模式及多种形式的结果输出、开放友好的用户程序接口环境;

3)用户程序接口(UPI)为用户提供了进一步自由,进一步开放的环境进行联合编程;

4)利用Windows操作系统提供的动态连接库(DLL)支持,在计算精度和时间上可以使用户程序接口(UPI)方式与PSASP内部的固定模型方式达到同样的效果。

下图3.4和图3.5是PSASP仿真短路数据的部分截图

29

图3.4 短路计算信息

图3.5 填写故障信息与数据

30

3.4.3 MATLAB7.0工具箱程序语言

MATLAB程序语言是矩阵实验室(Matrix Laboratory)的简称,是美国MathWorks公司研制的商业数学软件,可用于算法开发、数据的分析、数据可视化以及数值计算的一种高级计算语言和交互式环境,主要包括MATLAB编程环境和Simulink仿真两大部分。MATLAB在数学方面的科技应用软件中,其数值计算可谓是首屈一指。MATLAB可以进行矩阵运算、实现算法、创建用户自己的界面、绘制函数和数据、连接其他编程语言的程序等,主要应用于图像处理、工程计算、信号检测、信号处理与通讯、控制设计、金融建模设计与分析等领域。

MATLAB程序语言有以下特点: 1)可运用于工程技术的计算;

2)其开发环境可对程序代码、文件和数据进行管理; 3)交互式工具可以按迭代的方式探查、设计及求解问题; 4)提供的各种工具可用于构建自定义的图形用户界面;

5)二维和三维的图形函数可用于可视化数据; 6)内核仅仅支持小写,不支持大写输入;

7)数学函数可运用于统计、线性代数、傅立叶分析、筛选、优化以及数值积分等;

8)各种函数可将基于MATLAB的算法与外部应用程序和语言(如 C、C++、Fortran、Java、COM 以及 Microsoft Excel)集成。 MATLAB相比与其他程序语言其优势:

1)友好的工作平台和编程环境; 2)简单易用的程序语言;

3)强大的科学计算机数据处理能力; 4)出色的图形处理功能; 5)应用广泛的模块集合工具箱; 6)实用的程序接口和发布平台; 7)应用软件开发(包括用户界面)。

3.5 本章小结

本章主要分析了电力系统的两种输电方式、输电线路的故障类型、故障现象、原因及其特点,给出了本论文所研究的输电线路的模型和实际要仿真的网络图,并对该模型进行了分析,介绍了PSASP软件和MATLAB软件。最后根据输电线路的故障数据的特点,总结了简单有效的输电线路故障判别方法。

31

4 SVM在输电线路中的具体应用

4.1 LS-SVM原理及LS-SVMMATLAB工具箱

从上世纪九十年代以来,在支持向量机的算法研究、设计和实现等方面已经取得了大量的成果。1)对SVM的最优化技术进行了改进或改造SVM的形式,对SVM的计算过程进行简化,例如线性SVM,最小二乘支持向量机[41,42,43](LS-SVM)等;2)为便于SVM处理大规模的问题,对SVM的计算速度进行了进一步的提高,例如序列最小化算法;3)利用SVM的结构风险最小化原理(SRM原则)、核函数思想等对传统的线性算法进行了改造,设计出其对应的核形式,例如核主成份分析等;4)依据结构风险最小化原理(SRM原则)和SVM的一些核心思想提出了的新的算法,例如广义支持向量机算法、v-SVM算法等。

由于支持向量机具有很好的泛化能力[44],并且在其训练时所得到的解是其全局最优解,因而SVM在许多模式识别领域得到了广泛的应用。但其在训练时是一个具有约束条件的二次规划问题,而且其约束数目等于样本容量,这就使得SVM在训练时将消耗大量的时间,特别是在当样本容量比较大的时候其训练时间有时会过长而被难以接受。为了解决这个问题,提高支持向量机的训练效率,suykcn等人改变了标准支持向量机的风险函数和约束条件,推导设计出了一种新的支持向量机算法:最小二乘支持向机(Least Squares Support Vector Machine,即LS-SVM算法)。LS-SVM在训练时只需要求解一个线性的方程组从而使SVM便于实现,并且在很大程度上提高了SVM的训练效率,因而其在非线性建模和模式识别等领域得到了进一步广泛的应用。图4.1为具体的LS-SVM的故障识别框图。

图4.1 LS-SVM的故障识别框图

32

最小二乘支持向量机LS-SVM(Least Square Support Vector Machines)是SVM的其中一种改进的算法,LS-SVM将SVM中的二次规划问题利用二次损失函数转化为求解线性方程组问题,在确保其计算精度的同时有效地降低了其计算的复杂性,有效地提高了其求解速度。

4.1.1 LS-SVM原理

最小二乘支持向量机(LS-SVM)是SVM的一种改进算法,它是将传统SVM中的不等式约束条件修改为等式约束[45,46,47],并且将误差平方和损失函数作为训练集的经验损失,将SVM中的二次规划问题转化为线性方程组求解,有效地提高了求解速度和计算的收敛精度。

1)两类LS-SVM分类器

在两类分类问题中,设有训练样本集Sv:{xi,yi),i?1,2,?,l其中xi?R’为模式向量,l为样本的容量,另yi?{?1,?1}为目标的类别标号,则将支持向量机中的优化问题的不等式约束条件改为等式约束,并将其经验风险函数改为二次函数,利用LS-SVM算法构造出二分类的SVM,LS-SVM选择了误差?i作为二次项,则其优化问题为:

1T1l2 minQ(?,?)????c??i (4.1)

22i?1上式(4.1)的等式约束条件为:

yi(?T??(xi)?b)?1??i,i?1,2,?,l (4.2)

通过上式(4.2)的对偶形式可求得其最优解,依据目标函数和约束条件可对对偶形式建立拉格朗日函数:

l1T1l2L(?,b,?,a)????c??i??ai(yi(?T??(xi)?b)?1??i) (4.3)

22i?1i?1上式(4.3)中α为拉格朗日乘子,根据库恩-塔克(Kuhn-Tucker)条件:

?L?L?L?L?0,?0,?0,?0 (4.4) ???b???a可得:

?0???i在上式(4.5)中,

(?)T??b??0???? (4.5) ?1?????cI??a??Y?33

???[?(xk)]T?(xi)?T?Y?[y1,y2,?,yi]?T??[1,1,?.1]?i??a?[a1,a2,?,ai] (4.6)

上式(4.6)为一线性方程组,可用最小二乘法求解出a和b的值,由此可得到分类决策的判别函数为:

y(x)?sign(?ai(?(x))T?(x)?b) (4.7)

上式(4.7)中SV为支持向量的集合。对每一个二分类的SVM训练后找出其对应的支持向量,建立最优分类面。

2)多类LS-SVM分类器

显然上述LS-SVM方法只能应用到两类模式的分类问题当中,却不能解决多类分类问题。当LS-SVM应用于解决多类分类问题时,假设在I类分类问题中,其训练样本数据Sv:{xi,yi),i?1,2,?,l,其中yi为l维的由-1和+1组成的l维向量,当xi为第j类别时,yi的第j个目标元素为-1,其余目标元素的皆为+1。为了下述方便,将训练样本数据存储到两个数据矩阵X和Y中,他们的第i行分别为xi和yi。根据SRM原则可得到式(4.8)所示的约束优化问题

[48,49]

SV:

1l1nlT2minQ(?i,bi,?k,i)???i?i?c???k,i (4.8)

2i?12k?1i?1而通过与两类SVM分类类似的变换,上式(4.8)的解由下式给出:

?0??y?i?(i)??bi??0????(i)?????C?1?I??a??I?y?Tii?1,2,?,l (4.9)

上式(4.9)中,y?i为Y的第i列,?(i)则由元素?(ji,)k?yi,jyi,kk(xj,xk)组成,a(i)是对应于y?i的Lagrange乘子向量,bi是对应于y?i的常数项。上式(4.9)的求解是求解上式(4.5)的问题。在求解出了a(i)和bi之后,则可以建立下述LS-SVM函数:

yj(x)??aijyijk(x,xi)?bj,i?1ni,j?1,2,?,l (4.10)

而测试向量x的所属类别则由最后所得的判别函数

y(x)?si(gyjn(x)),j?1,2,?,l输出组成的向量y决定。

4.1.2 LS-SVMlab工具箱

34

基于MATLAB的最小二乘支持向量机工具箱,包括回归、分类、时间序列预测和无监督的学习等内容。该工具箱的代码都是采用C语言程序进行编写的。LS-SVM工具箱根据不同的计算机系统可以运用在Windows版本和Linux版本,目前LS-SVM工具箱有3个版本,其中包括有基本的和高级的,另外一个是在C语言环境下运行的版本,每个不同的算法包含不同的函数。在LS-SVM工具箱[50]外有一个C程序的编译器,它会自动把Matlab程序编译成C程序,然后在C程序下进行计算,这样就大大提高了LS-SVM的运算效率。

MATLAB可以根据数据的多少和数据文件的格式不同,而采用对应的方法获取数据。1)用元素列表的方法直接输入数据;2)创建数据文件,通过Matlab提供的装载数据函数,从数据文件中提取数据,函数load适合从MAT文件、ARSICⅡ文件中读取数据,函数xlsread从.xls格式的文件中读取数据;函数csvread从.csv格式中读取数据。

为了加快分类模型的训练速度,对要训练的输入样本数据需要进行一定的预处理。MATLAB提供的数据预处理方式有归一化处理。

MATLAB中的归一化处理有三种方法: 1)premnmx、postmnmx、tramnmx; 2)restd、poststd、trastd; 3)自己编程。

4.2二叉树及改进的二叉树多类分类算法

4.2.1二叉树多分类算法

文献[51]中介绍了一种适合故障诊断的二叉树多类分类算法[51] (2PTMC),该方法是构造多个两类分类器并组合起来完成多类分类,且采用了一种“one against others” 的分类器构造策略,具有算法简单直观、重复训练样本少的优点。

S1 SVM1 S2 f 1(AG) SVM2 S3 SVM3 Sn SVM n f 2(BG) f3(CG) f k-1(CAG) fk(ABC)

图4.2 基于SVM的2PTMC多分类算法

35

图4.2 给出了2PTMC 的多分类算法。任意给定一个k类分类问题,学习样本为:(x1 ,y1),?,(xi ,yi), x j∈ j=1,2,?,l,y j∈{1,2,?,k},一个2PTM C结构是一个3元组〈F, SVM,SC〉。F={f1,?,fI,?,fk},是二叉树的终止节点集合,由待识别系统的k个可能故障模式集(包括正常状态)构成,在输电线路各种分类中,fi就是从A相接地短路到ABC三相短路的10种故障类型。SVM={SVM1,?,SVMi,?,SVMk-1},是由所设计的k-1个支持向量机组成的二叉树的全部非终止节点集合。对一个k类分类问题,需要构造k-1个SVM机。SC={SC1,?,SCi?,SCk},为属于k个故障状态类别的全部学习样本集合,其中SCi={(x1,yi),?,(xj,yi),?,(xl,yi)}表示第i类的样本组成,xj∈,yi∈{1,2,?,k}。?li?l构成全部学习样本。第i级支持向量SVM的训练样本S i按下述原则确定。

SCS1?全部样本??i?1?S?SC,i?1,2,?,k?1 (4.11)

??ij?1?i?1上式(4.11)中SC?表示不属于第1,2,?,i-1类的全体样本。可见随训练

j?1过程的进行,训练样本数逐渐减少。

4.2.2改进的二叉树算法及其分类模型

在上节中所叙述的基于SVM的2PTMC多类分类算法能够解决简单的多类分类问题,且只能按照“一对多”的方法解决多类分类问题[52,53],却不能解决大类里又有多个小类的问题。为解决上述多层多分类问题,这里采用“one against leavings”对二叉树算法进行改进,它的基本思想是在原二叉树法分出的n类的基础上,对已经分出的第1,2,?,n-1类,再用“one against leavings”规则,利用SVM进行二分类,重复上述过程直至最后到“one against another”,即每一个终止节点为不可再分的一小类为止,参见图4.3。

在分类的优先级方面,根据输电线路故障发生的优先级,可以将最常见的故障或者危害最严重的故障设置为较高的优先级,最先识别出它们。同样的原理,将剩余故障类型再按照出现的概率和危害性设置相应的分类优先级,这样的处理可以有效地加快常见故障和严重故障的分类速度。

36

SVM1

BG

BC BCG CA CAG CG SVM6 bc 单相接地 leavings SVM2 leavings SVM4 leavings AG SVM3 ABC SVM5 ab leavings SVM7 leavings AB ABG SVM8 SVM9 图4.3 基于SVM的改进二叉树输电线路故障分类器

从图4.3可以看出:依据高压输电线路的故障发生优先级,首先利用一个SVM将所有的单相接地故障作为一类先识别出来,在这一类中再利用两个SVM区分出三种单相接地故障,并且在编写程序时将此分类程序放在区分其他故障类别程序的前面,这样做就可以使常发生故障被优先识别,并且在程序中故障数据样本数的重复次数也会相应的减少,从而大大提高了运算速度。然后再用一个SVM将剩余的故障类型中的三相短路故障识别出来。最后所剩余的所有两相短路和两相短路接地故障放在最后识别,因为此类故障发生的较少,故可以最后识别。但在每种两相短路和两相短路接地中需要用一个SVM来识别,如图4.3中的用SVM6来识别AB短路和AB短路接地故障,用SVM8识别BC短路和BC短路接地故障,用SVM9识别CA短路和CA短路接地故障。

基于SVM的改进二叉树输电线路故障分类器模型结合输电线路的故障发生优先级后具有运算速度快、故障识别迅速 、样本重复数少等优点。

4.3 数据归一化算法选择及归一化程序

归一化就是要把需要处理的样本数据经过一定的处理后(通过某种算法)限制在所需要的一定范围内,一般为[0,1]或[-1,1]之间。归一化[54]的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。

37

首先归一化是为了以后所需样本数据处理的方便性,其次是为了保正加快程序运行时收敛性。

由于样本数据中存在着大量的“奇异样本数据”(所谓“奇异样本数据”是指相对于其他输入样本数据特别大或特别小的样本数据)。“奇异样本数据”的存在能引起网络训练时间的增加,并有可能引起网络的无法收敛问题,所以如果存在“奇异样本数据”的训练样本数据,在训练样本数据之前,先进行归一化处理,若不存在“奇异样本数据”,则不需要事先进行归一化处理。

归一化方法主要有如下几种 1)线性函数转换,表达式如下:

y=(x-Min(Value))/(Max(Value)-Min(Value)) (4.12)

说明:x、y分别为转换前、后的值,Max(Value)、Min(Value)分别为所有样本数据中的最大值和最小值。

2)对数函数转换,表达式如下:

x (4.13) y?log10说明:以10为底的对数函数转换。 3)反余切函数转换,表达式如下:

y=atan(x)*2/PI (4.14)

由于现场电力系统的网络结构不同,初始状态不同,运行参数不同,发生故障后所产生的故障短路电流和故障短路电压样本数据的数据大小也是大相径庭,因此,在正式的故障分类之前,要对故障短路电流和故障短路电压样本数据进行归一化处理,甚至是数据处理前所必须的。本论文在研究了多种归一化处理方法的分类效果后,最后选择了“线性函数转换表达式”的归一化处理方法,它的算法原理如公式(4.15)所示。

xi?xi?min(xi),i?1,2,?,n (4.15)

max(xi)?min(xi)公式(4.15)中xi即为实测的短路电流数值,归一化后的属性值xi?[0,1],对数据进行归一化处理后,故障样本数据间的特征差异亦有所改善,其权重值减小,从而减少了错分和误分,提高了故障分类器的正确率。

下面是在MATLAB7.0程序语言中编写的数据归一化的程序: X = input('Input X=') Xt = X

a = max(Xt) b = min(Xt)

[m,n] = size(Xt)

38

for i = 1:m for j = 1:n

y(i,j) = ( Xt(i,j)-b)./(a-b) end

end Y = y end end

4.4 短路电流分类器训练及测试结果比对

4.4.1故障数据仿真

对图3.3所示的7-BUS和36-BUS系统图分别在图(a)的B3和B4母线之间的500kV的线路以及图(b)的B22和B23母线之间的500kV的线路上模拟短路电流故障,利用PSASP软件计算和记录故障线路的故障点处的两端的短路电流标么值。最后测的原始故障电流部分数据如表4.1所示。

表4.1 故障电流原始数据 类型 AG BG CG AB BC CA ABG BCG CAG ABC 30.7472 7.2348 8.2893 38.5597 7.8914 30.9047 38.3359 7.897 35.1702 39.4085 8.2892 30.7472 7.2348 30.9047 38.5597 7.8913 35.1702 38.336 7.897 39.4085 故障数据 7.2348 8.2893 30.7472 7.8914 30.9047 38.5597 7.897 35.1702 38.3359 39.4085 14.6298 7.2118 8.3076 13.4371 7.8907 20.8581 16.3876 7.8922 19.7081 19.7156 8.3076 14.6298 7.2118 20.8581 13.4371 7.8907 19.7081 16.3876 7.8922 19.7156 7.2118 8.3076 14.6298 7.8907 20.8581 13.4371 7.8922 19.7081 16.3876 19.7156 从表4.1中可以看出当发生单相短路接地故障时,接地相的故障短路电流会比其他非接地相的电流大很多,两相短路故障和两相短路接地故障时的故障相电流会比另一非接地相的电流大很多,但是在两相短路接地故障的数据中会包含有零序电流的信息。所以本文中在识别两相短路故障和两相短路接地故障时用一个单独的SVM分类器来识别,这样就提高了识别的精度。

由于样本数据中存在“奇异样本数据”,所以对原始数据进行归一化处理,表4.2为故障电流归一化后的数据。

39

表4.2 故障电流归一化后的数据 类型 AG BG CG AB BC CA ABG BCG CAG ABC 1 0.000977 0.045782 1 0 0.750399 1 0.000158 0.896015 1 0.045778 1 0.000977 0.750399 1 0 0.896015 1 0.000158 1 故障数据 0.000977 0.045782 1 0 0.750399 1 0.000158 0.896012 1 1 0.315185 0 0.04656 0.180847 0 0.422818 0.279053 0 0.388123 0 0.04656 0.315185 0 0.422818 0.180847 0 0.388123 0.279052 0 0 0 0.04656 0.315185 0 0.422818 0.180847 0 0.388122 0.279053 0 原始数据归一化后的属性值xi?[0,1],对数据进行归一化处理后,数据间的特征差异有所改善,其权重值减小,从而减少错分和误分,提高分类器的正确率。

4.4.2训练分类器并得到判别函数系数矩阵

利用7-BUS网络所模拟的部分短路电流数据作为训练样本来训练分类器,其余样本数据和利用36-BUS网络所模拟的全部短路电流数据作为测试数据来验证分类器的分类正确率。

首先将所有故障类型的全部训练样本数据输入到二分类SVM1中,其中将单相接地故障数据作为一类,其他故障类型数据作为一类,这样就可以按照优先级先识别故障发生率最高的单相接地故障;在训练SVM2时,输入全部单相接地故障作为训练数据,其中将AG作为一类,BG和CG作为另外一类,这样就可以先把AG故障识别出来,即分类器SVM2识别故障AG;而BG和CG再用一个分类器SVM3,即在SVM3中,将BG作为一类,CG作为另一类,这样就用一个SVM把BG和CG都可以识别出来;同样地,在SVM4中输入除单相接地故障数据外的其他所有其他故障类型训练样本数据,且将ABC作为一类,其他故障类型作为一类,即训练SVM4识别故障ABC。两相短路和两相短路接地的识别是常规方法的一个难点,由于SVM是基于二分类的,对两类识别的精度很高,再者由于两相短路接地故障电流数据中包含有零序电流信息,所以在本论文中将每一种两相短路和两相短路故障运用一个单独的SVM来识别,如图4.3中的SVM6识别AB和ABG类型,SVM8识别BC和BCG类型,SVM9识别CA和CAG故障类型。以此

40

类推,就可得到可以区分十种故障类型的九个不同的分类器。每一个分类器对应一个分类判别函数,在最后利用所得到的判别函数重新编写分类器。

下面是部分SVM分类器的训练程序: clc; clear;

Xt = [ ]; % 输入测试样本数据 gam = 15; preprocess = 'preprocess';

kernel = 'lin_kernel'; % 核函数选用线性核函数 type = 'classification';

X = [ ]; % 输入训练样本数据

Y = [ ]; % 目标数(即训练样本的类别)

[alpha,b] = trainlssvm({X,Y,type,gam,[],kernel,preprocess}); [Yt, Zt] = simlssvm({X,Y,type,gam,[],kernel},{alpha,b},Xt); [w1, b1] = ridgeregress(X, Y, gam);

上面的分类程序是每一个单独的SVM分类器的单元分类程序,要实现图4.3的多分类效果,可以实行单元程序的嵌套,即在编写图4.3的多分类程序时在顺序结构上的每一个SVM位置上嵌套一个上述的程序即可。

将利用PSASP模拟7-BUS得到的部分短路电流故障样本数据输入到多分类器中进行分类器的训练,最后得到每一个二分类器SVM的判别函数的系数w和b,九个SVM的具体系数矩阵如下表4.3所示:

表4.3 短路电流故障所有SVM的判别函数系数矩阵 w1 -1.0032 w2 w3 w4 0.14278 0.43268 0.43268 b4 w5 0.33564 0.44392 0.54734 0.60475 -1.2037 b5 w6 1.4481 -3.409 w7 0.63345 w8 1.4481 -3.409 -3.5303 1.7082 b8 1.5027 w9 -3.409 0.15332 1.4481 1.7082 0.14604 -3.5303 b9 1.5027 0.71318 -0.01229 0.14278 -0.52025 0.15332 -1.0032 -0.31556 0.58354 -1.444 -1.444 -1.444 b1 2.433 1.0781 -0.5935 b2 0.01442 0.82905 b3 -1.0032 -0.45261 -0.51685 0.14278 -0.81378 0.15332 -0.02219 1.7082 b6 1.5027 0.87094 b7 -0.00314 -3.5303 -0.90569 0.14604 0.14604 0.033428 -0.58005 -0.83521 0.43268 -0.29419 -0.00072 -1.7491 -0.29492 上表4.3为最终所要得到的故障分类器的SVM判别函数的系数矩阵,当要重新编写分类程序时就可以直接利用这个矩阵结合故障模型的分类流程编写故障分类器分类程序,这样做可使程序中不再包含有故障训练样本数据,提高了分类程序的

41

简洁性和分类的快速性,并且,将分类程序做成动态链接文件后,根据需要只要改变这些系数矩阵就可以满足于不同的分类要求。

4.4.3分类器测试结果比对

在Matlab7.0环境下编程实现了改进二叉树输电线路故障分类算法,将模拟7-BUS的剩余部分短路电流样本数据和全部的36-BUS短路电流样本数据输入到改进二叉树输电线路故障分类器中进行测试,为了便于比较,对所测试样本数据,同时进行了SVM多类分类算法、神经网络的BP算法和2PTMC多分类算法的效果,下面是部分ANN分类器程序和SVM多分类器程序。 ANN部分程序:

clc; clear;

P=[ ]; % 输入训练样本数据

T=[ ]; % 目标数据(即训练样本类别) P=P'; % 训练样本矩阵转置 T=T';

net=newff(minmax(P),[13,1], {'tansig','purelin'}, 'trainlm'); net.trainParam.epochs=500; net.trainParam.goal=0.001; net=train(net,P,T); LP.lr=0.1; Y=sim(net,P);

P_test=[ ]; % 输入测试样本数据 P_test=P_test'; % 测试样本矩阵转置 Y=sim(net,P_test) SVM多分类程序:

clc; clear;

X=[ ]; % 输入训练样本数据 Y=[ ]; % 目标数据(即训练样本类别) Xtest=[ ]; % 输入测试样本数据 gam=10; sig2=2;

[Ycode,codebook,old_codebook]=code(Y,'code_MOC');

42

[alpha,b]=trainlssvm({X,Ycode,'classifier',gam,sig2}); Yh=simlssvm({X,Ycode,'classifier',gam,sig2},{alpha,b},Xtest); Yhc=code(Yh,old_codebook,[],codebook,'codedist_hamming') 测试结果比对如表4.4所示。

表4.4 不同的多分类方法测试结果比对 采用方法 SVM多类分类 2PTMC多分类算法 ANN的BP算法多类分类 改进SVM二叉树多分类算法 样本数 50 50 50 50 错分数 20 5 11 2 正确率(%) 60 90 78 96 由表4.4中可以看出:利用SVM多类分类训练的分类器的正确率为60%;2PTMC多分类算法的正确率为90%;神经网络的BP算法多类分类器的正确率为78%;而利用本文提出的改进SVM二叉树多分类算法的输电线路故障分类器,其分类正确率达到了96%,正确率最高,效果最好。

由于SVM多类分类模型要平衡所有的故障数据类型,当要所分的故障类型越多,其分类结果亦将会越差;2PTMC多分类算法模型采用了“one against all”方法,在做多类分类时淡化了两相短路和两相短路接地故障这两类故障的差别,从而造成测试时正确率的下降。神经网络的BP算法多类分类器也对两相短路和两相短路接地的分类效果差些,并且由于ANN算法在训练和测过程中有时不是很稳定,每次测试时都会得出不同的结果,所以分类效果亦差些;而改进SVM二叉树多分类算法模型直接将两相短路分为“one against another”两类,彰显了两相接地和不接地短路的差别,从而明显提高了此类故障的分类正确率。

4.5 短路电压分类器训练及测试结果比对

4.5.1故障数据仿真

上一节中是根据故障短路电流数据对改进二叉树输电线路故障分类器进行训练和验证,本节则利用故障短路电压数据对分类器进行训练和验证,以论证本分类器对不同类型数据的适应性。

同理,对图3.3所示的7-BUS和36-BUS系统图分别在图(a)的B3和B4母线之间的500kV的线路以及图(b)的B22和B23母线之间的500kV的线路上模拟短路电压故障,利用PSASP软件计算和记录故障线路的故障点处的两端的短路电压标么值。最后测的原始故障电压部分数据如表4.5所示。

43

本文来源:https://www.bwwdw.com/article/eb25.html

Top