SDH告警、性能产生原理资料

更新时间:2023-03-08 05:05:28 阅读量: 高中教育 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

目录

第一章告警、性能产生原理 .......................................................................................................... 2

1.1 综述 .....................................................................................................................................2 1.2 高阶部分信号流中告警、性能的产生和检测 ........................................................................2

1.2.1 下行信号流.................................................................................................................3 1.2.2 上行信号流程 .............................................................................................................6 1.3 低阶部分业务信号流及告警、性能信号的产生 ....................................................................7

1.3.1 下行信号流程 .............................................................................................................8 1.3.2 上行信号流程(从PDH电接口至交叉板) ............................................................ 10 1.3.3 34M/140M电接口告警信号和2M电接口告警信号的区别 ...................................... 10 1.4 告警信号间的抑制关系 ..................................................................................................... 11 1.5 根据信号流定位故障的应用 .............................................................................................. 12

1.5.1 误码问题 ................................................................................................................. 12 1.5.2 告警问题 ................................................................................................................. 14 1.5.3 小结 ........................................................................................................................ 15

i

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

第一章告警、性能产生原理

1.1 综述

在SDH的帧结构中有着丰富的开销字节,包括再生段开销、复用段开销、通道开销。正是借助于这些开销字节传递的告警、性能信息,使得SDH系统具有很强的在线告警和误码监测能力。通过对这些告警信息的产生方式和检测方式的了解,可以做到对故障的快速定位。

为了便于对主要告警和性能产生的位置以及产生方式的说明,不妨沿着信号流对这些主要告警和性能作一一描述。在这里,根据信号流的流向,将之分为下行信号流和上行信号流。

所谓下行信号流,是指信号流向为SDH接口→交叉板→PDH接口这条路由。与此相反,上行信号流则是指信号流向为PDH接口→交叉板→SDH接口这条路由。

另外,由于在该信号流程中,交叉板不处理任何开销字节。为了表述具有层次性,我们以它为界线,将信号流分为高阶部分(SDH接口←→交叉板)和低阶部分(交叉板←→PDH接口)加以说明。 两种通用告警

AIS告警(全“1”告警),对下一级电路插全“1”,告知该信号不可用。常见的AIS告警有MS-AIS、AU-AIS、TU-AIS、E1-AIS等。

RDI告警(远端接收缺陷指示),指示对端站检测到LOS(信号丢失)、AIS、TIM(追踪识别符失配)等告警后,而传给本站的回告。常见的告警有MS-RDI、HP-RDI、LP-RDI等。

注意:

有一个错误观点需要纠正,那就是并不是某站有告警就说明该站有问题,只能说明该站检测到了告警。而引起该告警产生的原因可能来自于对端站或其它原因。如实际中光纤断裂引起的R-LOS、对端站交叉板坏引起本站HP-LOM(高阶通道复帧丢失)告警等。

1.2 高阶部分信号流中告警、性能的产生和检测

根据故障定位中“先线路,后支路;先高级,后低级”的原则,SDH接口与交叉单元间产生的告警、性能信息是我们在维护过程中应首先关心的焦点,因为通常情况下,正是这段高阶部分产生的告警、性能数据引起了低阶告警、性能数据的上报。 这段路由中信号流如图1-1所示。

2018-11-25

华为机密,未经许可不得扩散 第2页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

帧同步器和再生段开销处理器(RST) STM-N 光 接 口A1, A2 LOSLOF “1”复用段开销处理器(MST)AISMS-AIS “1”指针处理器和高阶通道开销处理器(MSA、HPT)AISAU-AISAU-LOPHP-TIMK2B2B2-Err.MS-REIMS-RDIH1,H2H1,H2 B1BI Err.J1HP-UNEQC2C2B3G1G1HP-SLM “1”M1k2交叉板H4HP-LOMB3 Err.HP-REIHP-RDI下行信号流程信号传递点(下插全“1”信号)告警上报或回告告警终结点(上报主控)

图1-1 SDH接口与交叉单元间告警信号产生流程图 ? 说明:

我们常根据各开销字节在STM-1帧结构中的处理位置,将其分为三个大的模块:再生段开销、复用段开销、高阶通道指针和开销。其中前两个模块出问题,通常会影响所有的高阶通道,而最后一个模块中的开销字节出问题则只是针对某一个高阶通道。根据这一点,我们常常可以推断出问题的影响面,以及测试时如何对那些通道进行选用等。

以下,将采取分模块的方式对信号的流程和各开销字节处理进行表述。

1.2.1 下行信号流

1. 帧同步器和再生段开销处理器

这部分主要处理的与告警、性能相关的再生段开销有:帧定位字节(A1、A2)、再生段追踪识别符(J0)、误码校验字节(B1)。 告警信号流程如下:

1)从光路上来的STM-N光信号进入线路板的光接收模块后,首先经过光电转换(O/E转换)后,被恢复成电信号送往帧同步器和扰码器处理。在这过程中,光电转换模块(O/E模块)会对该信号进行检测,如果发现输入信号无光、光功率过低或光功率过高以及输入信号码型不匹配时会上报R-LOS(信号丢失)告警。

2018-11-25

华为机密,未经许可不得扩散

第3页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

? 提示:

无光情况一般在光纤中断、对端站发送光模块坏或本站接收光模块坏等情况下会发生;光功率过低的情况有光纤衰耗太大或光接头接触不良等;光功率过高是指接收光功率过载,这时应检查光衰耗器是否损坏或光板的发送距离是否合适等。码型不匹配通常发生在上、下游站间信号速率不一致或上游站时钟板会导致其发送数据紊乱等,这时需要检测上游站的光板是否匹配或时钟板、交叉板是否工作正常等。

R-LOS告警与开销字节无关,只是与输入的信号质量有关。

产生R-LOS告警后,系统只有在本站的接收光模块连续检测到2个正确的码型图案,并且同时没有检测到新的R-LOS告警产生时,SDH设备才会退出R-LOS状态而进入正常状态。

发生R-LOS告警时,系统会对下一级电路插入全“1”信号。

2)帧同步器接收到从光/电转换模块发来的STM-N信号后,根据该信号中的A1、A2字节来完成对帧定位信号的捕捉,同时从中提取线路参考同步定时源发送给时钟板进行时钟锁定。

正常情况下,A1值恒为F6,A2值恒为28,但如果检测到A1≠F6或A2≠28,将上报R-OOF告警(帧失步报警)。 如果R-OOF告警持续超过3ms,则上报帧丢失告警R-LOF并下插全\信号。在R-LOF状态下,若连续1ms以上又处于定帧状态,那么设备又回到正常状态。

J0字节用于确认再生段两端处于连续的连接状态,要求收发两端的J0字节完全匹配,如果不匹配,则会上告J0-MM追踪识别符失配告警。

扰码器主要完成STM-N信号中除A1、A2和J0字节以外其它字节的解扰。 3)再生段开销处理器提取STM-N信号中的其它再生段开销字节进行处理。其中最重要的为B1字节。

如果从STM-N信号中恢复出的B1字节和接收到的前一个STM-N 帧中的BIP-8计算结果不一致,则上报B1误码。如果B1误码超过门限10-,就产生B1-OVER告警。

当连续出现10个再生段严重误码秒SES(一秒内误码块达到30%)后,则认为发生 RSUATEVENT(再生段不可用时间事件)。

与此同时,在该部分会将F1、D1-D3和E1这些与告警性能无关的字节送往主控模块和开销模块。

3

2018-11-25

华为机密,未经许可不得扩散 第4页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

2. 复用段开销处理器

这部分主要处理的与告警、性能相关的再生段开销字节有:自动保护倒换通路字节(K1、K2)、复用段误码监视字节(B2)。信号流程如下: 1)复用段开销处理器提取STM-N信号中的复用段开销字节进行处理并完成SF和SD检测,将D4-D12、S1和E2送往主控单元和开销单元,同时利用K1、K2字节和主控单元、交叉单元共同实现共享复用段保护(MSP)功能。 如果检测到K2(b6-b8)=111,则上报MS-AIS告警并下插全\信号。如果检测到K2(b6-b8)=110,则上报MS-RDI告警。

2)如果从STM-N信号中恢复出的B2字节和前一个STM-N帧(除再生段

开销外的所有比特)的BIP-24计算结果不一致,则上报B2 误码。

同时根据M1字节(复用段远端误块指示)判断是否上报MS-REI告警,MS-REI传递的是由B2字节检出的错误间插比特块数目。

如果B2误码超过门限10-,则会产生B2SD告警。如果B2误码超过门限10,就有B2-OVER告警产生。在复用段保护情况下,B2SD和B2-OVER告警会引发复用段保护倒换。

当B2连续10秒检测到复用段严重误码秒SES(一秒内误码块达到30%),则认为发生 MSUATEVENT(复用段不可用时间事件)。 3. 指针处理器和高阶通道开销处理器

这部分主要处理的是高阶指针调整和高阶通道开销,与指针调整有关的字节是H1、H2、H3,而与告警、误码相关的字节有高阶通道追踪字节(J1)、信号标记字节(C2)、高阶通道误码监视字节(B3)、通道状态字节(G1)、复帧位置指示字节(H4)。 其信号告警流程如下:

1)指针处理器根据每一路AU-4的H1、H2字节进行指针解释和指针调整,完成频率和相位校准以及容纳网络中的相位抖动和漂移的功能,同时定位每一路VC-4并送到相应高阶通道开销处理器。如果检测到AU指针H1和H2字节全为“1”,则上报AU-AIS (管理单元-告警指示信号)告警并下插全\信号。如果H1和H2字节代表的指针值非法(不在正常范围0~782内),连续8帧收到非法指针,则上报AU-LOP(管理单元-指针丢失)告警并下插全\信号。

如果发生AU指针正调整,则MSA的PJCHIGH计数增加1;如果发生AU指针负调整,则MSA的PJCLOW计数增加1。

2)高阶通道开销处理器对接收的N路VC-4中的HPOH(高阶通道开销)字节进行处理。对其中各字节处理方式如下:

2018-11-25

华为机密,未经许可不得扩散

第5页, 共15页

6

-3

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

如果检测到J1字节和预定值不同,则上报HP-TIM告警并下插全\信号。 如果检测到字节C2=00 ,则上报HP-UNEQ(高阶通道未装载)告警并下插全\信号。如果检测到C2字节和预定值不同,则上报HP-SLM(高阶通道信号标记失配)告警并下插全\信号。

目前我国使用的净负荷结构为TUG结构,对应其结构的C2预定值为02。 如果从HPOH恢复出的B3字节的计算结果和前一帧VC-4信号的BIP-8计算结果不一致,则上报B3误码。

在OptiX STM-N(N<=4)低阶SDH接口板中,从VC-4中提取TU-12信号需要H4字节指示当前的TU-12是当前复帧的第几帧。如果检测到H4字节非法,则上报HP-LOM(高阶通道复帧丢失)告警,并下插全\信号和正常的H4字节。

如果检测到字节G1(bit5)=1,则上报HP-RDI告警,根据字节G1(bit1-bit4)的取值是否为1-8,判断是否上报HP-REI告警,若是,则上报。

当B3连续10秒检测到严重误码秒SES(一秒内误码块达到30%),则认为发生了HVCUATEVENT(高阶虚容器不可用时间事件)。 其它开销字节F3、K3、N1保留使用。

3)最后,经过上述处理后的N路STM-1净负荷送往交叉板进行高阶通道和低阶通道的交叉连接。

1.2.2 上行信号流程

如果说在高阶部分下行信号流中主要完成开销字节的提取和终结的话,那么我们可以认为在该部分的上行信号流中,主要完成的工作则是开销字节初始值的生成和向对端站回传告警信号。 1. 指针处理器和高阶通道开销处理器

1)从交叉板来的N路STM-1净负荷信号首先送往高阶通道开销处理器。 2)高阶通道开销处理器产生N路高阶通道开销字节,同N路净负荷一起送往指针处理器。沿上行方向完成高阶通道开销字节的设置功能(包括J1、C2、B3、G1、F2、F3和N1)。

如果在下行信号流中检测到有AU-AIS、AU-LOP、HP-UNEQ或HP-LOM(HP-TIM和HP-SLM可选)告警,则将G1(bit5)设置为1,送出HP-RDI告警回告给远端。如果在下行信号中检测到有B3误码,并根据检测的误码值,将G1(bit1-bit4)置为相应的误码值(从1~8),送出HP-REI告警回告给

远端。

H4字节在上行方向不处理。

2018-11-25

华为机密,未经许可不得扩散

第6页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

3)指针处理器产生N路AU-4指针,将VC-4适配为AU-4,其中AU-4

指针由H1、H2字节表示,然后由复用处理器将N个AU-4复接成

STM-N信号送往复用段开销处理器。 2. 复用段开销处理器

复用段开销处理器对接收到的STM-N信号设置MSOH字节(包括K1、K2、D4-D12、S1、M1、E2和B2)。

如果在下行信号流中检测到有R-LOS、R-LOF 或MS-AIS告警,则设置K2(bit6-bi8)=110,送出MS-RDI告警回告给远端。

如果在下行信号流中检测到有B2误码,则利用M1字节送出MS-REI告警回告给远端。

3. 帧同步器和再生段开销处理器

1)再生段开销处理器完成再生段开销字节的设置(包括A1、A2、J0、E1、F1、D1-D3和B1),将完整的STM-N电信号送往帧同步器及扰码器。 2)帧同步器和扰码器将STM-N电信号进行扰码,然后由E/O模块将STM-N电信号转换为STM-N光信号送出光接口。

1.3 低阶部分业务信号流及告警、性能信号的产生

PDH业务主要包括1.5M、2M、34M、140M这几种速率的业务。不同速率的PDH业务间,由于所使用的通道开销字节不同,其告警信号的产生稍有不同。 下面先2M业务为例,说明PDH接口与交叉板间信号流的处理和告警的产生,其告警信号流示意图如图1-2所示。

2018-11-25

华为机密,未经许可不得扩散 第7页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

HPA 、LPTLP-SLM LPAE1-AIS全“1”PPIT-ALOSLP-UNEQV5 交LP-TIMJ2 叉板V1、V2TU-LOPTU-AISV1、V2H4HP-LOMLP-RDIV5E1-AISBIP-2V5E1接口LP-TFIFO全“1”V5LP-REIV5LP-RFIFO信号流程信号传递点(下插全“1”信号)告警上报或回告告警终结点(上报主控)

图1-2 2M PDH接口与交叉单元间告警信号产生流程图

在上图中,鉴于各部分对开销字节处理的不同特点,也将其划分为几个大的功能模块,它们依次为高阶通道适配(HPA)、低阶通道终端(LPT)、低阶通道适配(LPA)和异步物理接口。下面我们将以这些功能模块为索引对告警信号流作介绍。

1.3.1 下行信号流程

1. 高阶通道适配功能块(HPA)和低阶通道终端功能块(LPT)

这部分是低阶部分的重点,因为绝大多数的低阶开销字节都是在这里得到处理的,它们是低阶通道指针指示字节(V1、V2、V3)、V5字节、低阶通道识别符(J2)。

1)从交叉板来的VC-4信号送到HPA。

2)HPA把VC-4解映射成VC-12,每一个VC-12的指针都被解码,以便在VC-4和VC-12之间提供以字节为单位的帧偏信息。

在TU-12组装处的节点时钟与本地基准时钟不同时,这一过程就需要进行连续不断的指针调整。在下行信号流中就会检测到有TU指针正调整(LPPPJE)、

2018-11-25

华为机密,未经许可不得扩散

第8页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

TU指针负调整(LPNPJE)。 对于TU指针调整计数越限(门限可调),用一组告警

HPADCROSSTR

表示。 HPADCROSSTR

包括

HPADPJCHIGHCX15(TU指针正调整统计15分钟计数越限)、HPADPJCHIGHCX24(TU指针正调整统计24小时计数越限)、HPADPJCLOWCX15(TU指针负调整统计15分钟计数越限)、HPADPJCLOWCX24(TU指针负调整统计24小时计数越限)。 在下行方向,如果检测到H4复帧字节序列错,则上报HP-LOM。

如果检测到低阶指针字节V1、V2值为全“1”,则上报TU-AIS告警,如果检测到V1、V2值为不合法,则上报TU-LOP告警,发生这两个告警都会往下一功能块插入全“1”信号。

此外,如果接收到TU-AIS,除在向下的数据中插入AIS信号以外,同时需要回告LP-RDI,即将V5字节字节的b8比特置为“1”。 3)VC-12信号流送到LPT单元进行V5字节处理。 V5字节的时隙结构组成如图1-3所示:

V5字节b1b2b3b4b5b6b7b8BIP-2误码校验不一致:LPBBE1:LP-REI没用信号标记000:LP-UNEQ1:LP-RDI

图1-3 V5字节结构图

在下行信号流中检测V5字节的b5-b7比特,作为信号标记上报。如果为000,则表示低阶通道未装载LP-UNEQ,并往下一级电路插入AIS信号。如果信号标记失配,则上报LP-SLM,并往下一级电路插入AIS信号。 在V5字节的b8中通道RDI信息将被终结,并上报“远端告警指示”。 检测V5字节的误码监测比特位b1、b2,对VC-12计算BIP-2。对现行帧计算出来的BIP-2值将与下一帧中恢复出来的V5的b1、b2进行比较,不一致则上报LPBBE。同时,V5字节中的b3比特被恢复出来,如果为“1”,表示检测到远端有BIP-2差错,作为LPFEBBE上报。而V5字节b4比特没有使用。

当BIP-2 监测中发现连续出现10个严重误码秒SES后(一秒内误码块达到30%),则认为发生 LVCUATEVENT(低阶虚容器不可用时间事件)。 4)与此同时,还会将低阶通道识别符J2字节恢复出来,并检测收到的J2字节的值和预期收到的值是否相等,若不等,则上报低阶通道追踪识别符失配告警(LP-TIM)。

2018-11-25

华为机密,未经许可不得扩散 第9页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

2. 低阶通道适配功能块LPA和异步物理接口模块PPI

1)经过上述处理后的的C-12数据送到LPA,在这里,用户数据流和相关时钟参考信号一起从容器中恢复出来,并被送到PPI作为数据和定时参考。 2)经过LPA处理后的数据和时钟,送到PPI,形成传输2048kbit/s信号。

1.3.2 上行信号流程(从PDH电接口至交叉板)

1. 低阶通道适配功能块LPA和异步物理接口模块PPI

1)E1电信号进入PPI后,经过时钟提取和数据再生,送往映射和解映射处理器,同时进行抖动抑制。

PDH接口模块检测并终结T-ALOS告警。当检测到T-ALOS告警时,将往上一级电路插全“1”信号。

2)LPA完成对数据进行适配功能。

如果接收到E1-AIS,则上报E1-AIS告警。T-ALOS会导致E1-AIS告警,但有T-ALOS可抑制E1-AIS。

如果上行数据速率偏差过大,会造成低阶通道发送侧FIFO溢出,上报LP-TFIFO。

2. 高阶通道适配功能块(LPA)和低阶通道终端功能块(LPT) 1)LPT的功能为在C-12中插入POH,合成VC-12。

LPT将“信号标记”插入V5字节的b5-b7比特;对前一复帧数据计算BIP-2,并将结果置于本帧V5字节的b1、b2比特;如果在下行信号处理流程中检测到下行数据有“通道终端误码”,则V5字节的b3比特将在下一帧被置为“1”,产生回告LP-REI。

2)HPA将VC-12适配为TU-12再映射到高阶的VC-4,送往交叉板。VC-12与VC-4之间以字节为单位的帧偏移由一个TU-12指针指示。每帧决定一个V(V1、V2、V3、V4其中一个)字节,每4帧组成一个复帧,用来确定V字节值的H4字节也在这儿产生。

1.3.3 34M/140M电接口告警信号和2M电接口告警信号的区别

对于34M和140M等速率的PDH业务,其信号处理流程与2M业务基本相同。但也存在许多区别,如下几例:

2018-11-25

华为机密,未经许可不得扩散 第10页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

1. 同类型的告警,名称不同

1)在2M电接口板(如PD1)中,其PDH接口外部信号丢失告警为T-ALOS告警,但在34M电接口板(如PL3)中,则用P-LOS告警表示PDH接口外部信号丢失,而在140M电接口板(如PL4)中,该告警用EXT-LOS来表示。 2)在2M电接口板(如PD1)中,下行信号流中检测信号为全“1”会上报TU-AIS告警,而在 34M电接口板(如PL3)中,则上报 E3-AIS告警。而在140M电接口板(如PL4)用C4-RLAISD表示在下行方向检测到净荷为全“1”,而用C4-TLAISD表示在上行方向检测到净荷为全“1”。EXT-LOS告警会导致C4-TLAISD的产生。

2. 告警和性能监视所使用到的通道开销字节不同

在34M接口板和140M接口板中采用的通道开销字节为:B3、J1、C2和G1字节。其中B3字节作为误码监视用,使用偶校验的BIP-8码。其作用与V5字节的b1-b2相同。J1字节作用与J2字节相同。C2字节为信号标记字节,其作用与V5字节的b5-b7相同。G1字节用于产生告警回传,其结构图如图1-4所示。

G1字节b1b2b3b4b5b6b7b8LP-REI1: LP-RDI暂时未用

图1-4 G1字节结构图

其中,G1字节的b1-b4编码含义为:0000-1000分别表示有0至8个误码,1001-1111表示没用误码。

1.4 告警信号间的抑制关系

通过上文对告警信号流中各种主要告警的分析,我们会发现许多告警之间是具有关联性的,一些告警常常会引起另一些告警的产生,尤其是高阶告警的产生往往会引发低阶的告警。

举一个简单的例子,如果在光板上由于光路原因产生了R-LOS告警,该告警会对下游电路下插AIS,导致所有的开销字节都为全“1”,这必然引发R-LOF、R-OOF、MS-AIS等一系列告警。诚然,这些告警的产生是应该的,但它们对于维护者而言是没有意义的,上游都断了流,下游还有必要谈吗?显然没这个必要。

此外,如果这些告警都同时上报上来,一方面可能会导致数据量上报过大,增加网管和主控板的负担;(试想一下一个大网中几十个网元同时上报所有告警的情况);另一方面,也使操作者感觉到信息太多而无从下手。

2018-11-25

华为机密,未经许可不得扩散

第11页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

为了避免以上情况的发生,我们引入了告警抑制的方式来屏蔽掉那些没有必要上报的告警。

下面我们给出几个主要告警间的抑制关系,如图1-5所示。

R-LOSR-LOFB2-EXCMS-AISAU-LOPAU-AISHP-UNEQHP-TIMHP-SLMTU-AIS

图1-5 主要告警抑制树

箭头上方的高级别告警将屏蔽箭头下游的低级别告警。这样我们在定位故障时,就能首先将注意力集中放在高级别的告警上了。 ? 提示:

有一点需要明确的是,虽然不同级别的告警间有屏蔽关系,但不同级别的性能数据间却是不具备屏蔽关系的,主要是因为它们之间没有因果关系,如产生B1误码时,并不会为此而导致系统作什么动作引起B2误码的产生。 B2误码的数据是对其所辖范围的内容进行计算产生的。

1.5 根据信号流定位故障的应用

通过上面的学习,我们已经对告警信号流比较清楚了,但这仅仅是为我们建立了一个理论基础。如何将理论和实际结合起来,根据信号流的原理来快速定位、排除故障,这才是我们的真正目标。下面将介绍两个典型的案例,希望能帮助大家初步建立一个排除故障的思路。

1.5.1 误码问题

1)组网图

某地组网图如图1-6所示。

2018-11-25

华为机密,未经许可不得扩散 第12页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

WAWBEWC

图1-6 误码问题分析组网图

该网络为3个2500+设备组成的传输速率为2.5G的链形网络,A站是网关站,各站间都有2M业务,业务方式为分散型业务。 2)故障现象

从网管上查询监视的性能数据,在A站发现该站与B站和C站间的业务在支路上有大量低阶误码LPBBE,在西向线路上有大量HPBBE、MSBBE误码。检查B站,发现该站的东向线路上有大量HPFEBBE、MSFEBBE,在支路上与A站间的业务有大量LPFEBBE,而与C站间的业务正常。检查C站,发现该站只有在支路上与A站间的业务有大量LPFEBBE。 3)故障分析

按照“先单站,后单板”的原则,先定位问题网元。

从A站与B站,A站与C站间业务都有误码,而B站与C站间无误码这一规律可以判断出故障应该出在A站与B站间。因为所有有误码的业务都会经过这段路由。但问题是出在A站或B站,还是在光路上呢?这就得分析一下性能数据了。

根据“先高级,后低级,先线路、后支路”的原则,我们先分析线路上的性能数据。

根据前面学习到的信号流知识可以知道,线路上共有B1、B2、B3三种误码监测开销字节,分别监测各自产生点和终结点之间的路由质量。其中B1字节监测两站再生段间的路由,B2字节监测两站复用段之间的路由,而B3则只监测两站间某高阶通道间的路由。显然,B3监测的路由包括B2、B1监测的路由,而B2监测的路由包括B1监测的路由。

从现场的数据来看,只有B2、B3误码数据,这说明两站的再生段之间没有问题,从而排除了光路问题的可能性。有B2误码,说明从两站的复用段路由间就有故障。从误码数据内容上看,A站有背景块误码BBE数据,而B站有远端背景块误码FEBBE数据,这说明信号中的误码是在A站监测到的,但这并不说明问题一定是出在A站,因为我们知道,误码都是在下行信号流中检测到的,因此,A站检测到的误码既可能来自于本站的接收端,也可能来自对端站B站的发送端。

2018-11-25

华为机密,未经许可不得扩散 第13页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

到了现在这步,我们便可通过逐站排除的方法来定位故障了。先自环本站A站西向光路,发现本站误码消失,说明问题不在本站,更换B站西向光板S16,全网误码消失,问题解决。 ? 窍门:

在上面的问题分析中,根据B1、B2、B3误码所检测路由的覆盖关系,使用了一个判断方法,那就是假定B1误码会引起B2、B3误码,而B2误码会引起B3误码。

但在事实上,这一规律也不是绝对的,因为虽然三者之间所监测的路由有覆盖关系,但三者各自监测的内容并不具有覆盖关系,B1是监测该STM-N帧的所有字节,而B2只监测除再生段开销以外所有的字节,B3只监测各通道VC-3、VC-4的所有比特。因此当开销字节出 现误码时,三者之间的关联性就不能实现了。比如在再生段开销字节B1中监测出误码,B2和B3是不会检测出来的。

然而在实际维护中,我们发现仅仅是开销字节出误码的情况非常少见的,因此利用B1、B2、B3的路由覆盖关系来定位故障常常可以作为一个经验性的方法来运用。

1.5.2 告警问题

根据告警排除故障的思路与以上根据性能参数排除故障的思路类似,只是通常误码问题比较单一,而告警问题中,常常多种告警交织在一起,比较难以判断,但如果我们根据告警在信号流的产生机理,将各告警综合考虑,对于一般问题,还是可以解决的。下面举一个简单的例子 1)组网图

某地组网如图1-7所示。

WEFWEAEWBECEDW

2018-11-25

华为机密,未经许可不得扩散

第14页, 共15页

OptiX 155/622/2500/2500+ SDH光传输系统 维护手册节

第二部分 告警

文档密级:内部公开

图1-7 告警问题分析组网图

A、B、C、D、E、F六个2500+网元组成一个622的复用段环,业务方式为集中型业务,各站到A站都有业务。 2)故障现象

设备运行一段时间以后,常发现全网异常倒换,导致业务全阻的情况,具体现象如下:

查询各站倒换状态发现F站和B站分别为东向、西向倒换,C、D、E三站处于串通状态,而A站始终处于空闲状态。

发生倒换时,A站东、西向光板出现瞬间T-LOS告警,F站的东向,B站的西向有HP-LOM告警,除A站外,各站都有PS倒换告警;所有站的业务都有TU-AIS告警。 3)故障分析:

根据“先单站,后单板”的原则,首先将问题定位到单站:发送信号丢失告警T-LOS通常表明交叉板向线路板发送无信号或信号无帧,该告警为上行信号流中检测出的告警;HP-LOM为下行信号流中检测出的告警,说明H4字节在从对端站生成点到本站终结点这段路由中发生了问题,变为不合法。这两个告警都可能与A站有关。因此,我们可以初步将问题定位在A站。

分析这两个告警,H4出现非法通常是由于交叉板与线路板配合不好或线路板、交叉板出问题时发生。而T-LOS通常与交叉板送到线路板的信号有关。同时鉴于A站东、西向光板同时上告T-LOS告警,从概率上看,交叉板坏的概率明显大于线路板。决定更换交叉板。

更换交叉板后,观察一段时间,故障现象未再现,问题解决。

1.5.3 小结

从以上案例分析中可见,利用各告警在信号流中的位置,可逐步缩小问题可能存在的范围,从而达到快速定位故障的目的,因此,作为一个熟练的设备维护人员,掌握告警、性能信号流的相关原理是十分必要的。

2018-11-25

华为机密,未经许可不得扩散 第15页, 共15页

本文来源:https://www.bwwdw.com/article/288.html

Top