DWDM故障定位基本思路与方法

更新时间:2024-04-10 01:44:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

目 录

目 录

第1章 故障定位基本思路与方法 ............................................................................................. 1-1

1.1 故障定位对维护人员的要求 ............................................................................................... 1-1 1.2 故障定位的基本思路 .......................................................................................................... 1-3 1.3 故障定位的常用方法 .......................................................................................................... 1-4

1.3.1 告警、性能数据分析法 ........................................................................................... 1-4 1.3.2 仪表测试法.............................................................................................................. 1-6 1.3.3 替换法 ..................................................................................................................... 1-7 1.3.4 经验处理法.............................................................................................................. 1-8 1.4 故障定位的过程 ................................................................................................................. 1-9

1.4.1 排除外部设备故障 ................................................................................................... 1-9 1.4.2 故障定位、排除 .................................................................................................... 1-10

i

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

目 录

插图目录

图1-1 替换法图例 ............................................................................................................ 1-7

ii

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

目 录

表格目录

表1-1 两种获取故障信息途径的比较 ............................................................................... 1-6

iii

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

第1章 故障定位基本思路与方法

第1章 故障定位基本思路与方法

OptiX BWS 320G系统经过技术人员的安装和调测,都能正常稳定地运行。但由于多方面的原因,如受系统外部环境的影响或部分元器件的老化和损坏,有可能导致系统运行不正常。此时,就需要维护人员对故障进行分析、定位和排除,使系统迅速恢复正常。

本章介绍故障定位的基本思路及其常用的处理方法。

1.1 故障定位对维护人员的要求

1. 加强OptiX BWS 320G系统信号流的学习

要求维护人员对OptiX BWS 320G系统的信号流非常熟悉。只有清楚地知道信号的流向,才能准确地根据异常告警及性能事件来分析定位故障点。 2. 熟练掌握所维护传输设备的基本操作

要求维护人员熟练掌握网管设备、网元设备以及测试仪表的各种基本操作。如告警、性能的设置以及查询操作,插拔单板操作,光谱分析仪和误码分析仪的使用等。

这就要求维护人员平时要加强学习各种设备和仪表的操作手册与维护手册,并利用可能的机会多实践、多锻炼,从而逐步达到熟练操作的程度。 3. 熟悉所维护局的情况

要求维护人员对所维护局的组网情况、波长分配、单板版本和机房设备摆放都非常清楚。

这就要求维护人员平时注意熟悉所维护局的情况,加强对工程文档的学习,并做好工程文档的维护工作。

4. 做好设备正常运行时数据的采集与保存

要求维护人员在设备正常运行时,记录网络中各站的性能值,最主要的是各站的光功率,如果能够有一份工程中各点光功率测试记录则更好。 5. 做好现场数据的采集与保存工作

在进行故障处理前,要求维护人员首先要采集、保存现场数据,这是一步非常重要的工作。因为在故障的处理过程中,不可避免地会破坏当前数据,而

1-1

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

第1章 故障定位基本思路与方法

详实的现场数据,对于查清故障原因是极其有用的。但实际中很常见的一种情况是:由于缺乏数据,虽然设备已经恢复正常运行,但故障真正原因却没有查清!这对电信运营者和设备供应商都是一个隐患。

需要现场采集及保存的主要数据有系统告警和性能数据、各网元及单板的配置和运行状态数据、网管的操作日志等。另外,还要求维护人员做好操作记录工作,将排除故障过程中的每一步所进行的操作都认真记录下来,以上数据对于分析后续事故的原因是非常有用的。同时,这些数据经过总结,可作为一个经验保留起来,为以后处理相似故障提供指导。

1-2

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

第1章 故障定位基本思路与方法

1.2 故障定位的基本思路

在进行传输设备的故障定位中,最关键的一步就是将故障点准确地定位到单站,这是每个维护人员必须牢固树立的观念。

由于传输设备自身的应用特点——站与站之间的距离较远,因此在进行故障定位时,首先要将故障点准确地定位到单站或两站之间,这是极其重要和关键的。如果准确定位故障点之前,就怀疑是这个站或那个站,这块单板或那块单板,这段光纤或那段光纤的问题,常常是徒劳的,往往只会延误故障的解决。

一旦将故障定位到单站后,我们就可以集中精力,通过对性能数据的分析、硬件检查和更换单板等各种手段来排除该站的故障。

1-3

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

第1章 故障定位基本思路与方法

1.3 故障定位的常用方法

1.3.1 告警、性能数据分析法

使用告警、性能数据分析法,最关键的问题就是如何及时、方便、全面、确切和真实地获取故障信息。故障信息的来源一般有两个渠道:一个渠道是通过网管查询传输系统当前或历史的告警事件和性能数据;另一个渠道是通过观察设备机柜和单板的运行灯、告警灯的闪烁情况。这两个获取故障信息的途径各有优缺点,下面分别介绍:

1. 通过网管获取告警、性能信息,进行故障定位

由于网管可对全网传输设备的运行情况进行监控和管理,因此通过网管获取的故障信息是非常全面的——不仅是一个站、一块板的故障信息,而是全网设备的故障信息;另一方面,通过该渠道获取的故障信息也是非常确切的,可以知道当前设备存在的告警到底是什么告警,什么时间发生的,以前曾经发生过什么历史告警。性能不好时,光功率下降多少。因此,当故障发生时,维护人员使用网管获取故障信息,可以将故障定位到较细、较准确的程度,从而判断和处理常见的设备故障。

通过网管获取故障信息,维护人员有时也会面临告警、性能事件太多,无从着手分析的情况。另外,该途径完全依赖于计算机、软件、通信三者的正常工作,一旦以上三者之一出现问题,该途径获取故障信息的能力将大大降低,甚至于完全失去作用。

通过网管获取故障信息,进行故障定位,要求维护人员平时加强对OptiX BWS 320G系统信号流的学习,做到对每个告警的机理和影响都了如指掌;另一方面在进行告警分析的时候,要遵循“先分析高级别告警,再分析低级别告警。”的原则。

2. 通过设备上的指示灯获取告警信息,进行故障定位

OptiX BWS 320G系统设备上有不同颜色的运行和告警指示灯,这些指示灯的亮、灭及闪烁情况反映出设备当前的运行状况或存在的告警。各指示灯的说明参见附录B。

在机柜顶上,有红、黄、绿三个不同颜色的指示灯和一个蜂鸣告警器。 机柜顶部指示灯可帮助维护人员及时了解整个设备的工作情况,当柜顶的红灯亮时,表示设备检测到有紧急告警发生,如光纤断或单板不在位等;当黄灯亮时,表示设备检测到有主要告警发生。不过需要注意的是,只观察机柜

1-4

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

第1章 故障定位基本思路与方法

顶的告警指示灯,可能会漏过设备的次要告警(如果是次要告警,机柜顶指示灯不亮而是单板告警灯闪烁),而次要告警往往预示着本端设备的故障隐患,或对端设备存在故障,不可轻视。

OptiX BWS 320G系统单板上一般都有红、绿两个指示灯,SCC板上还有一个黄色的ETHERNET通信状态指示灯。绿灯为单板运行灯,通过不同频率的闪烁次数表示单板不同的运行状态;红灯为告警指示灯,通过不同频率的闪烁次数表示不同级别的告警。

通过这些单板指示灯的闪烁情况,我们可以大致定位故障的类型和位置。如发生故障时,检查发现子架中单板的绿色运行灯进入快闪状态,则可判断故障的原因可能是配置丢失,此时可通过重新下发配置数据排除故障;如检查发现单板的绿色运行灯进入慢闪状态,则可判断故障的原因可能是单板邮箱总线故障。

设备和单板指示灯所能表示的故障信息是比较有限的,因此仅仅通过观察设备、单板指示灯的明亮和闪烁情况,进行故障的分析和定位,其难度相对来说比较大,且定位难以细化、精确。

这种方法也有一定的优势——维护人员就在设备现场,不依赖任何工具,就可实时观察到哪块单板有什么级别的告警,而且在现场进行各种操作都比较方便。因此,通过观察设备上指示灯的闪烁情况并结合相关仪表的使用,维护人员应能对设备的基本故障进行分析、定位和处理。同时,要求维护人员平时要熟练掌握各单板告警指示灯的不同闪烁情况所代表的常见告警,以此做为日后判断、定位故障的基础。

注意:

(1)设备指示灯仅反映设备当前的运行状态,对于设备曾经出现过但当前已经结束的故障无法显示。

(2)设备每种告警对应的指示灯闪烁情况,可以通过网管软件进行重新定义,甚至可以将某种告警屏蔽掉。

(3)单板告警指示灯闪烁方式上报的告警级别与单板检测到的最高级别告警相一致。

3. 两种获取故障信息途径的比较

从上面的介绍可以看出,通过网管或通过观察设备指示灯这两个获取设备故障信息的途径各有优、缺点:

通过网管软件可以对全网设备的运行状况进行全面的把握,且对设备本身所存在的具体告警有确切的了解;而在现场通过观察设备指示灯的变化情况,

1-5

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

第1章 故障定位基本思路与方法

可实时了解到设备运行是否正常,且在现场各种操作均比较方便。因此,在实际的故障定位过程中,这两种手段要结合起来使用。这两种途径的比较如表1-1所示。

表1-1 两种获取故障信息途径的比较

主要使用者 定位作用 告警信息 历史告警 告警时间 性能事件 计算机、软件、通信 网管 网管维护人员 指挥 全网、大量、确切 有 可以看到 可以看到 完全依赖 设备指示灯 设备维护人员 配合 单站、少量、模糊 无 无法知道 无法知道 无关

对于传输网管和传输设备分别由不同人员维护的情况下,在排除故障的过程中,网管维护人员要起到指挥者的作用,而设备维护人员需与网管维护人员密切配合,共同排除故障。

1.3.2 仪表测试法

1. 光谱分析测试

用光谱分析单元MCA板或光谱分析仪测试单板的MON口输出信号的光谱,直接从仪表上读出光功率、信噪比,分析光放大板的增益平坦度。将得到的数据和原始数据比较,是否出现比较大的性能劣化(原始数据见工程文挡)。 M32/M16、V32、D32/D16、OAU、OBU、WBA、WPA、RPC等单板的MON口,均可以在线测试主信道光谱。如果受到影响的业务是主信道的所有业务,则可以重点分析OAU、OBU、WBA、WPA、RPC的光谱;如果受损的业务只是主信道中的一路业务时,重点分析M32/M16、V32和D32/D16的光谱。 2. 光功率测试

虽然从网管上的性能数据中可以得出各点的光功率,但是为了得到精确的值,用光功率计再次测量该点光功率也是非常必要的。

1-6

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

1.3.3 替换法

第1章 故障定位基本思路与方法

注意:

当M32/M16的输出光功率、D32/D16的输入光功率、OAU/OBU /RPC/WBA/WPA的输入和输出光功率异常时,如果断开线路进行测试,将会中断所有业务,所以不到万不得已的情况,不可以随意测试主信号的光功率。

“替换法”就是使用一个工作正常的器件去替换一个怀疑工作不正常的器件,从而达到定位故障、排除故障的目的。这里的器件,可以是一段光纤跳线、一块单板、一个法兰盘或一个衰耗器等。

“替换法”适用于排除传输外部设备的问题,如光纤、法兰盘、客户端设备、供电设备等;或故障定位到单站后,用于排除单站内单板或模块的问题,下面以LWF板接入SDH信号为例,对替换法进行介绍。如图1-1所示。

ASDHLWFB 图1-1 替换法图例

如果图1-1中的LWF板接入SDH信号端上报R_LOS告警,而SDH设备接收没有发生告警,则可以调换光纤跳线A和B,观察LWF板和SDH设备告警情况,如果LWF板接入SDH信号端仍然有R_LOS告警,则可以判断是SDH设备的发送模块或LWF板接收SDH信号的模块有故障;但如果LWF板没有告警,而SDH设备产生R_LOS告警,则说明是光纤跳线A有故障。

注意:

测试时首先把LWF板和SDH设备单板激光器自动关闭功能屏蔽。

1-7

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

第1章 故障定位基本思路与方法

替换法的优势是可以将故障定位到较细的位置,且对维护人员的要求不高,因此是一种比较实用的方法。

但该方法对备件有要求,且操作起来没有其它方法方便。插拔单板时,若不小心,还可能导致板件损坏等其它问题的发生。

1.3.4 经验处理法

在一些特殊的情况下,如:由于瞬间供电异常、低压或外部强烈的电磁干扰,致使设备某些单板进入异常工作状态。此时的故障现象,如业务中断、ECC通信中断等,可能伴随有相应的告警,也可能没有任何告警,检查各单板的配置数据可能也是完全正常的。经验证明,在这种情况下,通过复位、插拔单板,单站掉电重启,重新下发配置等手段,可有效地及时排除故障,恢复业务。

但建议该处理故障的办法尽量少用,因为该方法不利于故障原因的彻底查清。遇到这种情况,除非情况紧急,一般还是应尽量使用上面介绍的其他方法,或请求支援,尽可能地将故障定位出来,以消除设备内外隐患。

1-8

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

第1章 故障定位基本思路与方法

1.4 故障定位的过程

对于OptiX BWS 320G传输设备的故障定位来说,不管对于哪种类型的故障,其定位过程都是大致相同的,即首先排除客户端设备的问题,然后将故障定位到单站,接着定位出现问题的单板或光纤跳线,并最终将故障排除。本节讲述的是在一般的故障处理过程中应该使用的办法,将故障定位到单板或光纤跳线并最终排除故障。

1.4.1 排除外部设备故障

在进行系统的故障定位前,首先得排除外部设备的问题。这些外部设备问题包括光纤、客户端设备和掉电等问题。 1. 客户端设备故障的排除

方法1:把客户端设备光口收发自环,检查客户端设备告警情况。如果依然存在告警,或采用仪表测试还是有误码,则说明故障发生在客户端设备上,注意收发自环时需加装大小适当的光衰减器。

方法2:在OptiX BWS 320G系统的波长转换板输入口、波长转换板输出口挂误码测试仪表,在对端站把相应波长转换板输出口用光纤跳线短接到相应波长转换板输入口,进行误码测试。如果没有误码,则故障在客户端设备上。 方法3:在条件允许的情况下,把客户端设备直接接到光路上传输,然后在客户端设备侧挂表测试,看是否发生误码,如果发生误码,则故障在客户端设备。

方法4:开放式OptiX BWS 320G系统配置有波长转换板,这些单板均有B1误码检测功能,首先检查波长转换板是否监测到B1数值,如果有则OptiX BWS 320G接收的信号已经产生误码,再检查对端站波长转换板监测到的B1数值,看与波长转换板的B1数值是否相同,如果相同说明OptiX BWS 320G系统没有新增加误码,整个OptiX BWS 320G系统运行正常,所以问题出在客户端设备。 2. 线路光纤故障的排除

当光功率明显下降时,单板必然有信号丢失告警,单板告警指示灯每秒闪烁三次。为进一步定位是单板问题还是光纤问题,可采取如下方法:

方法1:使用OTDR(光时域反射仪)仪表直接测量判断光纤是否发生故障。但需注意,OTDR仪表在很近的距离内,有一段盲区,无法准确测试。

1-9

OptiX BWS 320G骨干DWDM光传输系统 维护手册 故障处理

第1章 故障定位基本思路与方法

方法2:测量告警单板的接收光功率和对端站相应单板的输出光功率,若对端站单板发送光功率正常,而本端接收光功率异常,则说明是光纤问题;若单板发光功率已经很低,则判断为该单板有问题或其输入光功率不正常。 方法3:使用替换法。若有一根光纤是好的,则可用替代法判断是否的确是光纤的问题。

3. 供电电源故障的排除

如果一站点登录不上,且与该站相连的单板均有输入信号丢失的告警,则可能是该站的供电电源出现故障,导致该站掉电引起告警。若该站从正常运行中突然进入异常工作状态,光功率突然下降、某些单板工作异常、业务中断、登录不正常等情况,则需检查传输设备供电电压是否过低,或者曾经出现过瞬间低压的情况。

1.4.2 故障定位、排除

故障能否及时排除取决于能否准确的定位故障点。而进行故障定位最常用的方法就是“告警性能分析法”,即通过网管逐站进行告警性能分析,查看各站的光功率,与已经保存好的正常情况下的性能数据进行比较,分析差异,定位可能存在故障的光纤跳线或单板。

如果条件允许,可以用仪表测量一下光功率,如果确实出现异常,通过替换法更换损坏的单板或光纤跳线,再通过性能分析查看故障是否恢复。

1-10

本文来源:https://www.bwwdw.com/article/p76r.html

Top