OTN告警介绍及故障定位方法

更新时间:2023-12-02 06:47:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

OTN告警介绍及故障定位方法

1 OTN帧结构简介

1.1 OTN产生的背景

目前随着通信行业的发展,对光网络的要求越来越高,要求光网络所承载的信息量也越来越大,承载的客户信号种类也各种各样,包括SDH、ATM、以太网、IP等多种信号都要求能在光网络中快速、高效、透明、可靠的传输。为此,国际电信联盟ITU制订光传送网OTN的相关标准,来指导OTN的发展。

光传送网OTN是下一代光网络的发展方向。OTN设备主要完成的功能就是将客户信号封装在OTN的相应帧格式中,透明、高效的进行传输,同时,通过相应的OTN开销对信号的好坏进行检测。因此,理解好OTN开销对深入理解OTN设备有着重要意义。

ITU-T在G.709标准中规定了OTN的帧格式和映射方式,;在G.798标准中规定了设备的功能特性。因此,本手册主要以G.709和G.798为标准,结合我司M820V2.5设备和

ZXONE 8X00设备,主要讲述我司设备OTN开销的实现以及检测。

1.2 OTN的网络层次

光传送网OTN的一个主要特征就是网络的层次化。将光传送网划分为多个网络层次,每个层次之间彼此互为服务层与客户层。客户信号在不同层次之间进行传输,每一层次都有着自己的开销,用于检测本层次信号的好坏。

根据ITU-T的G.709规定,OTN分为客户信号层、光通道净荷单元(OPU)、光通道数据单元(ODU)、光通道传送单元(OTU)、光通道层(OCH)、光复用段层(OMS)、光传输段层(OTS)。以上各层之间,前者是后者的客户层,后者是前者的服务层。下面是对各层的简单说明: 1.

客户信号层:该层主要指OTN网络所要承载的局方信号,主要包括:SDH、以太网、IP业务等。 2.

光通道净荷单元OPU:该层主要是用来适配客户信号以便使其适合在光通道上传输,即:承载客户信号的“容器”。该层的开销主要用来指示客户信号映射到OTN信号的过程。 3.

光通道数据单元ODU:该层是由OPU层和ODU层相关开销构成的,该层的开销可以支持对传输信号质量端到端的检测。 4.

光通道传送单元OTU:该层是在光路上传输信息的基本单元结构,有ODU层和OTU层相关开销构成。

5. 光通道层OCH:该层是具有特定波长和特殊帧格式的光信号,其中特殊帧格式即定义的OTU层。

6. 7.

光复用段层OMS:该层为经过合波处理的多波长光信号。 光传输段层OTS:该层是经过OA放大等处理后的光信号。

由于层次化是OTN网络的主要特点,因此,熟悉各层次结构对于理解OTN标准十分重要。下图是OTN各层次图,以我司设备为例,指出各层的具体位置。

客户信号层O P U层O D U层O T U层O C H层O M S层O T S层客户层服务层

Optical Transport Module OHclient OHclientOPUODUOTUOChOPU = Optical Payload UnitOTU = Optical Transport UnitOCh= Optical ChannelODU = Optical Data UnitOPU Non-associated overheadOptical Supervisory ChannelOHODUFEC Optical Channel?Optical Multiplex SectionOMSOTSOptical Transmission Section

M820V2.5设备OTN各层次举例

STM-64CD2LD2OMUOBAOTS层OMS层OCH层OTU2层ODU2层OPU2层OPAODULD2CD2STM-64客户信号层(SDH)

在这需要指出的是OTS层、OMS层和OCH层是纯粹的光信号,虽然G.709中定义了相关的开销,但是目前几乎所有的设备制造商都没有涉足。因此,我们重点关注的应是OPU层、ODU层以及OTU层的相关开销。

OTN各层还有不同的速率级别,即通常采用OPUk、ODUk、OTUk的形式来表示OTN各层(k=0、1、2、3),ODU0对应1.25G速率级别可以用来封装GE信号;ODU1对应2.5G速率级别可以用来封装STM-16信号;ODU2对应10G速率级别;ODU3则对应40G速率级别。

1.3 OTN的帧结构

OTN的帧结构与SDH的帧结构不同,OTUk的帧是由4行4080列的字节组成。每一个OTUk帧都可以看成相应ODUk加成OTU的开销所构成,而每一个ODUk也同样可以看成是由相应的OPUk加上ODU的开销所构成。下图是一个OTUk帧的示意图:

11234O D U开销23456789101112131415 16OPU开销3824 38254080帧定位字节O T U开销净荷区(承载客户业务)FEC

上图所示中,紫色区域为OTUk帧的帧头区;红色区域为OTU层开销;蓝色区域为ODU层开销;绿色区域为OPU层开销;黄色区域为OTUk帧的净荷区。详细的开销示意图如下图所示:

下面就分别对各区域开销做简单介绍。 1.

帧定位字节:

G.709中规定,每一个OTUk的帧头有6个帧定位字节(FAS)和一个复帧定位字节(MFAS)组成。帧定位开销既可用于OTUk也可以用于ODUk,当设备收到的OTUk帧或ODUk帧的帧定位字节出现错误时,设备上报OTU帧丢失(对于ODU帧则上报ODU-LOFLOM);如果出现复帧错误,则会上报OTU复帧丢失的告警。需要特别指出的是,无论是帧丢失还是复帧丢失,都按业务失效处理。 2.

OTUk的开销:

如图2-3所示,OTUk的开销实际上有两部分组成,一部分是7个字节的开销,另一部分是最后附加的FEC纠错开销,这里重点介绍OTUk的7个字节开销。 OTUk的7字节开销主要三部分组成:3字节的段检视开销(SM)、2字节的通用通信通道(GCC0)以及2字节的预留段(RES)。与我们业务密切相关的是SM段的开销。

SM段开销有3个字节组成,第一个字节为路径踪迹标示符(TTI),第二个字节为比特间插校验码BIP-8,最后一个字节则由4位的后向差错指示/后向输入定位错误指示(BEI/BIAE)、1位后向缺陷指示(BDI)、1位的输入定位错误(IAE)以及2位的预留比特所组成,示意图如下:

8TTI9BIP-81011GCC01213RES14BEI/BIAEBDIIAERES

路径踪迹标示符(TTI)是由64个字节组成,用来指示路径踪迹防止错连。我司的设备既可以在源端人为设置TTI的期望值,也可以检测上游传递过来的TTI值,当所受到的TTI值与网管设置的期望值不一致时,则上报TTI失配告警。

比特间插校验码BIP-8是用来检测OTUk帧中的传输错误的,当收到的BIP-8值与上游发来的BIP-8值不一致,则设备会统计BIP-8个数,以表示上游传过来的信号中有误码存在。

后向差错指示/后向输入定位错误指示(BEI/BIAE)是用来向上游指示错误或对齐错误的,当设备收到BIP-8误码时,会向上游回送同样数量的BEI作为错误指示;如果设备收到帧对齐错误IAE时,在统计IAE秒的同时,会向上游回送同样数量的BIAE。

后向缺陷指示(BDI)是用来向上游传送反向失效指示的。当设备收到业务失效信息时,会向上游回送BDI,以表示收到的信号失效。

注意:

TTI、BDI、BIP-8、BEI、IAE以及BIAE等开销,不仅仅是在OTUk开销中存在,同样在ODUk层开销和TCMi层开销中也存在,它们的意义是一样的,只是用来检测不同的网络层次,因此,在工程中遇到相关告警或性能统计,一定要首先明确是哪一层次的。

下图是我司设备层次的举例说明:

实纤客户侧业务COMB/CH1电交叉LD2/LO2SM段LD2/LO2电交叉LD2/LO2SM段LD2/LO2实纤电交叉COMB/CH1客户侧业务TCMi段(可人为设置)TCMi段(可人为设置)TCMi段(可人为设置)PM段 3.

ODUk的开销:

G.709中规定的ODUk的开销比较复杂,如图2-3所示,ODUk的开销主要由3*14个字节组成,这里主要说明一下与业务关系密切的开销。

在ODUk开销中最为重要的开销有两组,即:3字节长的PM段开销和3字节长的TCMi开销。

4.3 GFP相关告警:

通用成帧程序GFP是用来承载以太网数据业务的一种成帧方式。一般分为GFP-T和GFP-F两种。目前,在M820V2.5设备和M8x00设备中,GE业务采用GFP-T的封装,10GE-LAN采用GFP-F的封装。GFP成帧是位于以太网业务和OPU帧之间的,也就是以太网业务先映射到GFP帧,然后再映射到OPU中,一般是由客户侧单板(如:COMB、CH1、DSAC等)来完成的。

GFP相关告警一般主要有两种,即:GFP客户信号失效和GFP同步丢失。这两种告警只有在接入以太网业务时才会出现。GFP客户信号失效告警意味着在GFP成帧之前以太网业务就已经失效,出现该告警多数是因为上游客户侧信号有问题;GFP同步丢失告警意味着故障点在GFP成帧之后。有关这两种告警具体的定位方法将在后文中详述。

4.4 G-AIS告警:

该告警是M820V2.5设备和M8x00设备新增的告警,用于表示客户信号失效,相当于客户层的维护信号AIS,因此,只有客户侧单板(如:COMB、CH1、CD2、CQ2、CO2)才会上报该告警。当接入SDH业务时如果上游输入的客户信号失效,上游客户侧单板检测到客户信号失效后采用维护信号G-AIS代替原有的客户信号向下游传递,此时在下游客户侧单板的输出口会上报G-AIS告警。目前只有具有外购FRAMER芯片的CD2、CQ2、CO2单板实现了此功能。

4.5 后向缺陷指示BDI告警:

BDI告警是实际工程中最常见的告警之一,它的出现意味着反方向业务有失效的情况。遇到BDI告警说明了两点:一,本方向业务是好的;二,反方向业务失效了。举个例子,有三个站点A、B、C,之间接有双向业务。若A点上报了BDI告警,则查看下游节点B,发现B点也上报了BDI告警,则继续向下游找,直到找到不上报BDI告警的节点C,说明节点C接收到了失效的业务并回插了BDI,此时应该由节点C开始向上游查找业务失效点。

OUT BDI插入条件:光层LOS、OUT层LOF、LOM、TTI失配、AIS、

ODU BDI插入条件: OTUT层LOF、LOM、TTI失配、AIS、ODU层LOFLOM、AIS、OCI、LCK

检测到失效下插AIS检测到AIS告警上报业务失效节点A节点B节点C检测到BDI告警上报

回送BDI检测到BDI告警上报回送BDI4.6 背板层信号帧丢失/复帧丢失告警:

该告警是M820V2.5设备中新增的告警。在M820V2.5设备中一共有两个交叉板CSUB,分别放在7槽位和8槽位。如果业务板有背板层状态帧丢失告警上报,说明有交叉板不在位或者失效的情况,此时查看该告警上报的检测端口,如果是背板总线状态接收端口1上报的,则说明是7槽位CSUB单板有问题;如果是背板总线状态接收端口2上报的,则说明是8槽位CSUB单板有问题。

8300有4块交叉板,采用2:2保护,对业务板来讲,背板端口1~4分别对应8~11槽位的交叉板,这四块交叉板中只要有两块交叉板工作正常,系统就可以正常工作。对于820和8200这样的1:1保护系统来讲,只要有一块交叉板有效,业务就正常;对于8300这样的2:2保护系统来讲,只要有2块交叉板有效,业务就正常。

8200子架只要有1个交叉板正常运行就可以正常工作;8300子架只要有2个交叉板正常运行就可以正常工作;8500子架只要有4个交叉板正常运行就可以正常工作;

如果交叉板的数目少于以上的1/2/4个,则业务板背板总线状态端口上报背板层信号帧丢失告警,表示缺少足够的交叉板,而此时业务必定无法正常运行。当业务板上报该告警时,要检查交叉板数目是否正确及交叉板是否正常运行。

4.7 多点连接时各点上报的告警:

4.7.1 情况一:

没有上业务,双向,没有配置交叉,线路侧光纤连接, CH1:

客户侧输入端口:信号丢失、输入无光 客户侧输出端口:服务层信号失效 调度发送端口:ODU OCI告警 LO2:

调度发送端口: ODU OCI告警 调度接收端口: ODU OCI告警 线路侧发送端口:无告警 线路侧接收端口:无告警

1CH1A2 3LO245LO26B7LO289LO210C11CH1124.7.2 情况二:

没有上业务,双向,配置交叉,线路侧光纤连接 CH1:

客户侧输入端口:信号丢失、输入无光 客户侧输出端口:GFP客户信号失效 LO2: 无告警

1CH1A2 3LO245LO26B7LO289LO210C11CH1124.7.3 情况三:

CH1接入业务,双向,配置交叉,线路侧光纤连接

1CH1 A2 3LO245LO26B7LO289LO210C11CH112CH1:无告警 LO2:无告警 补充说明:

没有配置交叉时单板上报ODU OCI告警,LO2和CH1在调度发送端口(背板向光口方向)有检测点用于计算是否产生OCI,目前此告警比较可信,一旦出现该告警可以认定是没有配置交叉。LO2比CH1特别之处是LO2在调度接收端口(光口向背板方向)有检测点,可以读取维护信号OCI开销,用以检测上游有没有配置交叉;

5 常见故障的举例定位

5.1 服务层信号失效SSF告警:

遇到该告警时,最重要的一点就是搞清楚上报该告警端口的服务层是哪一层,然后就可以比较容易的找出故障点。

情况一:线路侧单板的ODUK调度接收端口上报SSF

以LD2为例,一般情况下,LD2调度接收端口所检测的是ODUk层,因此,其服务层是OTU2层,上报SSF也就意味着光口接收方向业务失效,此时线路侧接收光口多数会有失效告警(如:LOS、LOM、LOF、OUT-AIS等)。

情况二:客户侧或线路侧单板的ODUk调度发送口上报SSF

以M8x00的线路单板LO2为例,一般情况下,LO2调度发送口所检测的是ODUk层,而调度发送口的ODUk业务是从背板过来的,因此,背板帧信号可以看成ODUk的服务层,上报SSF意味着背板帧信号失效,此时多数情况是由于交叉板出现故障。

情况三:客户侧单板的OAC输出光口上报SSF

以COMB单板为例,其OAC侧的输出光口检测的是客户信号(如SDH或以太网业务),其服务层可以认为是ODUk层,上报SSF意味着上游发过来的ODUk层已经失效,多数情况下其相应的ODUk调度发送口会有告警上报(如:ODU-AIS、ODU-OCI等),此时故障点应继续向上游寻找。

5.2 GFP客户信号失效与GFP同步丢失:

以M8x00设备中CH1单板接入GE业务为例,说明遇到这两种告警的定位情况(COMB单板情况类似)。

断断断断断断断断断断断断COMB/CH1LD2/LO2LD2/LO2断断断COMB/CH1断断GFP断断断断断断断

上图是上报GFP客户侧信号失效的情况。如果CH1单板客户侧输出光口上报该告警,则说明上游对应的客户侧信号失效,一般为没有正确接入业务,但整个波分设备是好的。

GFP同步丢失告警的产生在M820V2.4和M820V2.5设备中的处理是不一样的(M8x00设备与M820V2.5设备处理方法是一致的)。在M820V2.4中,当上游客户侧单板DSAC到下游DSAC中间路径出现故障,则下游DSAC客户侧输出光口就会上报GFP同步丢失。但在M820V2.5设备中,该情况则是上报服务层信号失效。在M820V2.5设备中,如果COMB上报了GFP同步丢失告警,一般意味着上游出现了业务接错的现象,即很有可能是将STM-16业务或者白光交叉给GE端口上。

5.3 ODU-LOFLOM告警:

该告警的出现意味着ODU的帧定位字节或者复帧定位字节错误或丢失。常见的情况是业务板的调度

发送端口上报该告警,这主要是由于采用时隙交叉后,ODU帧需要在业务板进行交织与解交织,重新组装ODU帧,此时如果没有对齐帧头就会出现ODU-LOFLOM的情况。因此,该告警一般不应该出现,一旦出现该告警则说明单板板内部FPGA处理有问题或者背板针损坏,可以尝试IC复位一下交叉板或者出现该告警的业务板,或许该告警会消失,但问题并没有得到根本解决。

5.4 单板上报OCI告警

没有配置交叉时单板对应的调度端口上报OCI告警,上游的OCI告警可以透传到下游站点,根据OCI告警上报的端口,判断交叉配置情况,如下图所示。

从背板到光口方向没有配置交叉时,业务板调度发送端口上报OCI告警;

A站点从CH1到LO2方向没有配置交叉时,A站点LO2调度发送端口及B站点LO2调度接收端口同时上报OCI告警。

站点AODUK调度接收端口OAC侧输入端口站点BODUK调度接收端口ODUK调度发送端口OCH侧输出端口ODUK调度发送端口背板电交叉OAC侧输出端口光纤连接背板电交叉OCH侧输入端口CH1ODUK调度ODUK调度发送端口接收端口LO2LO2ODUK调度ODUK调度发送端口接收端口CH1

5.5 交叉板上报时钟不可用告警

没有插时钟板时或者时钟板有问题,交叉板上报时钟不可用告警。

5.6 单板不响应网管的操作

查看CPU占用率是否达到100%,方法为telnet到单板,每隔1分钟单板会自动打印CPU占用率情况,KSH>CPU Use rate = 61%(latest 60s), 61%(latest 300s),单板正常运行过程中CPU占用率在100%以下,如果达到100%表示单板软件跑死,有些特殊情况下会造成软件跑死,解决方法为硬复位或掉电再上电复位单板。

5.7 单板上报板不在位

1、 看是否可以ping通单板及其他槽位正常的单板,如果只有本板ping不通,那么问

题锁定在本板上,参考5.6查看是否单板跑死,看面板灯是否正常,尝试重新烧程序、复位或更换备板;

2、 如果所有业务板都ping不通,则问题在CCP单板上,看是否可以ping通CCP板,

如果ping不通CCP板,说明系统环境有问题,检查SNP板及网管是否可以管上,如果环境没有问题,那么问题锁定在CCP单板上,尝试复位CCP板或更换单板。(定位CCP板问题时注意8500中的CCP的级联顺序)

本文来源:https://www.bwwdw.com/article/1rvt.html

Top