传输设备一般故障处理指导手册 - 图文

更新时间:2024-06-08 20:40:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

操作手册

告警参考指南

CT/NM-OMSN、OMSG

ALCATEL光网络事业部 第1版 - 2005年9月

第 1 页 共 167 页

目 录

1

1.1 1.2 1.3

绪论 ............................................................................................................................... 6

文件目的 ............................................................................................................. 6 文件结构 ............................................................................................................. 6 术语 ........................................................................................................................ 6

2 告警预览 .............................................................................................................................. 7

2.1 当前告警管理 ......................................................................................................... 7 2.2 告警计数器和告警铃 ......................................................................................... 7 2.3 告警信息 .................................................................................................................... 8

2.3.1 感知级别 ............................................................................................................. 8 2.3.2 事件日期和时间 ............................................................................................... 9 2.3.3 友好名称 ............................................................................................................. 9 2.3.4 事件类型 ............................................................................................................. 9 2.3.5 可能原因 ............................................................................................................. 9 2.3.6 保留状态 ............................................................................................................. 9 2.3.7 清除状态 ........................................................................................................... 10 2.3.8 确认状态 ........................................................................................................... 10

2.4 告警级别分配(ASAP) ............................................................................... 10

2.4.1 默认和灵活使用ASAPs ............................................................................... 10 2.4.2级别 ..................................................................................................................... 11 2.4.3预定义ASAP的内容 ..................................................................................... 12

2.5 站告警 ....................................................................................................................... 13 2.6 映射表:维护终端上的TP名称 ............................................................... 15

维护终端(CT)上的TP名称反映了作为用户接口的软件模型。因此,它们随ITU-T建议中给出的TP名称而改变。下表列出了在两者之间TP名称映射 ............................................................................................................................................ 15

3 相关板卡类型和事件类型的相关性.............................................................. 16 4 设备告警/处理故障告警 ........................................................................................ 28

第 2 页 共 167 页

4.1 电池故障(BF) ................................................................................................. 28 4.2 背板故障(BKF) ............................................................................................. 28 4.3 冷却风扇故障(CCF) ................................................................................... 29 4.4 熔断器故障(FF) ............................................................................................ 29 4.5 高激光温度(HLT) ........................................................................................ 29 4.6 LAN故障(LAN) ............................................................................................ 30 4.7 LAN故障(LAN) ............................................................................................ 30 4.8 无RTC同步(NRTCS) ............................................................................... 31 4.9 光连接器罩打开(OCCO) ......................................................................... 32 4.10 电源问题(POP) ........................................................................................... 32 4.11 资源隔离(Q3) .............................................................................................. 33 4.12 冗余时钟故障A/B(RCFA/B)..................................................................... 34 4.14

可更换单元丢失(RUM) .................................................................. 42

5 通信告警/处理处理告警 ........................................................................................ 90

5.1 5.2 5.3 5.4 5.5 5.6 5.7

简介 ...................................................................................................................... 90 告警指示信号(AIS) .............................................................................. 90 连接阻塞(CCB) ...................................................................................... 93 连接失败(CCF) ....................................................................................... 93 保护阻塞(CPB) ....................................................................................... 94 通信协议错误(CPE) ............................................................................ 94 信号劣化(DS) .......................................................................................... 95

第 3 页 共 167 页

5.8 5.9 5.10 5.11 5.13 5.14 5.16 5.18 5.19 5.20 5.21

比特误码率过高(EXC) ...................................................................... 99 远端缺陷指示(RDI) ........................................................................... 100 频率偏移(FO) ........................................................................................ 104 帧丢失(LOF) .......................................................................................... 104 指针丢失(LOP) ..................................................................................... 108 信号丢失(LOS) ..................................................................................... 110 净负荷类型不匹配(PLTM) ............................................................ 112 发射机劣化(TD) .................................................................................. 119 发射机故障(TF) ................................................................................... 120 踪迹识别不匹配(TIM) ..................................................................... 120 不可用时间(UAT) ............................................................................... 124

1 摘要 ................................................................................................................................ 133 2 如何更换STM-1O或STM-16 ................................................................... 133 3 如何更换STM-1E或IOB45 ........................................................................ 135 4 如何更换IOB140或IOB34 ......................................................................... 136 5 如何更换2兆比特/秒机盘(IOB2).................................................... 137 6 如何更换多路机盘(MUX2) ................................................................... 138 7 如何更换扩展机盘(ETB) ........................................................................ 139 8 如何更换矩阵机盘 .............................................................................................. 141 9 如何更换时钟分布机盘(CDB) ............................................................ 141 10

如何更换MS保护机盘(MSPB) ................................................. 142

第 4 页 共 167 页

11 12 13 14 15 16 17 18 19 20 21 22 23 24

如何更换光学放大器(OA) ............................................................. 143 如何更换IPBB、EPB或PCB............................................................ 143 如何更换时钟接口盘(CIB) ............................................................ 144 如何更换卫星处理盘(SPB) ........................................................... 144 如何更换整流器(CONV) ................................................................ 144 如何更换MCB ............................................................................................... 145 转化MCB主/从关系................................................................................. 150 如何更换Congi机盘(CONGI) ................................................... 150 如何更换EQUICO或(SERVICE)机盘 ................................. 151 如何更换高速保护机盘(HPROT) ............................................. 151 如何更换SMX矩阵机盘(SMX) ............................................... 151 如何更换S4、S16、P4ES1、P4S1与1S1 ............................... 152 如何更换P4ES1、P63E1和P3E3T3 ............................................ 154 如何更换A21E1、A4ES1和A3E3 ................................................ 154

索引 ........................................................................................................................................... 155

第 5 页 共 167 页

1 绪论

1.1 文件目的

该文件的目的是列出所有来自OMSG/OMSN设备的告警以及告警管理器显示的所有告警名称、告警原因、对业务的影响以及消除告警的方法,指导北京电信公司传输网络三级维护体系中一级维护人员对设备常见故障进行处理。

1.2 文件结构

文件结构如下:

– 第一章 简单介绍文件内容。

– 第二章 给出当前告警、ASAP、站告警和TP名称管理的信息。 – 第三章 列出所有TP和相应事件的类型。

– 第四章 详细描述所有的设备告警以及如何处理与设备相关的故障告警。 – 第五章 详细描述所有的通信告警以及如何处理与TP相关的故障告警。 – 第六章 详细描述服业务质量告警。 – 附录 介绍了用户盘更改步骤。

– 索引 列出了文件中描述的所有告警。

1.3 术语

参看《入门手册》中的缩略语和词汇表。

第 6 页 共 167 页

2 告警预览

2.1 当前告警管理

当故障资源(或临近资源)造成告警产生时,告警监视(Alarm Surveillance)将会接收到这些告警,将其储存,并通过响铃或在屏幕上显示特定图标的方式对操作员进行提示。根据操作员的要求,告警可在其信号刚刚开始之时就开始显示。 在整个过程中告警被看作是当前(活动)告警,其状态为永久实时刷新,发现告警的操作员可以了解到告警是否被保留、是否被确认及是否已就此告警派发故障单。

如果问题不再存在于设备系统中,我们说告警是已被清除的告警。这时告警不再被看作是当前告警,当操作员对其进行确认后,该告警将从当前告警中消失,并被归档入历史告警中。

被删除的告警同样将从子列表(或主列表)中消失;如果符合归档过滤器的要求,这些告警并被归档。

然而,与告警相关的问题可能并未得到解决。这种情况下,告警将在一段时间后重复出现,直至问题解决为止。告警监视将每个收到的告警与一个重复计数器相联系。此外,在产生告警的设备系统原因未被处理之前告警是不会被清除的,操作员可通过告警监视对这些告警进行手动归档。

网络中的异常可能导致数种告警的产生;系统同样可能出现异常或故障,从而导致更多告警的产生。这些称作“相关告警”,可标记其与其他告警的连接。这样,操作员即可了解一个告警是否有相关告警。

2.2 告警计数器和告警铃

可用的全局信息将通过计数器进行显示,计数器将显示某一级别的告警数、子列表中告警的总数及未确认和未清除的告警数。这些计数器可以进行实时刷新(子列表被激活时),也可以不进行实时刷新(子列表未被激活时)。 对未确认的告警进行确认后,告警计数器NACK的值将根据所确认的告警的数字进行减少。如果出现新的当前告警,该告警计数器的读数将增加,同时发出告警铃声(如启用)。当有告警被清除后,告警计数器“Clear(清除)”的读数将同时增加。

由于告警列表中的覆盖行为(系统会自动删除旧告警,以创造新的存储空间)或在操作员手动删除告警后,一个当前的告警关联可能会丢失,即,开始的告警已被删除,而相应的结束告警仍在未确认告警列表中。

第 7 页 共 167 页

图1 范例:显示未确认告警的子列表

2.3 告警信息

告警或告警通知主要建立在侦测到问题或故障发生的资源所发出的消息的基础上。告警中所包含的信息包含 ? 指出产生告警的资源的信息 ? 指出告警所代表问题类型的信息。

注意这些信息,及资源产生告警的日期和时间,在任何告警通知中都会强制出现。同样可以显示其他可选择的信息,如告警相关的具体问题情况、通知识别符等,以便于操作员进行告警管理。

操作员可以根据其偏好创建告警子列表,包括对告警信息进行过滤和显示。关于告警管理和告警(子)列表的更多信息请参见操作手册告警管理(Operation Manual Alarm Management)。 我们提供关于各种告警的在线说明。从告警列表中选择相应告警并从“Navigation(导航)”菜单中选择“External Application-> Alarm Info(告警信息)”。将显示确认对话框,询问是否开启Netscape浏览器。确认后将会显示告警的详细相关信息。

可以通过导航至相关的设备(Equipment)或传输(Transmission)视图,获取更多关于告警资源的信息。从告警列表中选择相应告警并从“Navigation(导航)”菜单中选择“Externa Application-> emlusm”即可。 2.3.1 感知级别

感知级别功能是在告警发生时,指出问题的级别。故障分为四个级别:

? 危险,

第 8 页 共 167 页

已经无法提供用户请求的服务。

? 紧急, ? 非紧急,

? 警告,表示对客户提供的服务质量有所影响,但通信业务还能正常运行。 如果之前产生告警的资源故障已清除,将显示告警状态为“已清除”。 2.3.2 事件日期和时间

本功能显示资源中产生告警的日期和时间。

数据的显示格式为 YYYY/MM/DD hh:mm:ss (年/月/日 小时/分/秒)

如 1999/05/20 06:29:24 表示一个告警在1999年五月20日早晨六点29分24 秒产生。 2.3.3 友好名称

通过友好名称,可找到造成告警发生的板卡或TP的位置。

所有告警的友好名称包括与NE(网元)相关的信息及产生告警的板卡的位置。根据告警类型的不同,元件类型可能为一块机盘或是一个TP(端点)。对于设备告警,指定的位置到机盘层。服务质量告警和通信告警指定的位置到端口和TP层。服务质量告警提供一个超过门限的告警类型。 友好名称的一般类型等于

NE/rack#-subrack#-board#-port#, TP# (网元/机架#-子机架#-机盘#-端口#, 端 2.3.4 事件类型

“事件类型”条目指出告警的类型,包括下列的五种:

? 服务质量 ? 通讯 ? 处理差错 ? 设备

硬件或控制系统差错可能造成设备告警。传输差错可能造成通讯告警。门限问题可能造成服务质量告警。 2.3.5 可能原因

可能原因说明了故障的原因(如信号丢失)。 2.3.6 保留状态

操作员可以对一个当前告警进行保留,以确保对此告警单独负责。这种情况下,

第 9 页 共 167 页

所选中的告警的保留状态由NRSV(未保留)转变为RSV(保留)。 操作员仅可对此前已保留的告警进行解除保留。 2.3.7 清除状态

一个尚未解决的当前告警被看作是NCLR(未清除)。一旦资源中的问题不再存在,告警状态转变为CLR(已清除)。 2.3.8 确认状态

未确认的告警在列表中标记为NACK,操作员可以对其进行确认。选中的告警状态发生改变,由NACK(未确认)变为ACK(已确认)。 注意对已清除的告警进行确认是隐含的归档操作。因此,确认操作实际上将告警归档,并使其从当前告警列表中消失。

2.4 告警级别分配(ASAP)

ASAP是包含可能告警原因的列表,告警按照其业务相关性分配其告警级别。告警在CT(维护终端)上根据分配的ASAP进行指示,显示所分配的级别,或根本不进行指示。ASAP被用作一个告警过滤器。 2.4.1 默认和灵活使用ASAPs ASAP的类型分为两种:

? 预定义默认ASAP:包含所有使用ASAP的资源。这些ASAP的属性

为只读,即,可对其内容进行修改,但不可以将其移除。 ? 灵活使用ASAP:由用户创建。自由使用ASAP同样可由管理系统进

行删除。

告警级别和可能原因的数目是固定的。其特性不能被修改。用户仅可

以利用ASAP功能修改被分配给可能原因的告警级别,而无法对这些级别和原因本身进行添加、移除或修改。

下列的五种ASAP被配置为默认ASAP:

--- ASAP:无告警

这种类型的ASAP阻止了告警指示,为以下项目的默认ASAP --- PPITTP

--- 基本告警

第 10 页 共 167 页

--- TU-x CTPs

--- VC-x TTP (供PDH端口及SDH组装器使用) --- Ex CTPs --- Ex TTPs --- ASAP:基本告警

通过这种类型的ASAP可以对所有的基本通讯告警(AIS、SSF和RDI被禁用)和设备告警进行指示。

这种类型的ASAP为以下项目的默认ASAP ? 设备告警

? ESTTP、OSTTP、RSTTP、AU-4 CTP ? Trail监视器(POM)

? TandemConnection监视器(TCM、TCT) ? 监视未配置监视器(SUT) ? UAT告警 --- ASAP:远程告警

通过这种类型的ASAP可以对所有的基本通讯告警、SSF(AIS和RDI被禁用)和设备告警进行指示。 --- ASAP:所有告警

通过这种类型的ASAP可以对所有的告警进行指示。 这种类型的ASAP是MSTTP的默认ASAP。 --- ASAP:无业务告警

通过这种类型的ASAP可以对除SSF、冗余时钟故障A/B和冗余矩阵A/B故障外的所有的告警进行指示。

2.4.2级别

发出告警的对象应参照默认ASAP,以下情况除外:

--- 当对象无法评估ASAP,如,由于管理器的错误提供,告警以级别“未知”发出。 --- 未使用指向ASAP的基准指针的对象,其所发出的告警带有内置的级别值(如未个别说明,该值与ASAP中“所有告警”中记录的级别相对应)。这些对象中包括同步的功能对象(可能原因:“频率偏置”、“信号丢失”、“业务信号故障”)和当前数据对象(可能原因:

第 11 页 共 167 页

“不可用”)。

2.4.3预定义ASAP的内容

表1 设备告警

可能原因 背板故障 电池故障 冷却风扇故障 熔断器故障 内部通信故障 LAN故障 无RTC同步 电源问题 光连接器盖板打开 冗余时钟故障A 冗余时钟故障B 冗余矩阵A故障 冗余矩阵B故障 可替换单元丢失 (SA) 可替换单元丢失 (NSA) 可替换单元故障 可替换单元类型失配 资源隔离* 同步资源失配 定时问题 存在未配置设备 无告警 NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) ASAP 基本的告警 无远程告警 MAJ(严重) MAJ(严重) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) 所有告警 MAJ(严重) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MAJ(严重) MAJ(严重) MIN(次要) MIN(次要) MIN(次要) MIN(次要) NAL(未告警) MAJ(严重) MAJ(严重) MAJ(严重) NAL(未告警) MIN(次要) MIN(次要) MIN(次要) NAL(未告警) MAJ(严重) MAJ(严重) MAJ(严重) NAL(未告警) WAR(警告) WAR(警告) WAR(警告) - NAL(未告警) NAL(未告警) NAL(未告警) - MIN(次要) MAJ(严重) WAR(警告) - MIN(次要) MAJ(严重) WAR(警告) - MIN(次要) MAJ(严重) WAR(警告) *该告警显示为“危险”级别。

表2 通信告警

可能原因 告警指示信号 通信协议错误 连接失败 信号劣化 比特误码率过限 帧丢失 复帧丢失 指针丢失 信号丢失 信号丢失 (内置级别)* 路径识别失配 净负荷类型失配 远程缺陷指示 无告警 NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) ASAP 基本的告警 无远程告警 NAL(未告NAL(未告警) 警) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) MIN(次要) MIN(次要) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) 所有告警 MAJ(严重) MAJ(严重) MAJ(严重) MIN(次要) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) NAL(未告警) MIN(次要) MIN(次要) MIN(次要) NAL(未告警) MAJ(严重) MAJ(严重) MAJ(严重) NAL(未告警) MAJ(严重) MAJ(严重) MAJ(严重) NAL(未告警) NAL(未告NAL(未告WAR(警告) 第 12 页 共 167 页

业务信号故障 业务信号故障 (内置级别)* 发射机劣化 发射机故障 附属资源不可用 不可用 未配置 频率偏置 (内置级别)* 定时源丢失 (内置级别)* 警) NAL(未告NAL(未告警) 警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) WAR(警告) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) 警) MAJ(严重) MAJ(严重) NAL(未告警) MIN(次要) MIN(次要) MIN(次要) WAR(警告) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) WAR(警告) MAJ(严重) MAJ(严重) MAJ(严重) MAJ(严重) NAL(未告警) MIN(次要) MIN(次要) MIN(次要) NAL(未告警) WAR(警告) WAR(警告) WAR(警告) *在ASAP中不可配置

表3 处理错误告警

可能原因 连接阻塞 保护阻塞 软件下载失败 软件环境问题 无告警 NAL(未告警) NAL(未告警) NAL(未告警) NAL(未告警) ASAP 一次告警 无远程告警 MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) MIN(次要) WAR(警报) WAR(警报) 所有告警 MIN(次要) MIN(次要) MIN(次要) WAR(警报)

2.5 站告警

每个系统均配置有两盏站告警灯,用于指示活动的告警。告警灯设置在机架的顶

部的管理单元。黄色灯表示非紧急告警、红色灯表示紧急告警。

以下表格列出了告警列表上显示的可能告警原因,以及根据默认的ASAP“all alarms”所决定的告警级别想对应的相关站告警灯亮起情况。

改变一个对象(TP、设备部分或其他)的ASAP并不改变相关

的站告警。例外:如果对象所分配的ASAP对特定的告警进行抑制,站告警灯同样不会对告警进行指示。

表1 设备告警

可能原因 背板故障 LAN故障 无RTC同步 光连接器盖板打开 根据ASAP“所有告警”确定的级别 严重 次要 次要 严重 第 13 页 共 167 页

站告警灯 紧急 紧急 非紧急 紧急 电源问题 严重 冗余时钟故障A 次要 冗余时钟故障B 次要 冗余矩阵A故障 次要 冗余矩阵B故障 次要 可替换单元丢失 严重 可替换单元丢失(保护机盘) 次要 可替换单元故障 严重 可替换单元类型失配 警告 资源隔离 危险(内部,非来自ASAP) 同步源失配 次要 定时问题 严重 未配置设备存在 警告 紧急 紧急 紧急 紧急 紧急 紧急 紧急 紧急 紧急 - - 紧急 紧急 表2 设备告警

可能原因 告警指示信号 通信协议错误 比特误码率过限 连接失败 远端接收故障 频率偏置 帧丢失 复帧丢失 指针丢失 信号丢失 定时源丢失 净负荷失配 业务信号故障 信号劣化 路径识别失配 发射机劣化 发射机故障 不可用 附属资源不可用 未配置 根据ASAP“所有告警”确定的级别 严重 严重 严重 次要 警告 次要 严重 严重 严重 严重 次要 严重 严重 次要 严重 警告 严重 严重 严重 严重 站告警灯 非紧急 紧急 紧急 紧急 紧急 - 紧急 紧急 紧急 紧急 - 紧急 紧急 非紧急 紧急 非紧急 紧急 紧急 - 紧急

表3 处理错误告警

可能原因 连接阻塞 保护阻塞 软件下载失败 软件环境问题 根据ASAP“所有告警”确定的级别 次要 次要 警报 次要 站告警灯 - - 紧急 紧急 表8 服务质量告警

可能原因 根据ASAP“所有告警”确定第 14 页 共 167 页

站告警灯 门限超过 的级别 -*) 紧急 *)门限超过告警的级别将在门限表中定义,而不是ASAP中进行定义。

2.6 映射表:维护终端上的TP名称

维护终端(CT)上的TP名称反映了作为用户接口的软件模型。因此,它们随ITU-T建议中给出的TP名称而改变。下表列出了在两者之间TP名称映射

表1 PDH TP

维护终端 P e4MonCTP e4MonCTP eCTP e1MonCTP e4ATTP e3ATTP e2ATTP p12 p31 Vc4 Vc3 Vc12 ITU-T PPITTP E4 CTP E31 CTP E32 CTP E1 CTP E4 TTP E3 TTP E2 TTP p12 CTP p31 CTP VC-4 TTP VC-3 TTP VC-12 TTP

表2 SDH TP

维护终端 EIS Ops RST MST Au4/Au4P Au4/4c ModVc4 ModTug3 ModTug2 ModTu3 ModTu12 ITU-T ESTTP OSTTP RSTTP MSTTP AU-4 CTP AU-4-4c CTP VC-4 TTP TUG-3 TUG-2 TU-3 CTP TU-12 CTP

第 15 页 共 167 页

通信告警

板卡类型与可能原因相关性

第 21 页 共 167 页

通信告警

板卡类型与可能原因相关性(续)

第 22 页 共 167 页

通信告警

板卡类型与可能原因相关性(续)

第 23 页 共 167 页

上表中图例

AIS 告警指示信号 CCB 交叉连接阻塞 CCF 交叉连接失败 CPB 保护阻塞 CPE 通信协议错误 DS 信号劣化 EBER 比特误码率过限 FO 频率偏置 LOF 帧丢失 LOM 复帧丢失 LOP 指针丢失 LTS 定时源丢失 PLTM 净负荷类型失配 SSF 业务信号故障 TD 发射机劣化 TF 发射机故障 TIM 路径识别失配 UAT FE 不可用时间,远端 UAT NE 不可用时间,近端 URU 附属资源不可用 UNEQ 未配置

图1

服务中的信令和维护

第 24 页 共 167 页

图1图例 ● 检测 ○ 再生

“1” 全“1”(AIS)信号的插入 AU 管理单元

第 25 页 共 167 页

HOVC 高阶虚容器 HP 高阶通道 HPA 高阶通道适配 HPC 高阶通道连接 HPOM HPT HSUG

LOF LOMF LOP LOS LOVC LP LPA LPC LPOM LPT LSUG

MSA MST OOF

REI RDI RFI 高阶通道开销监视器 高阶通道终端

高阶监控未配置发生器 帧丢失

复帧丢失(或汇接连接丢失) 指针丢失 信号丢失 低阶虚容器 低阶通道 低阶通道适配 低阶通道连接 低阶通道开销监视器 低阶通道终端

低阶监控未配置发生器 复用段适配 复用段终端 帧失步 远程差错指示(以前是FEBE) 远程缺陷指示(以前是FERF) 远程故障指示

第 26 页 共 167 页

RST 再生器段终端

PLTM 净负荷类型失配(SLM) PTM 通道踪迹失配(TIM) SLM 信号标签失配 SPI 物理段接口

TCM 汇接连接监视 TCT 汇接连接终端 TIM 路径识别失配 TU 支路单元

UNEQ 每G. 709未配置信号 (或未配置汇接连接) VC 虚容器

第 27 页 共 167 页

4 设备告警/处理故障告警

4.1 电池故障(BF)

事件类型: 设备告警 可能原因:电池故障(BF) 机盘类型:Congi机盘(CONGI) 引起告警指示的条件:

外部电池电源问题。输入中没有电源(48V)。 对业务的影响:

系统仍可操作,传输未受影响,但电源系统无冗余运行。如果第二块Congi机盘同时故障,所有通过该子架的业务均会受到影响。 建议采取的措施:

1 检查电源和Congi机盘之间的接线情况。

2 如果接线不存在问题,根据附录18中的要求更换Congi机盘。

4.2 背板故障(BKF)

事件类型: 设备告警

可能原因:背板故障(BKF)

机盘类型:SMX矩阵机盘(SMX)- 总线终端盘问题 引起告警指示的条件:

内部总线故障。背板或总线终端机盘故障。 对业务的影响:

无法再对SMX矩阵机盘和I/O机盘进行配置。 建议采取的措施:

请致电用户当地客户支持中心以获得协助。

第 28 页 共 167 页

4.3 冷却风扇故障(CCF)

事件类型: 环境告警

可能原因:冷却风扇故障(CCF) 机盘类型:Congi机盘(CONGI) 引起告警指示的条件:

风扇单元故障(风扇单元上告警LED显示为红色) 对业务的影响:

无。

建议采取的措施:

更换风扇单元或请致电用户当地客户支持中心以获得协助。

4.4 熔断器故障(FF)

事件类型: 设备告警 可能原因:熔断器故障(FF) 机盘类型:Congi机盘(CONGI)

仅在Congi机盘的电缆和外部48V电源连接时显示该告警。

引起告警指示的条件: 熔断器故障。 对业务的影响:

系统仍可操作,传输未受影响,但电源系统无冗余运行。如果第二块Congi机盘同时故障,所有通过该子机架的业务均会受到影响。 建议采取的措施: 更换熔断器。

4.5 高激光温度(HLT)

事件类型: 设备告警

第 29 页 共 167 页

可能原因:激光器温度高(HLT) 机盘类型:STM-16机盘 引起告警指示的条件: 机盘内激光器温度高

对业务的影响: 业务不受影响。 建议采取的措施:

检查机盘的收光功率,若在工作范围内,更换该机盘。

4.6 LAN故障(LAN)

事件类型: 设备告警 可能原因:LAN故障(LAN) 机盘类型:Congi机盘(CONGI) 引起告警指示的条件:

由于连至Congi机盘中的线缆问题(10BASE-II或10BASE-T) 对业务的影响: 业务不受影响。 建议采取的措施: 检查上述的线缆

4.7 LAN故障(LAN)

事件类型: 设备告警 可能原因:LAN故障(LAN) 机盘类型:管理单元(NAU) 引起告警指示的条件:

由于以下设备中的线缆问题(如两根线缆中的一根可能未插上),NAU之间的LAN连接故障:

第 30 页 共 167 页

--- 外部LAN线缆(PC-1上的10或PC-2上的LEA) --- 内部LAN线缆(PC-1上的11或PC-2上的LIA) 两个NAU均会产生此告警。 对业务的影响: 业务不受影响。 建议采取的措施: 1.检查上述的线缆

2.请致电用户当地客户支持中心以获得协助。

客户支持中心维护人员须了解,在对NAU-NAU连接进行修理时,如

果修理失败,可能发生出现两个主动NAU的问题,造成第二个NAU-NAU连接丢失。因此,在开始修复前,应考虑关闭被动NAU。

4.8 无RTC同步(NRTCS)

事件类型: 设备告警

可能原因:无RTC同步(NRTCS) 机盘类型:管理单元(NAU) 引起告警指示的条件:

运行在主NAU上的xntpd监控(ntp daemon)进程指示发生了定时源问题。 因可以配置多个NTP业务,其中某个业务丢失或无NTP时钟的情况下,均会产生NRTCS告警。 可能原因为:

--- 定时服务器的电源故障 --- 定时服务器的LAN通信问题 --- 定时服务器上的NTP问题 两个NAU均会产生此告警。 对业务的影响:

第 31 页 共 167 页

系统仍可操作,传输未受影响。如果所有配置的NTP服务器均不再可及,两个NAU将按照定义的时间漂移改变为本地定时选择。该时间漂移可能影响性能测量的精度。

备用NAU将不会报告RTC告警。切换NAU时,告警不会被转移到新的主用NAU上,而是会继续附着在新的备用NAU上。 建议采取的措施:

请致电用户当地客户支持中心以获得协助。

仅处理关于主用NAU的NRTCS告警,不处理关于备用NAU的该告

警。

4.9 光连接器罩打开(OCCO)

事件类型: 设备告警

可能原因:光连接器盖板打开(OCCO) 机盘类型:光放大器(OA) 引起告警指示的条件: 激光器保护盖板松开。 对业务的影响:

激光器不再运行,所有业务中断。 建议采取的措施:

固定激光盖板并用螺钉上紧。

4.10 电源问题(POP)

事件类型: 设备告警 可能原因:电源问题(POP) 机盘类型:电源转换器(CONV) 引起告警指示的条件: 电源转换器机盘硬件故障。

第 32 页 共 167 页

对业务的影响:

系统仍可操作,传输未受影响,但电源系统在两个子架中分别无冗余运行。如果这一对子机架中的第二个电源转换器同时故障,所有通过该对子架的业务均会受到影响。 建议采取的措施:

按照附录15中的要求更换电源转换器。

子架IOS2400中的POP告警限制:

无法确定POP告警是分别产生自109插槽或209插槽中的转换器,或是产生自111插槽或211插槽中的转换器。这一情况仅能通过转换器上的红色LED确定。该行为独立于主用SPB。

子架IOS45中的POP告警限制:

无法确定POP告警是分别产生自111插槽或112插槽中的转换器,或产生自211插槽或212插槽的转换器。这一情况仅能通过转换器上的红色LED确定。该行为独立于主用SPB。

4.11 资源隔离(Q3)

事件类型: 设备告警 可能原因:资源隔离(Q3)

机盘类型:维护终端(1320CT)或网管(1353NM) 引起告警指示的条件:

由于下列原因,1320CT/1353NM和设备Q3口之间的连接故障 ---线缆连接问题 --- QIA进程故障 --- MIB故障 对业务的影响: 业务不受影响。

第 33 页 共 167 页

建议采取的措施:

1 1320CT/1353NM和设备之间接线情况。

2 如果接线不存在问题,请致电用户当地客户支持中心以获得协助。

1320CT/1353NM和设备Q3口之间连接出现短时(约20至30秒)中

断后,因为AU未诊测到该中断,AU可能会拒绝1320CT/1353NM的重新连接。 1320CT/1353NM和设备Q3口之间的LAN线缆中断至少30秒。这样,随后在1320CT/1353NM和AU端均能对重新连接进行正确处理。

4.12 冗余时钟故障A/B(RCFA/B)

事件类型:设备告警

可能的原因: 冗余时钟故障 A/B(RCFA/B) 机盘类型:扩展机盘(ETB) 引起告警指示的条件: ETB没有收到冗余时钟信号。 对业务的影响: 时钟冗余无法利用。

如果未配置和启用保护装置,就会造成传输干扰。 建议采取的措施:

检查是否只影响了单个机盘还是影响了整个系统:

- 如果只影响了单个机盘,则按照附录7的说明更换机盘。

- 如果不是,则检查给受影响的子系统提供冗余时钟信号的时钟分配硬件的共用板卡,即CDB、PCB、MCB和电缆。

- 如果仍未检查出问题,呼叫当地的客户服务中心寻求帮助。

事件类型:设备告警

可能的原因:冗余时钟故障 A/B(RCFA/B) 机盘类型:内部保护机盘(IPBB)

第 34 页 共 167 页

引起告警指示的条件: 机盘没有收到冗余时钟信号。 对业务的影响: 传输干扰 建议采取的措施:

检查是否只影响了单个机盘还是影响了整个系统:

- - -

如果只影响了单个机盘,则按照附录12的说明更换机盘。 如果不是,则检查给受影响的子系统提供冗余时钟信号的时钟分配硬件的共用板卡,即CDB、PCB、MCB和电缆。

如果仍未检查出问题,呼叫当地的客户服务中心寻求帮助。

事件类型:设备告警

可能的原因:冗余时钟故障A/B(RCFA/B)

机盘类型:矩阵机盘(MXB16, EXBB, EXB32, CXB32, CXB40) 引起告警指示的条件:

矩阵机盘没有收到冗余时钟信号。 对业务的影响: 传输干扰。 建议采取的措施:

检查是否只影响了单个机盘还是影响了整个系统:

- - -

如果只影响了单个机盘,则按照附录8的说明更换机盘。 如果不是,则检查给受影响的子系统提供冗余时钟信号的时钟分配硬件的共用板卡,即CDB、PCB、MCB和电缆。

如果仍未检查出问题,呼叫当地的客户服务中心寻求帮助。

事件类型:设备告警

可能的原因:冗余时钟故障A/B(RCFA/B) 机盘类型:MS保护机盘(MSPB) 引起告警指示的条件: MSPB没有收到冗余时钟信号。 对业务的影响:

第 35 页 共 167 页

传输干扰。 建议采取的措施:

检查是否只影响了单个机盘还是影响了整个系统:

- - -

如果只影响了单个机盘,则按照附录10的说明更换机盘。 如果不是,则检查给受影响的子系统提供冗余时钟信号的时钟分配硬件的共用板卡,即CDB、PCB、MCB和电缆。

如果仍未检查出问题,呼叫当地的客户服务中心寻求帮助。

第 36 页 共 167 页

事件类型:设备告警

可能的原因:冗余时钟故障A/B(RCFA/B) 机盘类型:保护/时钟机盘(PCB) 引起告警指示的条件: PCB没有收到冗余时钟信号。 对业务的影响: 传输干扰。 建议采取的措施:

检查是否只影响了单个机盘还是影响了整个系统:

- - -

事件类型:设备告警

可能的原因:冗余时钟故障A/B(RCFA/B) 机盘类型:复用器机盘(MUX2) 引起告警指示的条件:

MUX2没有收到冗余时钟信号。 对业务的影响: 传输干扰。 建议采取的措施:

检查是否只影响了单个机盘还是影响了整个系统:

- - -

如果只影响了单个机盘,则按照附录6的说明更换机盘。 如果不是,则检查给受影响的子系统提供冗余时钟信号的时钟分配硬件的共用板卡,即CDB、PCB、MCB和电缆。

如果仍未检查出问题,呼叫当地的客户服务中心寻求帮助。 如果只影响了单个机盘,则按照附录12的说明更换机盘。 如果不是,则检查给受影响的子系统提供冗余时钟信号的时钟分配硬件的共用板卡,即CDB、PCB、MCB和电缆。

如果仍未检查出问题,呼叫当地的客户服务中心寻求帮助。

第 37 页 共 167 页

事件类型:设备告警

可能的原因:冗余时钟故障A/B(RCFA/B) 机盘类型:STM-1E, STM-10机盘 引起告警指示的条件:

STM-1没有收到冗余时钟信号。 对业务的影响: 时钟冗余度无法利用。

如果未配置和启用保护装置,这就会造成传输干扰。 建议采取的措施:

检查是否只影响了单个机盘还是影响了整个系统:

- - -

事件类型:设备告警

可能的原因:冗余时钟故障A/B(RCFA/B) 机盘类型:STM-16机盘 引起告警指示的条件:

STM-16机盘没有收到冗余时钟信号。 对业务的影响: 时钟冗余度无法利用。

如果未配置和启用保护装置,这就会造成传输干扰。 建议采取的措施:

检查是否只影响了单个机盘还是影响了整个系统:

- -

如果只影响了单个机盘,则按照附录2的说明更换机盘。 如果不是,则检查给受影响的子系统提供冗余时钟信号的时钟分配硬件的共用板卡,即CDB、PCB、MCB和电缆。

第 38 页 共 167 页

如果只影响了单个机盘,则按照附录2或附录3的说明更换机盘。 如果不是,则检查给受影响的子系统提供冗余时钟信号的时钟分配硬件的共用板卡,即CDB、PCB、MCB和电缆。 果仍未检查出问题,呼叫当地的客户服务中心寻求帮助。

- 如果仍未检查出问题,呼叫当地的客户服务中心寻求帮助。

4.13 冗余矩阵故障 A/B(RMFA/B)

事件类型:设备告警

可能的原因: 冗余矩阵 A/B故障(RMFA/B) 机盘类型:扩展机盘(ETB) 引起告警指示的条件:

ETB从矩阵副本A/B接收不到有效的GTI信号。 对业务的影响:

矩阵冗余度无法利用。但对信号传输没有影响。 建议采取的措施:

- -

检查矩阵和ETB之间的电缆连接,看是否出错。

用矩阵维护工具(参看《操作手册管理》 “传输维护”一章)获取更多关于该问题的详细信息。如果问题还是无法解决,呼叫当地的客户服务中心寻求帮助。

CT管理选项中的矩阵维护工具仅限管理员使用。维护工具使用不当会造成通信中断。

事件类型:设备告警

可能的原因:冗余矩阵 A/B故障(RMFA/B)

机盘类型:矩阵机盘(CXB32,CXB40,EXBB,EXB32,MXB16) 引起告警指示的条件:

矩阵机盘接收不到有效的GTI信号。 对业务的影响:

矩阵冗余度无法利用。但对信号传输没有影响。 建议采取的措施:

- -

检查矩阵的电缆连接,看是否出错。

用矩阵维护工具(参看《操作手册管理》“传输维护”一章)获取更多关于该问题的详细信息。如果问题还是无法解决,呼叫当地的

第 39 页 共 167 页

客户服务中心寻求帮助。

CT管理中的矩阵维护工具仅限管理员使用。维护工具使用不当会造成通信中断。

事件类型:设备告警

可能的原因:冗余矩阵 A/B故障(RMFA/B) 机盘类型:SMX 矩阵机盘(SMX) 引起告警指示的条件:

SMX 矩阵机盘从矩阵副本A/B接收不到有效的GTI信号,或者SMX 矩阵机盘

和通用I/O 机盘之间的NGI内部连接出现故障。 对业务的影响:

矩阵冗余度无法利用。但对信号传输没有影响。 建议采取的措施:

- -

检查矩阵和SMX 机盘之间的电缆连接,看是否出错。

用矩阵维护工具(参看《操作手册管理》“传输维护”一章)获取更多关于该问题的详细信息。根据其中的提示更换电缆或机盘解决

问题。如果问题还是无法解决,呼叫当地的客户服务中心寻求帮助。

CT管理中的矩阵维护工具仅限管理员使用。维护工具使用不当会造成通信中断。

事件类型:设备告警

可能的原因:冗余矩阵 A/B故障(RMFA/B) 机盘类型:复用器机盘(MUX2) 引起告警指示的条件:

MUX2机盘从矩阵副本A/B接收不到有效的GTI信号。 对业务的影响:

矩阵冗余度无法利用。但对信号传输没有影响。 建议采取的措施:

检查矩阵和MUX2之间的电缆连接,看是否出错。

第 40 页 共 167 页

本文来源:https://www.bwwdw.com/article/3sx6.html

Top