UAP8100故障处理思路指导书 - 客服篇 - 图文

更新时间:2023-10-11 19:02:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

资料编码 使用对象 编写部门

产品名称 产品版本 资料版本 UAP8100故障处理思路指导书

------客服篇

拟 制: 审 核: 审 核: 批 准: 张熙 日 期: 日 期: 日 期: 日 期: 2007-8-24

华 为 技 术 有 限 公 司

版权所有 侵权必究

UAP8100故障处理思路指导书---客服篇 内部公开

修订记录

日期 2007-8-24 修订版本 V1.0 初稿完成 描述 张熙 作者 华为机密,未经许可不得扩散

UAP8100故障处理思路指导书---客服篇 内部公开

目 录

第1章 故障定位全流程 .............................................................................................................. 1

1.1 客服应用实现方案说明 ......................................................................................................1 1.2 故障处理点分析 ..................................................................................................................3 第2章 时钟类问题 ..................................................................................................................... 7

2.1 问题处理说明 ......................................................................................................................7 2.2 MGC时钟问题解析 ............................................................................................................7

2.2.1 MGC时钟原理与连线 .............................................................................................7 2.2.2 故障点现象与解析 ...................................................................................................9 2.2.3 典型案例分析 ........................................................................................................ 10 2.3 MGW时钟问题解析 ........................................................................................................ 10

2.3.1 MGW时钟原理与连线 ......................................................................................... 10 2.3.2 故障点现象与解析 ................................................................................................ 12 2.3.3 典型案例分析 ........................................................................................................ 14

第3章 硬件类问题 ................................................................................................................... 16

3.1 问题处理说明 ................................................................................................................... 16 3.2 MGC加载类问题解析 ..................................................................................................... 16

3.2.1 加载原理与过程 .................................................................................................... 16 3.2.2 故障点现象与解析 ................................................................................................ 18 3.2.3 典型案例分析 ........................................................................................................ 20 3.3 MGW加载类问题解析 .................................................................................................... 21

3.3.1 加载原理与过程 .................................................................................................... 21 3.3.2 故障点现象与解析 ................................................................................................ 23 3.3.3 典型案例分析 ........................................................................................................ 24

第4章 SIP坐席类问题 ............................................................................................................ 26

4.1 问题处理说明 ................................................................................................................... 26 4.2 SIP信令触发类问题解析 ................................................................................................ 26

4.2.1 基本原理与分析流程 ............................................................................................ 26 4.2.2 故障点现象与解析 ................................................................................................ 26 4.3 SIP终端注册类问题 ........................................................................................................ 27

4.3.1 基本原理与分析流程 ............................................................................................ 27 4.3.2 故障点现象与解析 ................................................................................................ 27 4.4 SIP基本呼叫类问题 ........................................................................................................ 28

4.4.1 基本原理与分析流程 ............................................................................................ 28

华为机密,未经许可不得扩散

UAP8100故障处理思路指导书---客服篇 内部公开

4.4.2 故障点现象与解析 ................................................................................................ 28

第5章 对接类问题 ................................................................................................................... 30

5.1 问题处理说明 ................................................................................................................... 30 5.2 UAP8100与外部设备对接问题解析(窄带) ................................................................... 30

5.2.1 基本原理与分析流程 ............................................................................................ 30 5.2.2 故障点现象与解析 ................................................................................................ 31 5.2.3 典型案例分析 ........................................................................................................ 33 5.3 UAP8100与外部设备对接问题解析(宽带) ................................................................... 34

5.3.1 基本原理与分析流程 ............................................................................................ 34 5.3.2 故障点现象与解析 ................................................................................................ 35 5.3.3 典型案例分析 ........................................................................................................ 36 5.4 MGC与MGW对接问题解析 ......................................................................................... 36

5.4.1 基本原理与分析流程 ............................................................................................ 36 5.4.2 故障点现象与解析 ................................................................................................ 37 5.4.3 典型案例分析 ........................................................................................................ 38 5.5 UAP8100与CTI对接问题解析 ..................................................................................... 39

5.5.1 基本原理与分析流程 ............................................................................................ 39 5.5.2 故障点现象与解析 ................................................................................................ 39 5.5.3 典型案例分析 ........................................................................................................ 40

第6章 资源类问题 ................................................................................................................... 42

6.1 问题处理说明 ................................................................................................................... 42 6.2 MGW TID资源问题 ......................................................................................................... 42

6.2.1 原理与流程 ............................................................................................................ 42 6.2.2 故障点现象与解析 ................................................................................................ 43 6.2.3 典型案例分析 ........................................................................................................ 44 6.3 VRB站点资源问题 .......................................................................................................... 44

6.3.1 原理与流程 ............................................................................................................ 44 6.3.2 故障点现象与解析 ................................................................................................ 46 6.3.3 典型案例分析 ........................................................................................................ 47

第7章 放音类问题 ................................................................................................................... 49

7.1 问题处理说明 ................................................................................................................... 49 7.2 基本音问题解析 ............................................................................................................... 49

7.2.1 基本音放音原理及流程 ........................................................................................ 49 7.2.2 故障点现象与解析 ................................................................................................ 49 7.2.3 典型案例分析 ........................................................................................................ 51 7.3 指定文件放音问题解析 ................................................................................................... 53

华为机密,未经许可不得扩散

UAP8100故障处理思路指导书 内部公开

(6) 若上一步中可以跟到VRB消息,且消息中可以看到CTI下发的放

音消息,而VRB在读取IO文件时失败,则是VRB在读取语音文件时出错,如图1-9所示。相关故障处理参见“放音类问题”。

图1-9 VRB消息跟踪示意图

(7) 若放音成功后转人工失败,可以通过跟踪SIP信令、INTESS消息

查看可能的原因。首先跟踪INTESS消息,若CTI没有下发SP_SETUP消息,则需要确认CTI侧没有下发消息的原因,问题可能出在UAP与CTI的对接上,相关故障处理请参见“对接类问题”;若CTI侧已下发SP_SETUP消息呼叫相应空闲坐席(从消息中可以看到主被叫号码),但SIP跟踪消息中UAP呼叫SIP坐席电话失败,则可能的原因是UAP与SIP电话之间的问题,相关故障处理参见“SIP坐席类问题”。

2008-01-11

华为机密,未经许可不得扩散

第6页, 共58页

UAP8100故障处理思路指导书 内部公开

第2章 时钟类问题

2.1 问题处理说明

当UAP8100提供窄带信令与其他设备对接时,需要配置时钟同步系统。时钟系统故障可能引起的故障包括:接续单通、通话有杂音甚至中断、中继滑帧、误码率增大、信令链路断链、链路频繁倒换、信令负荷拥塞等。而且这些故障在开局调测时往往容易忽视,因此,我们把时钟的检查和排故从硬件问题中单独出来讨论。

2.2 MGC时钟问题解析

2.2.1 MGC时钟原理与连线

MGC时钟系统涉及到CKI和EPI两种单板,CKI通过2M线从EPI或MGW获取时钟信号,再通过8k内部时钟线将时钟分发到其它有窄带链路的框(通过EPI板开窄带链路,没有开链路的框可以不设置时钟分发)。 MGC从EPI获取线路时钟的连线方法如图2-1所示,由于一对EPI板不能同时出线,引入时钟的EPI板应使用主用的那块单板(即对外出线的EPI板):

图2-1 MGC获取线路时钟示意图

MGC从MGW获取时钟如图2-2所示,由于MGC没有2M输出,因此如果局方只提供一个BITS时钟时,应采用这种连接方法,即BITS先接MGW,再由MGW的2M-OUT输出时钟给MGC。

2008-01-11

华为机密,未经许可不得扩散

第7页, 共58页

UAP8100故障处理思路指导书 内部公开

MGC CKIBITS1BITS2LINE1LINE213579111315246810121416MGC CKIBITS1BITS2LINE1LINE2135791113152MGW CKIMGW CKIclk_out0clk_out08k_In18k_In22M_IN2M_OUTclk_out2clk_out168101214168k_In18k_In22M_IN2M_OUTclk_out24clk_out1

图2-2 MGC从MGW获取时钟示意图

MGC存在多框的情况下,CKI获取外部时钟后,还需要把时钟信号分发到其它开有窄带链路的框,时钟分发线的连法如图2-3所示:

CKIBITS1BITS2LINE1LINE213579111315246810121416CKIBITS1BITS2LINE1LINE213579111315246810121416EPIEPI2M-12M-12M-22M-28K-2E1/T1E1/T18K-18K-18K-2 图2-3 MGC时钟分发线连接示意图

MGC时钟数据配置涉及到的命令主要有三条: 设置时钟板配置参数:SET CKICFG; 增加时钟源配置:ADD BOSRC;

2008-01-11

华为机密,未经许可不得扩散

第8页, 共58页

UAP8100故障处理思路指导书 内部公开

增加时钟分发配置:SET CLKSRC。

2.2.2 故障点现象与解析

可能造成MGC时钟故障的原因包括:

(1) 时钟源:时钟丢失、时钟不稳定、信号质量差; (2) 时钟锁相:CKI时钟板故障、EPI板时钟失锁;

(3) 时钟传输:提取线路时钟的接口单板(EPI)故障或者线路中断、

时钟接口单板到时钟板的配线连接故障;

(4) 数据配置:参考源设置错误、时钟板工作模式设置错误、线路时钟

源设置错误。 处理过程如下图2-4所示:

图2-4 MGC时钟故障处理示意图

? 告警台有“主用参考源频偏超出范围” 告警

如果有此类告警,说明时钟信号有丢失过或者质量较差,请与上级局联系解决。

? 告警台有“时钟丢失”、“时钟失锁”告警

(1) 检查数据配置,SET CKICFG、ADD BOSRC、SET CLKSRC中各

项参数与实际参考源、连线是否一致;

(2) 如果多个框内的业务板或EPI板上报时钟失锁或时钟丢失,说明

CLK板故障或CLK板上的配线松动;如果某个框内的多个业务板上报时钟丢失,说明EPI板故障或板上的配线松动;如果某个框内的某个业务板上报时钟丢失,请检查该单板是否插紧或故障。

? 使用DSP CLKPH命令检查发现时钟锁定状态不为LOCKED

时钟锁相状态不正确,说明CKI板获取时钟源出错,检查步骤:

2008-01-11

华为机密,未经许可不得扩散

第9页, 共58页

UAP8100故障处理思路指导书 内部公开

(1) 通过DSP BRD/LST BRD命令检查EPI、CKI单板的状态是否正常,

是否有相关告警,可用调换单板的方法测试;

(2) 检查CKI时钟单板到EPI板的时钟配线连接是否正常,接头是否接

合紧密。可更换时钟配线测试;

(3) 若上三项检查后均正常,可能和时钟源有关,请与上级局联系解决。

2.2.3 典型案例分析

现象描述: 告警信息:

系统出现时钟源丢失故障告警。 “时钟源丢失”告警。 分析原因如下:

原因分析:

1、时钟线缆故障; 2、时钟单板故障;

3、锁时钟的业务板EPI板故障。

1、查看告警台,发现上报告警的单板均在一框内,说明可能是说明EPI板故障或板上的配线松动;

处理过程:

2、检查该框EPI板为正常状态;

3、对照时钟分发线的图示,CKI到EPI的连线是正确的;

4、换掉CKI到EPI的时钟分发线后,告警消失,证明是CKI到EPI的时钟分发钟有问题。

2.3 MGW时钟问题解析

2.3.1 MGW时钟原理与连线

URP8100 MGW设备的时钟系统内部信号如下: 外部时钟源信号→CLK时钟板→NET网板→业务单板

其中外部时钟信号可以根据组网进行选择,由CLK单板完成时钟锁相后,通过插框背板(主控框)或者外部配线(主控框与其它插框之间)送给NET单板,由NET进行分频和时钟信号驱动后,输出各单板所需要的时钟信号。

MGW内部时钟线包括时钟分发线和8kHz线路时钟线。时钟分发线连接CLK和NET,用于向各URP8100 MGW机框提供时钟。8k线路时钟线主要为主控框的CLK板提供8k线路时钟信号连接,8k线路时钟由E32、T32或S2L单板提供。

当局方提供BITS时钟源时,MGW也可以从BITS获取时钟,再通过2M-OUT接口为MGC提供时钟信号。 MGW获取线路时钟如图2-5所示:

2008-01-11

华为机密,未经许可不得扩散

第10页, 共58页

UAP8100故障处理思路指导书 内部公开

E32E32CLKCLK 图2-5 MGW获取线路时钟连线示意图

MGW接BITS时钟源比较简单,只需要将BITS的连接到主备CLK板2M-IN上即可。

CKL板获取时钟源信号后,通过内部时钟分发线将时钟信号分发到级联框,连接方法如图2-6所示:

2008-01-11

华为机密,未经许可不得扩散

第11页, 共58页

UAP8100故障处理思路指导书

NETNET内部公开

CLK1_INCLK0_INCLK1_INCLK0_IN(2)NETNETCLK(1)CLKCLK_OUT0CLK1_INCLK0_INNETCLK0_INCLK1_INCLK1_INCLK0_INCLK1_INCLK0_INNETCLK_OUT0

图2-6 MGW时钟分发线示意图

MGW时钟数据配置涉及到的命令主要有三条: 设置线路时钟参考源:SET LINECLK; 修改时钟板配置信息:MOD CLK;

修改时钟参考源配置信息:MOD CLKSRC。

2.3.2 故障点现象与解析

可能造成MGW时钟故障的原因包括:

(1) 时钟源:时钟丢失、时钟不稳定、信号质量差;

(2) 时钟锁相:CLK时钟板故障、NET板时钟失锁、业务板时钟失锁; (3) 时钟传输:提取线路时钟的接口单板(E32)故障或者线路中断、

时钟接口单板到时钟板的配线连接故障、时钟板到网板的配线中断; (4) 数据配置:参考源设置错误、时钟板工作模式设置错误、线路时钟

源设置错误;

2008-01-11

华为机密,未经许可不得扩散

第12页, 共58页

UAP8100故障处理思路指导书 内部公开

(5) 时钟板没有设置为1槽主用,这个一定要注意,目前MGW时钟一

定要设为1槽主用,0槽主用会有缺陷。 处理过程如下图2-7所示:

图2-7 MGW时钟故障处理示意图

? 告警台有“主用参考源频偏超出范围” 告警

如果有此类告警,说明时钟信号有丢失过或者质量较差,请与上级局联系解决。

? 告警台有“时钟丢失”、“时钟失锁”告警

(1) 通过DSP CLK/LST CLK命令查询时钟源选择、时钟工作模式是否

正确;

(2) 如果多个框内的业务板或NET板上报时钟失锁或时钟丢失,说明

CLK板故障或CLK板上的配线松动。如果某个框内的多个业务板上报时钟丢失,说明NET板故障或NET板上的配线松动。如果某个框内的某个业务板上报时钟丢失,请检查该单板是否插紧或故障。

? 使用DSP CLK命令检查发现时钟锁相状态不为TRACE

时钟锁相状态不正确,说明CLK板获取时钟源出错,检查步骤: (1) 确认系统选择的参考源信息、时钟源选择、时钟工作模式等数据配

置是否正确,如果是线路时钟;

(2) 检查线路时钟接口单板(E32、T32、S2L)的状态是否正常; (3) 检查提供线路时钟的接口单板与时钟单板之间的时钟配线连接是否

正确,线缆是否损坏;

2008-01-11

华为机密,未经许可不得扩散

第13页, 共58页

UAP8100故障处理思路指导书 内部公开

(4) 如果是BITS时钟,检查BITS时钟与URP8100 MGW设备CLK

单板之间的线缆连接是否正常,线缆是否损坏。

(5) 若以上4点均确认无问题,可能与时钟源有关,请与上级局联系解

决;

? 使用DSP NETCLKSIG命令检查时钟分发状态不为NORMAL

(1) 用DSP CLK检查时钟锁相状态是否为TRACE,如果不为TRACE,

请按上面“使用DSP CLK命令检查发现时钟锁相状态不为TRACE”方法检查;

(2) 若上步时钟锁相状态正常,则检查NET板状态是否正常,可使用换

板的方式检测;

(3) 检查从CLK板到NET板的时钟分发线连接是否正常,可调换时钟

分发线检测;

2.3.3 典型案例分析

? MGW级联框不能正常获取时钟导致的杂音问题

现象描述:

实验室测试端局彩铃发现,主叫用户听到的声音全是杂音,而检查内部接口信令跟踪发现信令正常,检查VRB消息跟踪发现VRB在正常放音。

MGW告警台上有未恢复的ID为604的告警:

Alarm name :The abnormal clock signaling is detected by board Alarm raised time :2007-06-30 19:18:04 Alarm severity :Critical

Location info :Frame No.=2, Slot No.=7, Board Position=back,

告警信息:

Board Type=NET, Board No.=2, Alarm Reason=Port 0 no clock signal Alarm origin :UMG8900 Alarm number :604

Network management type:Hardware Alarm type :Fault Cleared state :Not Cleared Cleared time :-

原因分析:

MGW的TDM单板依赖于从主控框CLK板获得的时钟才能正常工作,如果时钟不正常,则会出现单板不能正常加载,加载后不能正常工作等问题。 检查环境,实验室的MGW配置的是典型的三框级联, 内部中继连在第2框(业务框),外部中继连在第1框(主控框)。从主控框到业务框的时钟分发线只有一根,即从1槽CLK板连到2框NET板。从MGW告警台上发现有告警ID

处理过程:

为604的告警,如下:

Alarm name :The abnormal clock signaling is detected by board Alarm raised time :2007-06-30 19:18:04 Alarm severity :Critical

Location info :Frame No.=2, Slot No.=7, Board Position=back,

2008-01-11

华为机密,未经许可不得扩散

第14页, 共58页

UAP8100故障处理思路指导书

Board Type=NET, Board No.=2, Alarm Reason=Port 0 no clock signal Alarm origin :UMG8900 Alarm number :604

Network management type:Hardware Alarm type :Fault Cleared state :Not Cleared Cleared time :-

内部公开

进一步检查发现当前主用的CLK板是0槽,这就是出现604告警的原因。 倒换主用的CLK板,该告警得以恢复,之后再次拨测,主叫用户已经能够正常听到彩铃。

MGW多框环境下,从主控框到级联框之间需要连接时钟分发线,所有级联框

建议与总结:

都是通过这个时钟分发线从主控框获取时钟的,只有每一框都能正常的获取时钟(即环境上不再有604告警),所有框内的TDM相关单板(TNU、TCLU、E32、S2L)才能正常工作。

2008-01-11

华为机密,未经许可不得扩散

第15页, 共58页

UAP8100故障处理思路指导书 内部公开

第3章 硬件类问题

3.1 问题处理说明

设备只有在正常上电以后,才可以完成软件加载和数据配置等操作,然后投入运行。因此,硬件正常是电信设备的最基本要求。硬件故障是指由于硬件物理损坏、安装不当、配置错误、电源故障等导致的与硬件相关的故障现象。主要表现为单板不上电、单板突然断电、整框不启动等故障。

在开局或出现故障时,首先要检查硬件是否出现了故障,因为硬件问题会直接影响到相关模块的处理能力,造成功能失效,业务无法运行。

3.2 MGC加载类问题解析

3.2.1 加载原理与过程

MGC的单板加载有两种方式,一种是从BAM加载,另一种是从FLASH加载;开局时是设置为BAM加载,一般在系统稳定后将其设置为从FLASH加载。

单板的加载方式是通过单板的软开关来设置的,软开关有四个,分别为:程序可用、数据可用、程序可写和数据可写(指FLASH中的程序和数据),可以用命令MOD LSS来修改,从BAM加载时,软开关的设置如图3-1所示:

软开关 程序可用 数据可用 程序可写 数据可写 OFF OFF ON ON 图3-1 MGC加载软开关

状态 此时程序可用、数据可用状态都为OFF,所以程序和数据将从BAM加载到单板RAM中,同时写入板上的FLASH。

在BAM系统服务器加载数据存放目录(默认D:\\DATA)下,存放有UAP中MGC系统的加载文件,加载文件包括单板程序、数据。D:\\DATA 中存放的文件。例如,s3000.smu是SMU 程序文件,smubios2.bin是SMU 2层 BIOS文件;Db_?.dat是各模块的加载数据。如Db_73.dat是模块号为73的模块的数据文件。

2008-01-11

华为机密,未经许可不得扩散

第16页, 共58页

UAP8100故障处理思路指导书 内部公开

如图3-2所示,e0和e1分别为SMU自带网口和其后插板SIU板出的网口,图中实线部分为连接网线,虚线部分为加载路径。无论对6槽或8槽的SMU板,SMU板自带网口(SIU板最上面的网口)连接到9槽的HSC板上,后插板SIU板出的网口(最下面的网口)连接到7槽的HSC板上。BAM与主机相连的两块网卡IP设置为:172.2X.200.0和172.3X.200.0,子网掩码均为255.255.0.0。6槽SMU0板的程序、数据默认由BAM 通过网口172.2X.200.0从路径1加载,8#槽的SMU1的程序、数据默认由BAM 通过网口172.3X.200.0从路径2加载。当默认路径不通的时候,6槽SMU0将从路径3加载,8槽SMU1板将从路径4加载,VRB板及其扣板上程序从SMU通过共享资源总线加载。

BAM172.20.200.0网卡A172.30.200.0网卡B0#LAN Switch1#LAN SwitchOSTA机框HSCHSC7号槽9号槽6号槽SIU后半框前半框SIU8号槽共享资源总线A共享资源总线BIFMCDBSMU左半框右半框SMUCCUBSG 图3-2 MGC加载路径

另外,在UAP环境搭建过程中,当完成对BAM机器的SQL(及其补丁)和BAM后台软件的安装,进行相关配置后,有时需要对UAP主机,即机框内的单板进行BIOS升级。升级对象分为两类,系统板SMU和非系统板的加载数据有所区别。升级BIOS的非系统板主要包括IFM单板,CSU单板,VRB单板,CDB单板等,除了SMU单板它们加载的数据是一样的,具体加载方法联系总部获取。

另外要注意,EPI单板必须增加ADD EPICFG数据后才能正常加载;

2008-01-11

华为机密,未经许可不得扩散

第17页, 共58页

UAP8100故障处理思路指导书 内部公开

VRB的上扣网板已经取掉,有的版本会显示为红色,此为正常情况。

3.2.2 故障点现象与解析

可能造成MGC加载问题的原因包括: (1) BAM与前台通讯故障;

(2) BAM上的程序和数据文件有误或丢失(默认在D:\\Data下); (3) 可能需要手动加载二级BIOS; 处理过程如图3-3所示:

图3-3 MGC加载问题示意图

? 整个机框无法加载

整个机框无法加载一般是HSC与BAM通信不正常造成的,可按下述步骤检查:

(1) 故障插框的HSC板与交换机的FE(Fast Ethernet)网线没有连接

或者连接的接口错误,注意9槽HSC网口与BAM的172.20.200.0的网口插在一个交换机上,7槽HSC网口与BAM的172.30.200.0的网口插在一个交换机上;

(2) 交换机做了错误的数据将HSC网口、BAM网口划入了不同的

VLAN,导致无法正常通信,如果是新开局时无法加载框,建议把交换机配置数据清空,再尝试加载;另外,交换机上与HSC连接的网口及与BAM连接的网口都应保持为默认的自适应模式,不能改为百兆全双工或其它模式,否则可能导致加载失败;

(3) HSC网口、BAM网口故障或网线质量不好都可能造成加载不成功,

可能通过观察指示灯状态,调换单板的方法测试是否为网口或网线问题;

2008-01-11

华为机密,未经许可不得扩散

第18页, 共58页

UAP8100故障处理思路指导书 内部公开

(4) SMU是插框的系统管理板,若SMU单板故障无法加载,也可能造

成整框加载失败,可通过调换单板的方法验证是否为SMU单板故障问题;

(5) 机框号设置的不对,导致实际框号和配置的框号不一致,MGC机

框的框号是通过SMU的后插板SIU上的拨码开关确定的,具体设置方法请参见《开局指导书》,若ADD FRM增加机框时输入的框号与SIU的拨码不一致,将导致该框加载失败;另外,在多框情况下,各框的框号不能冲突,否则也会造成某框无法加载;

(6) 加载的程序和数据存放在BAM服务器上,默认D:\\DATA下。例如,

s3000.smu是SMU 程序文件,smubios2.bin是SMU 2层 BIOS文件;Db_?.dat是各模块的加载数据。如Db_73.dat是模块号为73的模块的数据文件,检查该路径下的加载文件是否完整(可与软件安装包中的文件对比),若文件不齐,请重新安装BAM软件; (7) 若以上6点检查均正常,仍然无法定位问题,请联系总部技术支持

人员。

? 某块单板无法加载

(1) 检查前后台是否断连,通常使用PING的方法进行断连检查。如果

前后台断连,请排查网络连接错误或者网线故障

(2) 确认是否存在太多的单板需要加载,如果存在太多单板需要加载,

则加载时间可能较长。如果存在此问题,建议先掉电部分框,单框逐一的进行加载。

(3) 加载文件目录下(默认为D:\\DATA)文件损坏或者不存在也会导致

单板不能加载,请检查目录下与该单板相关的程序文件,数据文件是否存在,若文件损坏或丢失可以通过重装BAM软件解决此问题。具体操作方法请参见《U-SYS UAP8100 通用接入平台 MGC软件安装手册》。

(4) 特别要注意,EPI单板必须增加一条ADD EPICFG命令后才能正常

加载;

(5) 另外,在UAP环境搭建过程中,当完成对BAM机器的SQL(及其

补丁)和BAM后台软件的安装,进行相关配置后,有时需要对UAP主机,即机框内的单板进行BIOS升级。升级对象分为两类,系统板SMU和非系统板的加载数据有所区别。升级BIOS的非系统板主要包括IFM单板,CSU单板,VRB单板,CDB单板等,除了SMU单板它们加载的数据是一样的,具体加载方法联系总部获取。

2008-01-11

华为机密,未经许可不得扩散

第19页, 共58页

UAP8100故障处理思路指导书 内部公开

(6) 若以上步骤检查完成后,仍无法定位问题,则有可能是单板本身故

障,可通过调换单板的方式(与其它加载正常的同类单板换槽)的确认是单板问题还是槽位问题,也可联系总部支持人员确认。

3.2.3 典型案例分析

? 由于HSC双平面接反导致MGC无法加载

现象描述:

某彩铃局新开局,硬件安装后上电,MGC无法正常加载,现象如下:

1、基本框两块SMU板link灯常亮,run灯快闪,ALU的run灯红色常亮,其它前插板不亮,后插板SIU不亮,HSC0的从上往下第一个网口和第3个网口(没有任何网线)的绿灯常亮;

2、扩展框和媒体资源框的前插板情况和基本框类似,只是有时候SMU板会转换为run灯常亮,其它灯不亮的状态;HSC1板的两个光纤接口(没插光纤)绿色和橙色灯常亮; 3、从HSC连到交换机上的网口状态在UP、down之间频繁切换,网口灯为橙色常亮; 只将其中一个MGC的机柜加电,其它机柜都没有上电,交换机上没有配置任何数据。

告警信息: 原因分析:

无。

分析可能的原因:

1、LAN SWITCH做了环路; 2、SIU拨码开关错误; 3、SIU与HSC级联网线错误; 4、硬件或网线问题; 5、双平面连接出错。

处理过程:

1、现场反馈LAN SWITCH中没有做任务数据,排除了LAN SWITCH中有环路的可能; 2、现场反馈已检查SIU与HSC的级联网线和SIU拨码开关,没有错误;

3、由于每个框现象类似,LAN SWITCH经检查后也没有问题,现场也更换过网络,说明应该不是硬件问题;

4、最后经现场仔细检查确认是HSC双平面的网线连接反了,导致不能加载,更改网络连线后,问题解决。

建议与总结: 开局时一定要仔细检查网络连线,特别注意双平面的连接,9槽的HSC应与172.20网段

接入一个LAN SWITCH;7槽的HSC应与172.30网段接入一个LAN SWITCH中,否则MGC框无法加载。

? 某地彩铃URP大量VRB单板不加载问题处理

现象描述: 某地彩铃扩容项目新扩URP一套,设备上电加载后发现MGC中大面积VRB板加载不正常,后台设备面板显示红色单板故障。 告警信息: 重启VRB单板、机框掉电加载仍不能正常加载。用串口线连接单板调试串口,发现反复有如下的信息,VRB单板不停的向BAM发送加载请求,但得不到回应,发送5次加载请求后单板自动重启: BIOS: Send load request message to BAM BIOS: Resend one message: Load request mesage to BAM: total_file_num:2 2008-01-11 华为机密,未经许可不得扩散

第20页, 共58页

file_type:0

UAP8100故障处理思路指导书 内部公开

file_name:u8100.vrb check_ok:0 CRC:6735 file_type:1

file_name:Db_165.dat check_ok:0 CRC:2161

原因分析: 现场把能够正常加载的VRB单板跟不能正常加载的单板互换位置,加载正常的单板

换到不能加载单板的槽位后加载正常,不能正常加载的VRB单板换到能够正常加载的单板槽位后还是不能加载,这种互换操作可以证明不是槽位和数据问题导致单板不加载。

现场怀疑是出厂大面积单板故障,通过咨询研发后给的答复是:要现场通过串口线重新加载单板bootrom微码后再重新加载数据和程序。

处理过程: 现场操作步骤如下:

1、复位单板,在出现Press any key to stop auto-boot...时按回车键,出现[CpciBoot]:提示后输入u,回车,调出用户特殊菜单。

2、在出现的下一级菜单中选择4: enter bootrom update menu,在出现的下级菜单中选择5: clear valid flag of extended bootrom和7: clear boot flag of extended bootrom 3、完成以上操作后复位单板,在出现Press \后输入d,然后在出现提示符->后面输入loadXmodem回车,然后选择超级终端的菜单栏中的Transfer-Send,会出现选择传输文件的提示窗口,文件名选择:D:\\Data\\iobios.hdr,协议选择Xmodem。选择好以后点击发送,会出现发送文件窗口。BIOS文件发送完成后,重新启动VRB单板,单板加载数据和程序正常。此局点所有VRB单板都重新加载微码程序后单板全部恢复正常。

3.3 MGW加载类问题解析

3.3.1 加载原理与过程

UAP8100 MGW设备采用先进的MBus管理系统,控制设备的上电和断电操作,有效避免浪涌电流的影响。在配置业务数据之前,需要完成基本的硬件数据配置。系统在上电启动时,会通过单板MBus系统读取插入单板的物理类型,然后与插入槽位的配置信息进行比较。只有两者一致的情况下,单板才能正确上电。

设备在上电启动过程中,OMU(Operation and Maintenance Unit)单板正常上电启动是其他单板上电启动的前提。并且只有OMU单板完成启动后,主控框中的业务单板和其它业务插框的MPU(Main Processing Unit)单板才开始启动。

在多框级联方式下,设备正常启动的顺序如图3-4所示。

2008-01-11

华为机密,未经许可不得扩散

第21页, 共58页

主控框主用OMU单板开始启动UAP8100故障处理思路指导书 内部公开

主控框主用OMU启动成功主控框其它单板启动成功中心交换框MPU启动成功中心交换框其它单板启动成功其它插框MPU启动成功其它插框业务单板启动成功

图3-4 设备正常启动顺序图

判断单板是否正常上电,主要观察单板拉手条上面的热插拔指示灯(OFFLINE),如果指示灯亮,说明当前单板没有上电。

MGW的BAM程序在OMU单板上(OMU单板有一个硬盘),一般在出厂前OMU上已经上传的BAM程序,但有可能和现场需要的版本不一致,这个时候需要手动更新OMU程序,具体方法参见《URP8100 R001 设备上电软件加载指导书》;

多框级联方式下,扩容框若无法加载,很多时候都是级联线连接错误造成的(数据通过FE总线加载),这个一定要注意,特别是FE级联线要用交叉网线,见图3-5所示;另外MGW中很多单板是相互关联的,CLK板故障时,会导致TNU板故障;TNU板故障时,会导致E32/S2L板故障;SPF和E32都会导致RSP/PV8故障,后插板都会导致前插板故障,除OMU和FLU外,前插板不会导致后插板故障。

图3-5 MGW FE级联线

MGW有多种总线:MBus总线、FE总线、GE总线、TDM总线;内部总线通信故障一般无法从表象看出来,多是通过与设备管理相关的其他故障、业务故障等体现出来,出现内部通信故障时,上报相应的告警信息,所以开局时完成对各种总线的测试是非常重要的。

2008-01-11

华为机密,未经许可不得扩散

第22页, 共58页

UAP8100故障处理思路指导书 内部公开

3.3.2 故障点现象与解析

? 主控框或框内单板无法加载

由于MGW的加载程序是在OMU单板上,因此主控框的加载与外部连线没有关系,可参照下述步骤检查:

(1) 检查配电框是否上电:主要通过面板指示灯和开关状态确认配电框

是否上电,若没有上电请参考《U-SYS UAP8100 通用接入平台 设备手册》与《U-SYS UAP8100 通用接入平台 硬件安装手册》部分内容。

(2) OMU/MPU单板正常上电并且启动是其他单板上电的前提,因为

MBus系统的主控制MBus在OMU单板上,只有主控制MBus模块上电后,其它单板才能注册到OMU单板。若配电框已经上电,而整框无法加载,大多是由于OMU单板没有正确插入槽位或者接触不好,请通过拔插单板方式处理。

(3) 若OMU已经加载,而主控框内某单板无法加载,先检查单板与背

板接触是否良好,可拔插测试一下;

(4) 若不是接触问题,可能是槽位的配置信息与单板的物理类型不一致

造成单板无法加载,请用LST BRD命令查询配置的单板类型是否与实际类型一致(单板的物理类型可以从单板拉手条查看),若不一致,需要删除数据并重新添加单板配置信息;

(5) VPU加载时,需要先加载语音文件,而该文件需要注意在LOD

TOBAM时加载,一定要加VPUT-1的选项,否则VPU无法加载,如图3-6所示:

图3-6 VPU加载图示

(6) 若以上几条检查后仍无法定位问题,则可能是单板硬件本身有故障,

请通过调换单板、换插槽位的方法来检查,也可联系总部人员支持。

? 扩容框无法加载

2008-01-11

华为机密,未经许可不得扩散

第23页, 共58页

UAP8100故障处理思路指导书 内部公开

扩容框加载要在中心交换框加载之后,且是通过中心交换框与扩容框的FE总线传输数据,检查步骤如下:

(1) 首先要检查故障插框与中心交换框的FE级联线是否连接正确,可

参照上一节中的级联图示检查;观察网口指示灯是否正常,正常情况下,级联网口应该是绿灯亮,黄灯闪烁;确认是否为网线质量问题,特别要注意的是FE级联线必须使用交叉网线。

(2) 检查框号设置是否正确,各个框的框号不能设置为相同,框号设置

方法请参见《开局指导书》;

(3) 框内某块单板无法加载,请参见“主控框或框内单板无法加载”。

? 内部总线问题

MGW的内部总线主要是指多框级联时的FE、GE、TDM总线,内部总线通信故障一般无法从表象看出来,多是通过与设备管理相关的其他故障、业务故障等体现出来,出现内部通信故障时,上报相应的告警信息,所以开局时完成对各种总线的测试是非常重要的。测试方法可参见《URP8100 MGW设备 双平面调测指导书》。

3.3.3 典型案例分析

? MGW的框号拨码开关导致OMU单板加载失败

现象描述: 通过FTP方式加载URP MGW OMU单板后单板自动重新启动,一直无法正常启动,

串口信息如下:

An error occured. file:../../../src/dopra/vos/src/ipc/ipc_intf.C, line:1237, module:536878336, Error:16407 IPC Initialized ERROR!

!!!FID 2(VOS_IPC) initialization failed!

An error occured. file:../../../src/dopra/vos/src/msg/v_module.c, line:2175, module:536876032, Error:25 DOPRA Fatal error!

Execute BSP_ResetBoard Command OS : Starting phase 2...

::LOAD(INFO): PID_FAM_LOAD_TRANS ok. ::LOAD(INFO): PID_FAM_LOAD_CONTROL ok. OS : Starting phase 3...

提示v_msg.c文件中错误\,并不停尝试重启。

告警信息:

2008-01-11

华为机密,未经许可不得扩散

第24页, 共58页

UAP8100故障处理思路指导书 内部公开

原因分析: OMU下载完成启动不正常,有2点可以检查

1、上载文件是否完全,该处使用文件已在另外一套MGW上验证,没有问题。 2、机框中信息流量大导致,可以把机框下电后重新启动。但此次下电重启后故障依旧。 3、检查硬件安装时各个机柜的拨码开关,OMU所在的机框必须为1框,发现实际拨码把ON和OFF理解反了。正确的对应关系如下:

DIP switch setting Binary number Frame ID SW4 SW3 SW2 SW1 ON ON ON ON 0000 0 ON ON ON OFF 0001 1 ON ON OFF ON 0010 2 ON ON OFF OFF 0011 3 ON OFF ON ON 0100 4 ON OFF ON OFF 0101 5 ON OFF OFF ON 0110 6 ON OFF OFF OFF 0111 7 OFF ON ON ON 1000 8

处理过程: 把主控框的拨码开关拨为OFF/ON/ON/ON/OFF/OFF/OFF/OFF,表明为第一框,并下电

重新启动后,故障消失。

建议与总结: 拨码开关,OFF为1,而ON为0,在设置时需要特别注意。

? MGW单板类型不匹配导致其无法正常加载的解决

现象描述: 新开URP彩铃局,重新刷新OMU单板后(具体重新刷新OMU中BAM数据的方法请参考URP上机指导书),加载MGW硬件数据,出现故障现象,只有OMU单板可以正常启动,MGW整框其他单板无法正常加载。 告警信息: 无 原因分析: 1、通过MGW上的面板图的单板告警颜色发现,橙色,提示为安装不匹配; 2、由于MGW采用OSTA设计原理,所有的单板设备具有通用性,不同产品可以通过对单板加载不同的软件来实现不同的功能,所以怀疑单板应用的类型出错; 3、由于MGW的所有设备可以通过总线的方式上报各自的状态信息给OMU单板,所以通过OMU的消息可以查看单板信息。 处理过程: 1、连接OMU上的串口,57600/8/1/0 登陆查看消息; 2、在串口查询总线信息,mnt mbusinfo 命令查询单板类型,彩铃应用中的单板的属性必须是FXXX; 3、通过mnt mbusinfo 得到结果,发现其他单板显示为 WXXX,如:WCMU; 4、W开头的单板,表明单板的应用类型有问题,在URP彩铃中的应用,类型应该选择为 F(固网开头); 5、使用 mnt wbt 命令修改单板类型。将所有单板均改为 F 开头的单板.如: mnt wbt FCMU 2; 6、问题解决。 2008-01-11

华为机密,未经许可不得扩散

第25页, 共58页

本文来源:https://www.bwwdw.com/article/kxnf.html

Top