eNodeB IK告警排障手册v1.0

更新时间:2024-06-11 00:43:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

eNodeB IK 告警排障手册 The TD-LTE eNodeB IK alarm Trouble

Shooting Method

作 者 姓 名:

部门、 产品: R&D/TAC/FTM TDD-LTE 工 号: 完 成 日 期: 2014年6月25日

创新沟通方式,缔造多彩生活

I

版本更新说明

部门/分公司:ASB DPS LTE 版本号 时间 编制人

赖晓婷 黄培兴

V0.1 20140625

崔向华 张志

审核人 NJ GPS team

文档唯一标识符:20140625

主要更新内容

II

目 录

1. IK4009138 NO CONTACT TO BOARD ................................................................ 7

1.1 告警含义 ............................................................................................................. 7 1.2 处理建议 ............................................................................................................. 7 2. IK4305088 RRH CONFIGURATION DATA MISMATCH VERSUS

HARDWARE ..................................................................................................................... 9

2.1 告警含义 ............................................................................................................. 9 2.2 处理建议 ........................................................................................................... 10 3. IK4007026 X2 ENB CANDIDATE X2 SETUP FAILURE ................................. 12

3.1 告警含义 ........................................................................................................... 12 3.2 处理建议 ........................................................................................................... 13 4. IK4007027 X2 ENB CANDIDATE X2 SETUP NO RESPONSE ....................... 13

4.1 告警含义 ........................................................................................................... 13 4.2 处理建议 ........................................................................................................... 14 5. IK4011010 ANTENNA_PORT TX VSWR THRESH1 & IK4011011&IK4011004 .......................................................................................................................................... 14

5.1 告警含义 ........................................................................................................... 14 5.2 处理建议 ........................................................................................................... 15 6. IK4006197 RFM MESSAGE THROTTLING ...................................................... 17

6.1 告警含义 ........................................................................................................... 17 6.2 处理建议 ........................................................................................................... 17 7. IK4006253 RFM SIGNAL LOW PORT1 ............................................................. 17

7.1 告警含义 ........................................................................................................... 17 7.2

处理建议 ...................................................................................................... 17

8. IK4011009 ANTENNA_PORT DIGITAL INPUT OVRDRV TX ....................... 18

8.1 告警含义 ........................................................................................................... 18 8.2 处理建议 ........................................................................................................... 18 9. IK4007104 CELL SETUP ARP TIMEOUT .......................................................... 18

9.1 告警含义 ........................................................................................................... 18 9.2 处理建议 ........................................................................................................... 18 10. IK4007134 CELL FAULT 2 & IK4007073(IK4007074) .............................. 20

10.1 告警含义 ......................................................................................................... 20

III

10.2 处理建议 ......................................................................................................... 20 11. IK4007134 CELL FAULT 2 & IK4306014 ........................................................ 20

11.1 告警含义 ......................................................................................................... 20 11.2 处理建议 ......................................................................................................... 21 12. IK4007134 CELL FAULT 2&IK4003060 .......................................................... 21

12.1 告警含义 ......................................................................................................... 21 12.2 处理建议 ......................................................................................................... 21 13. IK4004042~IK4004047 & IK4004061 CB ALL CPRIPORTS FAILED & IK4009138 &IK4305088 ................................................................................................. 22

13.1 告警含义 ......................................................................................................... 22 13.2 处理建议 ......................................................................................................... 23 14. IK4006159 RFM ANT PERIODIC CAL FAILURE ........................................... 25

14.1 告警含义 ......................................................................................................... 25 14.2 处理建议 ......................................................................................................... 26 15. IK4006158 RFM ANT CAL FAILURE .............................................................. 26

15.1 告警含义 ......................................................................................................... 26 15.2 处理建议 ......................................................................................................... 26 16. IK4305071 CELL DIV IMBALANCE THRESHOLD EXCEEDED ................. 28

16.1 告警含义 ......................................................................................................... 28 16.2 处理建议 ......................................................................................................... 29 17. IK4305050 TRACE CONFIGURATION FAILURE .......................................... 32

17.1 告警含义 ......................................................................................................... 32 17.2 处理建议 ......................................................................................................... 32 18. IK4005083 DBU UNREADABLE MANUFACTURER DATAATTACHED HW ................................................................................................................................... 33

18.1 告警含义 ......................................................................................................... 33 18.2 处理建议 ......................................................................................................... 33 19. IK4007083 PCI COLLISION DETECTED UNDER RESOLUTION &

IK4007085 PCI CONFUSION DETECTED UNDER RESOLUTION ....................... 37

19.1 告警含义 ......................................................................................................... 37 19.2 处理建议 ......................................................................................................... 37 20. IK4009041 NO CONTACT TO BOARD ............................................................ 37

20.1 告警含义 ......................................................................................................... 37

IV

20.2 处理建议 ......................................................................................................... 38 21. IK4004166&IK4004167 CB GPS INSUFFICIENT FIXED SATELLITES ....... 38

21.1 告警含义 ......................................................................................................... 38 21.2 处理建议 ......................................................................................................... 38 22. IK4004157&IK4004159&IK4004011 CB FLYWHEEL CRITICAL ................. 39

22.1 告警含义 ......................................................................................................... 39 22.2 处理建议 ......................................................................................................... 40 23. IK4008004 EBP FAULT 1 .................................................................................. 41

23.1 告警含义 ......................................................................................................... 41 23.2 处理建议 ......................................................................................................... 42 24. IK4003085 BB ALL MODEM CELL RESOURCES FAILURE ....................... 42

24.1 告警含义 ......................................................................................................... 42 24.2 处理建议 ......................................................................................................... 43 25. IK4306066 CONFIGURED CELL RESOURCES MISMATCH VERSUS

HARDWARE ................................................................................................................... 43

25.1 告警含义 ......................................................................................................... 43 25.2 处理建议 ......................................................................................................... 43 26. IK 4201005&4201006 SW DOWNLOAD/ACTIVATION FAILURE .............. 45

26.1 告警含义 ......................................................................................................... 45 26.2 处理建议 ......................................................................................................... 45 27. IK4006006 RFM COMM FAIL ........................................................................... 46

27.1 告警含义 ......................................................................................................... 46 27.2 处理建议 ......................................................................................................... 47 28. IK4011008 ANTENNA_PORT EQUIP FAIL TX .............................................. 48

28.1 告警含义 ......................................................................................................... 48 28.2 处理建议 ......................................................................................................... 48 29. IK4004018~IK4004023 CB TRANS LSL CPRIPORT ....................................... 48

29.1 告警含义 ......................................................................................................... 48 29.2 处理建议 ......................................................................................................... 48 30. IK4004031~IK4004035 CB LOS LOF CPRIPORT ............................................ 51

30.1 告警含义 ......................................................................................................... 51 30.2 处理建议 ......................................................................................................... 51

V

VI

1. IK4009138 NO CONTACT TO BOARD

1.1 告警含义

IK4009138 RRH NO CONTACT TO BOARD 该告警表示检测出当前的CPRI Port上配置的RRH脱离BBU管理。 1.2 处理建议

一般情况下,该类型的告警是由于RRH未安装、RRH供电异常、光纤或者光模块的问题导致,所以首先根据eCCM命令(a如下解释)输出查看CPRI Status Attrs与CPRI status。根据输出结果,可分为两大类:

1) 如果CPRI status输出结果为K_IET_FAULT_LOS_LOF_CPRIPORT,可以通过

CRT ssh到eCCM板卡ping告警对应RRH的IP地址。如果ping不通,现场首先查看RRH是否安装或者RRH供电是否正常。

2) 如果能ping通,根据命令b(如下解释)输出排查eCCM和RRH侧光模块的光

功率: 2.1) 2.2)

相关命令如下。 命令a: SSH到eCCM

>/pltf/hral/IQXC-1-1> show

查看CPRI Status Attrs(CPRI_STATUS,正常情况下为ENABLED):

如果光模块的TX数值小于-8dBm,说明光模块有问题,建议现场更换如果光模块的TX数值在正常范围(-8~0.5dBm),且对端光模块的RX

故障光模块。

数值小于-10dBm,说明有可能光纤问题导致告警产生,建议现场更换故障光纤。

7

举例:故障状态- K_IET_IQXC_CPRI_STATUS_PORT2: DISABLED(1)/

UNKNOWN(-1)

查看CPRI status(正常情况下为SYNC_SUCCESS):

命令b:

查看ECCM板卡的光模块光功率: SSH到eCCM: > /pltf/pltf/xcob> sfpsig 5

(备注:宏站1,3,5;室分0,1,2,3) 查看光模块发射功率

查看光模块接收功率

查看RRH的光模块光功率: 宏站:

从eCCM上telnet到RRH(8*10)

? bci mode /pltf/i2c/sfp0 //the SFP in RRH 1st port /pltf/i2c/sfp1 //the SFP in RRH 2nd port 见图1-1

8

图 1-1 查看宏站RRH光模块光功率

室分:

从eCCM上telnet到 RRH

~ # t_sfp 0 //the SFP in RRH 1st port ~ # t_sfp 1 //the SFP in RRH 2nd port

t_sfp 1只针对 daisy chain 配置模式,见图1-2。

图 1-2 查看室分RRH光模块光功率

2. IK4305088 RRH CONFIGURATION DATA MISMATCH VERSUS HARDWARE

2.1 告警含义

IK4305088 RRH CONFIGURATION DATA MISMATCH VERSUS HARDWARE 该告警表示BBU上对该CPRI口配置的RRH信息和实际该口的物理连接情况不符。此类告警一般情况下与IK4009138- NO CONTACT TO BOARD并发。

9

2.2 处理建议

1) 首先对应snapshot检查RRH配置信息和实际物理链接是否一致,如果不一致修

改snapshot。

如果一致检查是否由于RRH未安装、RRH供电异常、光纤或者光模块的问题导致,所以首先根据eCCM命令a(如下解释)输出查看CPRI Status Attrs与CPRI status。根据输出结果,可分为两大类:

2) 如果CPRI status输出结果为K_IET_FAULT_LOS_LOF_CPRIPORT,可以通过

CRT ssh到eCCM板卡ping告警对应RRH的IP地址。如果ping不通,现场首先查看RRH是否安装或者RRH供电是否正常。

3) 如果能ping通,根据命令b(如下解释)输出排查eCCM和RRH侧光模块的光功率:

3.1) 3.2)

相关命令如下。 命令a: SSH到eCCM

>/pltf/hral/IQXC-1-1> show

查看CPRI Status Attrs(CPRI_STATUS,正常情况下为ENABLED):

如果光模块的TX数值小于-8dBm,说明光模块有问题,建议现场更换如果光模块的TX数值在正常范围(-8~0.5dBm),且对端光模块的RX

故障光模块。

数值小于-10dBm,说明有可能光纤问题导致告警产生,建议现场更换故障光纤。

举例:故障状态- K_IET_IQXC_CPRI_STATUS_PORT2: DISABLED(1)/

UNKNOWN(-1)

查看CPRI status(正常情况下为SYNC_SUCCESS):

10

命令b:

查看ECCM板卡的光模块光功率: SSH到eCCM: > /pltf/pltf/xcob> sfpsig 5

(备注:宏站1,3,5;室分0,1,2,3) 查看光模块发射功率

查看光模块接收功率

查看RRH的光模块光功率: 宏站:

从eCCM上telnet到RRH(8*10)

? bci mode /pltf/i2c/sfp0 //the SFP in RRH 1st port /pltf/i2c/sfp1 //the SFP in RRH 2nd port 见图2-1

11

图 2-1 查看宏站RRH光模块光功率

室分:

从eCCM上telnet到 RRH

~ # t_sfp 0 //the SFP in RRH 1st port ~ # t_sfp 1 //the SFP in RRH 2nd port

t_sfp 1只针对 daisy chain 配置模式,见图2-2。

图 2-2 查看室分RRH光模块光功率

3. IK4007026 X2 ENB CANDIDATE X2 SETUP FAILURE

3.1 告警含义

IK4007026 BBU X2 ENB CANDIDATE X2 SETUP FAILURE 如图3-1,当Initiating ENB发送X2 SETUP REQUEST给Candidate ENB建立X2AP连接,而Candidate ENB回复X2 SETUP FAILURE时,Initiating ENB就会上报此告警。

12

图 3-1 X2建立失败

3.2 处理建议

注:以下ENB1为本端站点(即发生IK4007026告警的ENB),ENB2为对端站点。

1) 找到对端站点ENB2

从本端站点ENB1的告警文件里提取字段(Additional Text字段中Alarm Monitored Attribute=“站点名”),把对端站点名提取出来,找出对端站点ENB2。 2) 检查X2配置是否正确

在snapshot中检查两侧ENB1和ENB2各自到对端的X2 link是否已经配置,并检查配置的正确性。

3) 检查对端ENB2上X2的状态

在SAM上检查ENB2到ENB1的X2状态是否正常,如ENB2上X2的状态正常,则为典型的X2单通情况!目前还没有出现两侧ENB同时出现IK4007026告警的情况,只有在单通的情况下才会出现以上告警。 4) 重启ENB2

对于以上X2单通故障,目前我司的ENB产品需要通过重启ENB2来恢复。

4. IK4007027 X2 ENB CANDIDATE X2 SETUP NO RESPONSE

4.1 告警含义

IK4007027 BBU X2 ENB CANDIDATE X2 SETUP NO RESPONSE 如图4-1,当Initiating ENB发起X2 SETUP REQUEST给Candidate ENB建立X2AP连接而Candidate ENB未回复X2 SETUP RESPONSE时,Initiating ENB就会上报此告警。

13

图 4-1 X2建立无回复

4.2 处理建议

注:以下ENB1为本端站点(即发生IK4007027告警的ENB),ENB2为对端站点。

1) 找到对端站点ENB2

从本端站点ENB1的告警文件里提取字段(Additional Text字段中Alarm Monitored Attribute=“站点名”),把对端站点名提取出来,找出对端站点ENB2。 2) 检查X2配置是否正确

在snapshot中检查两侧ENB1和ENB2各自到对端的X2 link是否已经配置,并检查配置的正确性。

3) 检查对端ENB2上X2的状态

在SAM上检查ENB2到ENB1的X2状态是否正常,如ENB2上X2的状态正常,则为典型的X2单通情况!目前还没有出现两侧ENB同时出现IK4007026告警的情况,只有在单通的情况下才会出现以上告警。 4) 重启ENB2

对于以上X2单通故障,目前我司的ENB产品需要通过重启ENB2来恢复。

5. IK4011010 ANTENNA_PORT TX VSWR THRESH1 & IK4011011&IK4011004

5.1 告警含义

IK4011010 RRH IK4011011 RRH IK4011004 RRH ANTENNA_PORT TX VSWR THRESH1 ANTENNA_PORT TX VSWR THRESH2 ANTENNA_PORT TX FAIL 告警IK40011010和IK40011011表示RRH的该TX Port的驻波比超过了门限值。相比于IK40011010,IK40011011表示驻波比情况更恶劣。如果现场驻波比进一步恶化,会有IK4011004的伴随告警产生。

14

默认门限定义如下:

VSWR THRESH 1:1.9;Return Loss:10.2db VSWR THRESH 2:3.0;Return Loss:6db 注:部分省市对VSWR设置了不同的门限值。

5.2 处理建议

1) 排查下面几种外部原因:

? RRH天线口与馈线是否拧紧,即馈线接口扭矩是否达到要求值。 ? RRH天线口是否出现变形、生锈、腐蚀或进水。 ? RRH安装位置是否符合规范。

2) 如果外部原因确认没有问题,进行如下排障步骤: 打开NEM,点击到

,选择“Set All Flags to True”,点击“Set Flag”,弹出对话

框,选择Yes。“false”变为“true”。点击\,可查看到VSWR、TXPOWER、RSSI三个参数值的读取结果。通过该方法可以初步判定VSWR发生在第几个RRH的第几个端口(VSWR值大于VSWR THRESH 1,则判定该端口有VSWR问题)。

首先排查RRH是否存在故障,lock故障Cell,之后拧掉馈线,使用大于50W的负载(如果是宏站8天线,可为30W负载)连接到RRH TX口上。Unlock cell后,如果VSWR measured value小于VSWR THRESH 1,说明此RRH TX端口正常,需要排查馈线和天线;如果VSWR measured value大于VSWR THRESH 1,说明此RRH TX端口有问题,需要更换此RRH(填写返修RRH AR)。

其次排查馈线是否存在问题,lock故障Cell,把馈线连接到RRH上,拧掉天线侧馈线,使用公母转换头,连接负载,检查RRH和馈线连接是否符合驻波值。Unlock cell后,如果VSWR measured value小于VSWR THRESH 1,说明此RRH和连接馈线都正常,而天线端口有问题,需要更换天线;如果VSWR measured value大于VSWR THRESH 1,说明馈线有问题,需要更换此馈线。

对驻波比排查需要携带以下工具:

? 室分推荐大于50W的负载(如果是宏站8天线,可为30W负载)。 ? 公母转换头。 ? 跳线。

NEM的Radio Measurements测试方法:

15

1.使用NEM bat文件,可对VSWR、TXPOWER、RSSI进行测量。选择“Set All Flags to True”,点击“Set Flag”,弹出对话框,选择Yes。 “false”变为“true”。见图5-1。

图 5-1 NEM的Radio Measurements

2.点击\,可查看到VSWR、TXPOWER、RSSI三个参数值的读取结果。驻波比主要查看VSWR Measured Value值(正常范围为小于VSWR THRESH 1)。见图5-2。

图 5-2 参数值读取结果

16

6. IK4006197 RFM MESSAGE THROTTLING

6.1 告警含义

IK4006197 RRH RFM MESSAGE THROTTLING 该告警是因为RRH上部分告警反复出现,导致RRU告警数目过多。现场该告警多与RRH的其他告警并发产生,此告警意在优化RRH告警反复出现导致的告警数目过多。

6.2 处理建议

当前该类告警发生时,建议核对历史告警文件优先处理该RRH触发的其他告警。

7. IK4006253 RFM SIGNAL LOW PORT1

7.1 告警含义

IK4006253 RRH RFM SIGNAL LOW PORT1 该告警提示RRH 从BBU接收的数字功率较低。 7.2 处理建议

首先检查eNB版本是否是LR13.3L CL8及后续版本,如不是,等待升级后观察;如果告警依旧存在,参考以下排障处理方法。 室分 RRH的处理:

1) 排查RRH的Scaled IQ 1数值

SSH到eCCM,从eCCM telnet到故障RRH,通过dstat命令查看故障RRH的Scaled IQ 1数值,若scaled IQ 1数值低于LoPwrThrs(目前版本的门限为1536),认定该告警为真实告警;

2) 排查该站点database中参数配置

部分参数配置异常导致此告警出现,因此需要修改基站的参数配置。

功率配置参数设置不当导致,如cellDLTotalPower设置过低,referenceSignalPower设置过低等,paoffsetpdsch、pboffsetpdsch的不当设置也会导致该故障;

3) Reset eNB

若database中的参数都配置正确,但是scaled IQ依旧小于LoPwrThrs门限,建议reset eNB。

17

8. IK4011009 ANTENNA_PORT DIGITAL INPUT OVRDRV TX

8.1 告警含义

IK4011009 RRH ANTENNA_PORT DIGITAL INPUT OVRDRV TX 该告警提示该RRH从BBU接收的数字信号功率较高。 8.2 处理建议

8.2.1室分 RRH的处理

1) 排查RRH的Scaled IQ 1数值

从eCCM上telnet到故障RRH,通过dstat命令查看故障RRH的Scaled IQ 1数值,若scaled IQ 1数值高于OPwr Thrs 58624(目前版本的门限为58624),认定该告警为真实告警。

2) 排查该站点database中参数配置

部分参数配置异常导致此告警出现,因此需要修改基站的参数配置。

功率配置参数设置不当导致,如cellDLTotalPower设置过高,referenceSignalPower设置过高等,paoffsetpdsch,pboffsetpdsch的不当设置也会导致该故障。例如,有的现场曾将设置为dB0(正确的配置应为-3dB),因此引发RRH超功率的问题,因而触发以上告警。

3) Reset eNB

若database中的参数都配置正确,但是scaled IQ依旧大于OPwr Thrs门限,建议reset eNB。

9. IK4007104 CELL SETUP ARP TIMEOUT

9.1 告警含义

IK4007104 BCEM CELL SETUP ARP TIMEOUT 该告警表示cell建立时没有ARP响应。Cell建立时,BCEM板会为每个cell分配一个IP地址。Cell建立过程中ARP无响应导致。

9.2 处理建议

1) 排查该站点database中参数配置

18

从eCCM ssh到bCEM板上,通过ifconfig –a指令检查。如图9-1所示,若找不到192.168.129.2这个地址,则表明故障小区的IP地址丢失。

图 9-1 故障小区IP丢失

2) Reset BCEM板

对故障BCEM板卡进行reset操作后,再次通过ifconfig –a命令检查,见图9-2:

图 9-2 故障小区IP恢复

192.168.129.2这个地址重新出现在bCEM板上,cell能正常完成其建立过程,故障消除,业务恢复。

19

10. IK4007134 CELL FAULT 2 & IK4007073(IK4007074)

10.1 告警含义

CELL FAULT 2 Cell Disabled and internally locked because of escalation of alarm: '4007074' IK4007073 Cell L1L2 CONFIG ERROR CELL SETUP IK4007074 Cell L1L2 CELL SETUP REFUSED IK4007134 Cell IK4007134实际上只是表示cell fault的状态,告警本身附带的additional text字段中获得IK4007073或IK4007074的ID。在实际的维护过程中通常也可根据伴随这条告警的其他相关告警进行故障判断。

该条告警一般由于数据配置参数不合理导致。常见的是功率参数配置超过RRH总功率而导致cell无法建立,触发该告警。

10.2 处理建议

检查站点snapshot中参数配置

核查snapshot,发现故障小区的参考信号功率都大于13dBm,而小区的总功率保持在37dBm的设置上,导致功率参数设置超过小区总功率而出现小区无法建立现象。把故障小区的参考功率恢复为13dBm设置后,对cell进行lock/unlock后,告警消除。

11. IK4007134 CELL FAULT 2 & IK4306014

11.1 告警含义

CELL FAULT 2 Cell Disabled and internally locked because of escalation of alarm: '4306014' IK4306014 Cell INSUFFICIENT CPRI IQ RESOURCE FOR CONFIGURED LTECELL IK4007134 Cell IK4007134实际上只是表示cell fault的状态,告警本身附带的additional text字段中获得IK4306014的ID。在实际的维护过程中通常也可根据伴随这条告警的其他相关告警进行故障判断。

该条告警一般由于SFP、光纤等硬件问题导致。

20

11.2 处理建议

检查故障RRH SFP状态:

CPRI资源不足导致。常见的故障为CPRI端口,RRH端口使用的SFP模块型号不对。LR13.3中通常使用Rate 7的光模块,而此类故障站点通过指令检查当前SFP模块是否工作在Rate 5上。因此需要核对SFP的型号,对SFP进行硬件排障。

在CPRI上IQ资源不足,往往是RRH和ECCM板的光口连接资源不足导致,往往需要检查RRH和ECCM板的SFP类型是否匹配。

登入至相关RRH上检查光口,发现运行在4.9G上,正确的应该工作在9.8G上。

具体排查命令:

SSH到eCCM后,从eCCM telnet到RRH: /pltf/CPRI> CPRIGetLNRate

建议现场进行RRH SFP模块的硬件排查或更换。一般情况下若发现RRH侧光模块确实工作在4.9G上,更换光模块后告警消除。

12. IK4007134 CELL FAULT 2&IK4003060

12.1 告警含义

CELL FAULT 2 Cell Disabled and internally locked because of escalation of alarm: '4003060' IK4003060 Cell BB L2 SOFTWARE FAIL SLICE 1 IK4007134 Cell IK4007134实际上只是表示cell fault的状态,告警本身附带的additional text字段中获得IK4003060的ID。在实际的维护过程中通常也可根据伴随这条告警的其他相关告警进行故障判断。

12.2 处理建议

1) 查看Cell与BCEM板卡的映射关系

SSH到eCCM,执行 /cellcallp/cellcallp> CellConfigTable

21

t of PHYSICAL CELLS :

oamInstanceID | LteCell index | Modem index | Host Id | slice index | PCI | CELL ID | OP state | Avail. status | PROC status

0 | 0 | 0 | 2 | 0 | 24 | 153363968 | ENABLED | 0 | INITIALI ZING 1 | 1 | 0 | 2 | 1 | 25 | 153363969 | ENABLED | 0 | INITIALIZING 2 | 2 | 1 | 3 | 0 | 26 | 153363970 | ENABLED | 0 | IN ITIALIZING

图12-1 CellConfigTable命令输出

2) 重新配置故障Cell与BCEM板卡的映射关系

如图12-1,如果故障小区的LteCell index=0,对应的Host Id=2,则需重新配置故障Cell与槽位2的BCEM板卡之间映射关系。配置方法如下:

a) Lock故障小区对应的BCEM板同时lock另一块BCEM板上的一个正常小区 b) Reset eNB

c) Reset 完成之后,一般情况下该故障小区会映射到其他BCEM板卡上,这时

unlock之前的BCEM板及小区,尝试解决该故障。

重新配置后,一般情况下告警消除,建议现场对该故障小区观察1~2天。

13. IK4004042~IK4004047 & IK4004061 CB ALL CPRIPORTS FAILED & IK4009138 &IK4305088

13.1 告警含义

IK4004042 ECCM IK4004043 ECCM IK4004044 ECCM IK4004045 ECCM IK4004047 ECCM IK4004061 ECCM IK4009138 RRH IK4305088 RRH CB TRANS RX LOS CPRIPORT 1 CB TRANS RX LOS CPRIPORT 2 CB TRANS RX LOS CPRIPORT 3 CB TRANS RX LOS CPRIPORT 4 CB TRANS RX LOS CPRIPORT 6 CB ALL CPRIPORTS FAILED NO CONTACT TO BOARD CONFIGURATION DATA MISMATCH VERSUS HARDWARE IK4004042:表示CPRI 1口没有接收到光信号。 IK4004043:表示CPRI 2口没有接收到光信号。 IK4004044:表示CPRI 3口没有接收到光信号。 IK4004045:表示CPRI 4口没有接收到光信号。 IK4004047:表示CPRI 6口没有接收到光信号。

22

IK4004061:表示ECCM板卡上所有CPRI口没有接收到光信号。 上述告警常导致下面两条伴随告警

IK4009138: 表示检测出当前的CPRI Port上配置的RRH在物理上和ECCM板无连接, 连接

脱离BBU管理。 情况不符。

IK4305088:该告警表示BBU上对该CPRI口配置的RRH信息和实际该口的物理

13.2 处理建议

一般情况下,该类型的告警是由于RRH未安装、RRH供电异常、光纤或者光模块的问题导致,所以首先根据eCCM命令(a如下解释)输出查看CPRI Status Attrs与CPRI status。根据输出结果,可分为两大类:

1) 如果CPRI status输出结果为K_IET_FAULT_LOS_LOF_CPRIPORT,可以通过

CRT ssh到eCCM板卡ping告警对应RRH的IP地址。如果ping不通,现场首先查看RRH是否安装或者RRH供电是否正常。

2) 如果能ping通,根据命令b(如下解释)输出排查eCCM和RRH侧光模块的光

功率: 2.1) 2.2)

相关命令如下。 命令a: SSH到eCCM

>/pltf/hral/IQXC-1-1> show

查看CPRI Status Attrs(CPRI_STATUS,正常情况下为ENABLED):

如果光模块的TX数值小于-8dBm,说明光模块有问题,建议现场更换如果光模块的TX数值在正常范围(-8~0.5dBm),且对端光模块的RX

故障光模块。

数值小于-10dBm,说明有可能光纤问题导致告警产生,建议现场更换故障光纤。

23

举例:故障状态- K_IET_IQXC_CPRI_STATUS_PORT2: DISABLED(1)/

UNKNOWN(-1)

查看CPRI status(正常情况下为SYNC_SUCCESS):

命令b:

查看ECCM板卡的光模块光功率: SSH到eCCM: > /pltf/pltf/xcob> sfpsig 5

(备注:宏站1,3,5;室分0,1,2,3) 查看光模块发射功率

查看光模块接收功率

查看RRH的光模块光功率: 宏站:

从eCCM上telnet到RRH(8*10)

? bci mode /pltf/i2c/sfp0 //the SFP in RRH 1st port /pltf/i2c/sfp1 //the SFP in RRH 2nd port

24

见图13-1

图 13-1 查看宏站RRH光模块光功率

室分:

从eCCM上telnet到 RRH

~ # t_sfp 0 //the SFP in RRH 1st port ~ # t_sfp 1 //the SFP in RRH 2nd port

t_sfp 1只针对 daisy chain 配置模式,见图13-2。

图 13-2 查看室分RRH光模块光功率

14. IK4006159 RFM ANT PERIODIC CAL FAILURE

14.1 告警含义

IK4006159 RRH RFM ANT PERIODIC CAL FAILURE 该告警表示RRH的校验失败。 该告警会部分影响该小区的业务,一般情况下是由于RRH天线校准口未连接导致。

25

14.2 处理建议

建议现场安排工程队检查RRH天线校准口是否连接。

15. IK4006158 RFM ANT CAL FAILURE

15.1 告警含义

IK4006158 RRH RFM ANT CAL FAILURE 该告警表示RRH校准线天线校准失败。当RRH的CPRI链路存在问题或者有3路及以上TX FAIL的告警时,会上报IK 4006158-RFM ANT CAL FAILURE的告警,导致RRH disabled,小区被删除。

15.2 处理建议

1,可在SAM上查看该站相关的历史告警,检查在IK4006158-RFM ANT CAL FAILURE告警出现之前的一周内上报过的告警。目前现场较多的IK4006158告警,由于IK4006291 RRH光纤问题导致,为伴随告警。需要检查RRH光模块和RRH与BBU之间的光路。

一般情况下,该类型的告警是由于光纤或者光模块的问题导致,所以首先根据eCCM命令a输出查看CPRI Status Attrs与CPRI status。根据输出结果,可分为两大类:

1) 如果CPRI status输出结果为K_IET_FAULT_LOS_LOF_CPRIPORT,可以通过

CRT登陆到eCCM板卡ping告警对应RRH的IP地址。如果ping不通,现场首先查看RRH是否安装或者RRH供电是否正常。

2) 如果CPRI status输出的Rate值不为7,根据命令b输出排查eCCM和RRH侧

光模块的光功率: 2.1) 2.2)

相关命令如下。 命令a: SSH到eCCM

>/pltf/hral/IQXC-1-1> show

查看CPRI Status Attrs(CPRI_STATUS,正常情况下为ENABLED):

如果光模块的TX数值小于-8dBm,说明光模块有问题,建议现场更换如果光模块的TX数值在正常范围(-8~0.5dBm),且对端光模块的RX

故障光模块。

数值小于-10dBm,说明有可能光纤问题导致告警产生,建议现场更换故障光纤。

26

举例:故障状态- K_IET_IQXC_CPRI_STATUS_PORT2: DISABLED(1)/

UNKNOWN(-1)

查看CPRI status(正常情况下速率为Rate7):

命令b:

查看ECCM板卡的光模块光功率: SSH到eCCM: > /pltf/pltf/xcob> sfpsig 5

(备注:宏站1,3,5;室分0,1,2,3) 查看光模块发射功率

查看光模块接收功率

查看RRH的光模块光功率: 宏站:

登陆RRH(8*10)? bci mode /pltf/i2c/sfp0 //the SFP in RRH 1st port

/pltf/i2c/sfp1 //the SFP in RRH 2nd port

见图15-1

27

图 15-1 查看宏站RRH光模块光功率

室分:

telnet RRH ~ # t_sfp 0 //the SFP in RRH 1st port ~ # t_sfp 1 //the SFP in RRH 2nd port 该命令只针对 daisy chain 配置模式,见图15-2。

图 15-2 查看室分RRH光模块光功率

2,同时IK4006158 RFM ANT CAL FAILURE告警出现的站点,同时伴随多路Port口TX FAL,请检查RRH校验天线是否和其他天线连接错误。

16. IK4305071 CELL DIV IMBALANCE THRESHOLD EXCEEDED

16.1 告警含义

IK4305071 Cell CELL DIV IMBALANCE THRESHOLD EXCEEDED 该告警表示RRH的Rx天线口的信号的不平衡阈值超标。宏站的标准为20dBm; 28

16.2 处理建议

16.2.1 宏站RRH的处理

1) 查看故障小区对应RRH的RSSI数值 有两种方法可以查看RRH的RSSI数值。

a) SSH到eCCM,从eCCM telnet到对应的RRH ,进入bci菜单执行命令

/radioc/powermeasure/RSSI 0 (RSSI的电平值=-112.1+RXPWR(指令读数)*0.1dbm) 根据该输出值判断各port口的差值是否大于门限。

备注:该类型告警如果有RRH的VSWR,TX FAL告警并发,有可能因为部分端口的安装或VSWR问题导致该Port口不发射,引起的RSSI值异常,这种情况我们优先考虑进行天馈系统的排查。

b) 通过NEM查看RSSI值

29

图 16-1 NEM查看RSSI-1

选择“Set All Flags to True”,点击“Set Flag”,弹出对话框,选择Yes。“false”变为“true”,见图16-1和图16-2。

图 16-2 NEM查看RSSI-2

点击\,可查看到VSWR、TXPOWER、RSSI三个参数值的读取结果。见图16-3。

图 16-3 RSSI参数值

如上图中最后一列,可以查看所有RRH端口的RSSI值。

一般情况下,如果出现RSSI>-75dBm,则RSSI偏高。通过NEM查看,可以一次获得所有RRH的RSSI值。 2) 使RSSI值恢复正常

针对RSSI偏高,可通过以下步骤尝试恢复正常:

a) 通过NEM,将RSSI高的小区LOCK/UNLOCK,查看RSSI是否有改善;如果

LOCK/UNLOCK小区后RSSI正常了,继续监控,如果LOCK/UNLOCK小区RSSI依然高,进行下一步操作。

30

b) LOCK相应的小区,将RRH天线口的馈线和天线拆下来,将衰减器加负载接在

RRH上,然后打开小区查看RSSI的值是否正常。

衰减器:

衰减器类型基于RRH天线接口类型和发射功率。小于等于10W的可以使用Attenuator 20dB, 50W或Attenuator40dB, 100W。如果天线口发射功率大于10 W的RRH,衰减器需用Attenuator40dB, 100W类型的。

接口分为N型和M型。N型接口较小,M型的接口较大,如图16-4,左边20dB的为N型的接口,右边40dB的为M型的接口。括号中的M和F代表公头male和母头female

图 16-4 N型、M型接口

衰减器的后端必须加上同轴负载,负载的接口阻抗是50欧姆的就可以了,一般射频负载都是50欧姆,如图16-5。

图 16-5 50欧姆负载

31

图 16-6 TDD8天线RRH

图16-6是TDD 8天线的RRH,天线接口类型为N(F),N型的母头,接口稍小。

3) 判断故障小区对应RRH的RSSI数值

如果故障RRH的全部端口的RSSI数值都异常(>-75dBm),通常检查database中的GPSFrameoffset参数设置是否正常(F频段应为-37512,D,E应为频段-0)。该参数如果设置错误,会触发TD-SCDMA及其他干扰源的干扰。

17. IK4305050 TRACE CONFIGURATION FAILURE

17.1 告警含义

IK4305050 eNB TRACE CONFIGURATION FAILURE 该告警表示trace的配置失败。该告警一般由以下两种原因触发: ? 该eNB同时开启了CallTrace和DDT。 ? 该eNBWAL-G CT/DDT IP 配置失败。

17.2 处理建议

1) 检查相关配置

现场检查该故障站点的CallTrace和DDT是否同时开启了,另外RFtrace是否有开启。目前认定LR13.3下不能同时开启,请将部分trace关闭。

2) 检查站点是否配置了有效的TCE IP和port

32

检查snapshot中项是否配置了正确的IP地址。此告警通常是由于tceIPaddress没有设置引起的。如果MME割接之前是正常的,则意味着MME割接之后需要重新在TCE 服务器上进行de_assign/re_assgin操作。

18. IK4005083 DBU UNREADABLE MANUFACTURER DATAATTACHED HW

18.1 告警含义

IK4005083 D2U DBU UNREADABLE MANUFACTURER DATAATTACHED HW 该告警表示DBU无法读取RUC硬件模块信息。目前该告警不会影响到业务,但是该告警长期存在,会导致RUC模块满负荷运作,影响部分模块的使用寿命。

18.2 处理建议

建议检查RUC模式是否和UBU机框连接正常,且板卡的针脚正常无弯折和断裂。 排除以上硬件安装及破损,现场还可以首先尝试断电重启,如果告警IK4005083仍然存在:

保存 BTS packaging

1. 选择 Allocate Configuration Rights,见图18-1

图 18-1 Allocate Configuration Rights

2. 选择 Edit D2URuc Update Area,见图18-2

33

图 18-2 Edit D2URuc Update Area

3. 保存站址信息,见图18-3

图 18-3 保存站址信息

4. 点击 NEM 上方的 Tree View 图标,见图18-4

34

图 18-4 Tree View

5. 点击 Tree View 左方的 Alarms 图标,见图18-5

图 18-5 查看Alarms

6. 点击 Active Alarms 键,见图18-6

图 18-6 查看Active Alarms

7. 通过 NEM 点击 Tree View 左边的 HM,见图18-7

35

图 18-7 查看HW Modules

8. 右击 选择 Lock Module,见图18-8

图 18-8 Lock Module

9. 先关断 RUC/d2U 电源,关断 RUC 上供电开关 10. 找到为 RUC 供电的电源 11. 将需关电的那路供电置为 OFF

12. 检查 d2U 是否掉电(开关 RUC 电源键 看 d2U 指示灯是否一直是熄灭状

态)

13. 再次确认下电 否则替换 RUC 时非常危险

14. 可以进行替换 RUC 操作(如果仅替换 bCEM 可以只关断 RUC 上的电源开

关)

36

19. IK4007083 PCI COLLISION DETECTED UNDER

RESOLUTION & IK4007085 PCI CONFUSION DETECTED UNDER RESOLUTION

19.1 告警含义

IK4007083 Cell IK4007085 Cell PCI COLLISION DETECTED UNDER RESOLUTION PCI CONFUSION DETECTED UNDER RESOLUTION IK4007083提示源小区与其邻区存在PCI(物理小区ID)冲突; IK4007085提示源小区的两个或者多个邻区存在相同的PCI(物理小区ID),但这些邻区之间不存在邻区关系;

告警文件里Additional Text字段里可以找到邻区所在macroEnbId和PCI 值。

19.2 处理建议

针对IK4007083

在告警的Additional Text中查看remote confusions (举例:pci 174-具体冲突的PCI值, cells:874454.1-冲突小区的macroEnbId),根据该信息查看对应的小区是否存在PCI冲突。若存在,进行修改。

针对IK4007085

在告警的Additional Text中查看remote confusions (举例: pci 174-具体冲突的PCI值, cells:874832.1-彼此冲突邻区1的macroEnbId cells: 874454.1-彼此冲突邻区-2的macroEnbId),根据该信息查看对应的小区是否存在PCI冲突。若存在,进行修改。

20. IK4009041 NO CONTACT TO BOARD

20.1 告警含义

IK4009041 BCEM NO CONTACT TO BOARD 该告警表示 ECCM板卡无法检查到相应槽位BCEM板卡的连接。 37

20.2 处理建议

该类问题建议现场首先ssh到eCCM,尝试ping操作:ECCM2-root-root> ping 192.168.X.1 (bCEM板卡槽位2,则X为2;bCEM板卡槽位3,则X为3)

如果ping该故障bCEM板卡,无法ping通,建议现场工程师对该bCEM板卡进行插拔操作,判断是否由于bCEM板未正常插紧导致,之后重启 eNB进行观察。

21. IK4004166&IK4004167 CB GPS INSUFFICIENT FIXED SATELLITES

21.1 告警含义

IK4004166 ECCM CB GPS INSUFFICIENT FIXED SATELLITES IK4004167 ECCM CB GPS INSUFFICIENT VISIBLE SATELLITES IK4004166:表示信号强度数值大于30的卫星数小于4颗。 IK4004167:表示发现卫星数较少。

21.2 处理建议

1) 检查GPS安装是否符合规范,检查GPS天线正常连接,查看GPS蘑菇头是否

朝南,且无遮挡。

2) Ssh到eCCM上,通过命令查看锁星状态。 >cd /pltf/pltf/grip

>IntgetTrackedSatellites 得到类似如下输出:

表示有9颗卫星锁住。要求至少锁住5颗星。

3) 在NEM 上的Clock Properties选项下,查看可锁卫星和锁定卫星。如图21-1。

38

图 21-1 NEM查看卫星

如果查看可锁卫星和锁定卫星都大于5颗星,表示状态正常。

22. IK4004157&IK4004159&IK4004011 CB FLYWHEEL CRITICAL

22.1 告警含义

IK4004157 ECCM IK4004159 ECCM IK4004011 ECCM IK4004012 ECCM IK4004013 ECCM IK4004014 ECCM CB GPS LOCK FAILURE CB LOSS OF PRIMARY REFERENCE CB FLYWHEEL CRITICAL CB FLYWHEEL MAJOR CB FLYWHEEL MINOR CB FLYWHEEL START 4004157 MINOR CB GPS LOCK FAILURE - GPS接收器报告丢失卫星信号,或卫星信号强度signalStrength值小于30;

4004159 MINOR CB LOSS OF PRIMARY REFERENCE - GPS 无法作为振荡器的参考时钟源;

4004014 WARN CB FLYWHEEL START - eCCM板卡软件根据之前锁星规律,生产虚拟的时钟规律,并得出eCCM板卡退服倒计时(T代表倒计时总时长);

4004013 MINOR CB FLYWHEEL MINOR - eCCM板卡退服倒计时已经超过1/3T(T代表倒计时总时长),且GPS还未锁星完成;

4004012 MAJOR CB FLYWHEEL MAJOR - eCCM板卡退服倒计时已经超过2/3T(T代表倒计时总时长),且GPS还未锁星完成;

39

4004011 CRITICAL CB FLYWHEEL CRITICAL - eCCM板卡退服倒计时已经超过T(T代表倒计时总时长),且GPS还未锁星完成,为减少对邻区造成的同步干扰,eCCM板卡退服。

22.2 处理建议

1) 检查GPS安装是否符合规范,检查GPS天线正常连接,查看GPS蘑菇头是否

朝南,且无遮挡。

2) 检查GPS接收芯片硬件自检。

如果该站配置ECCM2-HR板卡,ssh到eCCM,通过命令/pltf/pltf/bist/du检查GPS接收芯片检测项结果。命令返回结果如下:

其中标红数字为非零,则表示GPS 接收芯片硬件自检失败,GPS receiver 硬件故障。

如果是ECCMu板卡,忽略这个步骤。

3) 在NEM 上的Clock Properties选项下持续观察5分钟卫星的数目及信号强度,

如图22-1。

图 22-1 NEM观察卫星数目及信号强度

在sCliSh模式下输入/pltf/pltf/grIP/enableMonitoring 1开启对卫星数目及信号强度的观察,持续5分钟后输入/pltf/pltf/grIP/disableMonitoring关闭观察。如图22-2。

40

本文来源:https://www.bwwdw.com/article/iua6.html

Top