TD LTE主要KPI指标优化指导书

更新时间:2023-11-15 00:06:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

TDD LTE

主要KPI优化指导书

适用对象:TD LTE网优工程师

摘要

章节 1 概述 2 主要KPI指标介绍 3 KPI指标监控流程 4 KPI性能分析方法 5 KPI优化分析专题 6 结束语 7 附录 概述 主要KPI指标介绍 KPI指标监控流程 KPI性能分析方法 KPI优化分析专题 结束语 附录 描述

目录

1 2

概述 .................................................................................................................................... 1 主要KPI指标介绍.............................................................................................................. 2 2.1

指标的分类 ............................................................................................................... 2 2.1.1 按照网元对象分 .............................................................................................. 2 2.1.2 按照统计时间粒度分 ....................................................................................... 2 2.1.3 按照指标相关性分........................................................................................... 2 2.2

接入类指标 ............................................................................................................... 3 2.2.1 RRC连接建立成功率 ..................................................................................... 3 2.2.2 ERAB建立成功率 ........................................................................................... 4 2.3

保持性指标 ............................................................................................................... 5 2.3.1 无线掉线率 ..................................................................................................... 5 2.3.2 ERAB掉线率(小区级) ................................................................................ 6 2.4

移动性指标 ............................................................................................................... 7 2.4.1 切换成功率 ..................................................................................................... 7

3

KPI指标监控流程 .............................................................................................................. 8 3.1 3.2 3.3 3.4 3.5 4

KPI监控流程介绍 ..................................................................................................... 8 日常KPI监控流程 .................................................................................................... 9 参数修改过程中KPI监控流程 ................................................................................ 10 ENODEB版本升级过程中的KPI监控 ................................................................... 11 割接过程中的KPI监控 ........................................................................................... 12

KPI性能分析方法 ............................................................................................................ 12 4.1

KPI性能分析方法 ................................................................................................... 12 4.1.1 TOP N最坏小区分析法 ................................................................................ 12 4.2

KPI性能分析基本技能 ............................................................................................ 14 4.2.1 KPI监控常用工具 ......................................................................................... 15 4.2.2 KPI分析用到的工具 ..................................................................................... 15 4.3

KPI优化分析过程 ................................................................................................... 16

5

KPI优化分析专题 ............................................................................................................ 19 5.1

RRC建立成功率优化专题 ...................................................................................... 19 5.1.1 RRC建立成功率的定义 ................................................................................ 19 5.1.2 RRC建立失败常见原因 ................................................................................ 20 5.1.3 优化措施 ....................................................................................................... 21 5.2

切换成功率优化专题 ............................................................................................... 23 5.2.1 切换成功率的定义......................................................................................... 26 5.2.2 切换失败常见原因......................................................................................... 27 5.2.3 优化措施 ....................................................................................................... 36 5.3

KPI常见原因处理手段 ............................................................................................ 37

6 7

结束语 .............................................................................................................................. 38 附录 .................................................................................................................................. 39 7.1 7.2

缩略语 ..................................................................................................................... 39 参考资料 ................................................................................................................. 41

图目录

图 1-1 KPI联合问题定位 ................................................................................................................ 1 图 3-1 日常KPI监控流程图 ............................................................................................................ 9 图 3-2 参数修改后KPI监控流程图 ............................................................................................... 10 图 3-3 ENodeB版本升级KPI监控流程图 .................................................................................... 11 图 4-1 KPI优化分析流程图........................................................................................................... 18 图 5-1 RRC接入流程 ................................................................................................................... 19 图 5-2 TA接入统计分布 ............................................................................................................... 21 图 5-3 优化后RRC建立成功率 .................................................................................................... 22 图 5-4 优化后无线掉线率 .............................................................................................................. 23 图 5-5 S1切换流程 ....................................................................................................................... 27 图 5-6 EUTRAN邻接关系 ............................................................................................................ 28 图 5-7 同频同PCI配置 ................................................................................................................. 35 图 5-8 邻区错配 ............................................................................................................................ 35 图 5-9 优化后切换成功率 .............................................................................................................. 36

表目录

表 2-1 RRC连接建立成功率与质量等级 ........................................................................................ 4 表 2-2 小区ERAB建立成功率与质量等级 ..................................................................................... 5 表 2-3 业务掉话率与质量等级 ........................................................................................................ 6 表 2-4 分组域业务掉线率与质量等级 ............................................................................................. 7 表 2-5 业务切换成功率与质量等级 ................................................................................................. 8 表 4-1 TOP N最坏小区列表 ......................................................................................................... 13 表 5-1 掉话常见原因 ..................................................................................................................... 20

2.3.1.3

KPI指标取值与质量等级

表 2-3 业务掉话率与质量等级 序号 1 2 3 统计对象 CLUSTER/Cell级 CLUSTER/Cell级 CLUSTER/Cell级 统计粒度 24小时 24小时 24小时 取值范围 大于1.5% 1%-1.5% 0.4%-1% 质量等级 差 良 优 2.3.2 ERAB掉线率(小区级)

无线掉线率反映了系统的业务通讯保持能力,也反映了系统的稳定性和可靠性。本指标用于了解该小区内UE进行掉话的概率,部分反映了该小区范围内用户进行业务的感受度。掉话是指由于异常原因被ENB主动发起ERAB释放的情况;公式统计的是异常原因的掉话率,现在归为正常释放的原因值包括:用户不活动、操作维护干预、过载控制导致的释放、重定向、CCO等,其他情况归为异常。

2.3.2.1 公式定义

ERAB掉线率= (切出失败的E-RAB数 +eNB请求释放的E-RAB个数 -正常的eNB请求释放的E-RAB数)/( 遗留E-RAB个数 +E-RAB建立成功数 +切换入E-RAB数 )*100%

2.3.2.2 E-RAB掉线率

集团规范(V1.1.0)集团规范(V1.1.0)600 版本公式对应600版本PIC373210381+C373210391+C373210421+C373210431+C373210441+CERAB.NbrReqRelEnb373210451+C373210501+C373210311173∑511+C373210531+C373505354+C3(ERAB.NbrReqRelE73505364+C373505461nb -ERAB.NbrReqRelEnb.ERAB.NbrReqRelEnbC373210501+C373210531+C37350311438.NormalNormal5364+ERAB.HoFail)/∑ERAB.HoFail(ERAB.NbrSuccEstaC373210541b+ERAB.NbrLeft)*100%ERAB.NbrLeftC373240828ERAB.NbrSuccEstabC373505473+C373505481311149 6

2.3.2.3

KPI指标取值与质量等级

表 2-4 分组域业务掉线率与质量等级 序号 1 2 3 统计对象 CLUSTER/Cell级 CLUSTER/Cell级 CLUSTER/Cell级 统计粒度 24小时 24小时 24小时 取值范围 大于4.0% 2.0%-4.0% 小于2.0% 质量等级 差 良 优 2.4

2.4.1

移动性指标

切换成功率

切换成功率是系统移动性管理性能的重要指标,切换过程不区分同频/异频。

2.4.1.1 公式定义:

切换成功率=(eNB间S1切换出成功次数+ eNB间X2切换出成功次数+ eNB内切换出成功次数)/(eNB间S1切换出请求次数+ eNB间X2切换出请求次数+ eNB内切换出请求次数)*100%

2.4.1.2 切换成功率

集团规范(V1.1.0)HO.AttOutInterEnbS1集团规范(V1.1.0)600 版本公式C373271591+C373302491对应600版本PI311445311448311440311443311450311451HO.SuccOutInterEnb(HO.SuccOutInterEC373271580+C373302480S1nbS1+HO.SuccOutInHO.AttOutInterEnbXterEnbX2+HO.SuccOC373261292+C3732921922utIntraEnbHO.SuccOutInterEnb)/(HO.AttOutInterEnbS1+HO.AttOutInC373261280+C373292180X2terEnbX2+HO.AttOuHO.AttOutIntraEnbtIntraEnb)*100?73250900+C373281800HO.SuccOutIntraEnbC373250980+C373281880 7

2.4.1.3

KPI指标取值与质量等级

表 2-5 业务切换成功率与质量等级 序号 1 2 3 统计对象 CLUSTER/Cell级 CLUSTER/Cell级 CLUSTER/Cell级 统计粒度 24小时 24小时 24小时 取值范围 小于90% 90%-98% 大于98% 质量等级 差 良 优 3

KPI指标监控流程

KPI监控的目的:第一时间发现影响业务及用户感受的网络异常事件并解决之;如:某个站点掉话率超过了50%,我们就要第一时间发现它,并找出解决问题的办法。鉴于KPI问题发现的及时性及重要性,我们须有一套合理的KPI监控机制及解决问题的流程。同时,需要有合适的监控工具、分析工具来配合工作。及时发现由于传输问题、资源拥塞、小区退服、干扰严重、NodeB硬件故障、ENODEB参数配置错误等引起的业务掉话;

我们对KPI监控大概分为四类: 1. 2. 3. 4.

日常的KPI监控;

参数修改过程中的KPI监控;

ENODEB、NodeB版本升级过程中的参数修改; 用户割接过程中的KPI监控。

KPI日常监控是一项长期的工作,需要每天监控,形成例行的工作,并通过采用KPI日报方式进行汇报,日报的内容主要包括CS最坏小区、PS最坏小区、RRC连接成功率低的最坏小区、资源受限最坏小区等等;做到及时预警和解决问题。

3.1 KPI监控流程介绍

KPI监控主要有四类监控内容,分别为:日常KPI监控、参数修改过程中的KPI监控、ENodeB版本升级过程中KPI监控、用户割接过程的KPI监控。各项监控又有不同的监控内容,以及不同的输出形式;如日常KPI监控用日报的形式来体现,其他用KPI对比报告形式来体现;各类监控形式又根据处理的问题不同,提取的KPI指标采用的统计时间粒度也不同,粒度的选择按照问题定位的需要来决定。

KPI日常监控是一个长期工作,最终以日报的形式输出,并且将各类最坏小区汇总后,以邮件的形式发给相关人员进行处理。

8

3.2 日常KPI监控流程

图 3-1 日常KPI监控流程图

EMS导出全网 粒度1天 cell级数据 用KPI工具筛选最坏小区 输出Excel形式KPI日报 用固定格式邮件发给相关人员 交网优人员 处理 问题处理小组对各类最坏小区分类、汇总、定位 交研发或用服处理 覆盖问题 最坏小区 分类 设备/版本问题 参数问题 交规划人员 处理

9

参数修改过程中KPI监控流程

图 3-2 参数修改后KPI监控流程图

10

3.3

3.4 ENodeB版本升级过程中的KPI监控

图 3-3 ENodeB版本升级KPI监控流程图

当前版本版本 是 否 是否回退 执行工单 升级到新的版本 邮件和电话通知执行负责人 网络KPI监控 (15分钟粒度) 定位最坏小区,是否与版本升级有关系 否 簇级KPI是否正常 是 继续监控 (15分钟粒度) 正式word报告输出 (指标修改前后小时粒度KPI对比一小时输出一次) 结束

11

3.5 割接过程中的KPI监控

在整网割接替换其他厂家的网络中,比如香港的CSL网络,该网络是我们替换诺基亚的设备;当我们的网络优化好后,将现网的用户要逐步割接到我们网络,在每次割接过程中,用户会不断注册到我们的网络,在网络负荷增加的情况下,要密切关注KPI指标的变化;该监控流程、监控内容、监控方法、以及报告输出与上一节ENodeB版本升级过程中的监控是一样的,具体内容参考ENodeB版本升级时KPI监控一节内容。

4

4.1

KPI性能分析方法

KPI性能分析方法

不同的网络问题有不同的性能分析方法,在掌握现网运行情况和存在的问题后,选择合适的一种或多种分析方法,常用的性能分析方法有:

1. TOP N最坏小区法:按照所关注的话务统计指标(如掉话率、连接成功率、切换

失败率等),根据需要取忙时平均值或全天平均值,找出最差的N个小区,作为故障分析和优化的重点,也可以据此排定优化工作的优先顺序。

2. 时间趋势图法:指标统计的趋势图是话务分析的常用方法,分析工程师可以按小

时、天或周作出全网、Cluster或者单个小区的单个或多个指标的变化趋势图,从中发现话务统计指标的变化规律。

3. 区域定位法:网络性能指标的变化往往发生在部分区域,由于话务量增长、话务

模型变化、无线环境改变、少数基站故障或上下行干扰造成了这些区域的指标变差,从而影响到全网的性能指标,可以对比变化前后的网络性能指标,在电子地图上标出网络性能变化最大的基站或扇区,围绕问题区域重点分析。

4. 对比法:一项话务统计指标往往受多方面因素的影响,某些方面改变,其他方面

可能没有变化,可以适当选择比较对象,证实问题的存在,并分析问题产生的原因。看指标时,不能只关注指标的绝对数值是高是低,关心的应该是指标的相对高低情况。

4.1.1 TOP N最坏小区分析法

在KPI优化分析的整个过程中,TOP N最坏小区分析法是最有效的一个手段,贯穿与整个优化阶段;主要是通过对TOP N小区的关注,可以解决网络的主要问题;每天网络中都有可能发生一些异常的掉话事件,这些事件可能代表一类问题,解决了TOP N最坏小区的问题就可以解决这一类的问题,所以我们从TOP N小区着手是最好最直接的解决问题的办法之一。

12

TOP最坏小区分析法适用与所有的指标优化分析,主要是根据一定的门限值选出TOP N最坏小区,这个门限的定义根据指标的不同而不同;N是最坏小区的个数,当最坏小区比较多且没有精力去关注的时候,可以将N的个数适当的减少,只关注最差的小区。TOP N小区分析方法主要有下面几个步骤: 第一步:按照关注指标的条件筛选出TOP N小区;

第二步:对TOP N小区进行健康性检查,检查最坏小区的 传输、单板问题,或者是不是由于某突发的外界事件造成,如恶劣天气、集会、节假日的高话务造成; 第三步:检查小区无线参数配置、邻区、小区半径,与正常小区进行比较; 第四步:导出与所关注指标关联最紧密的指标进行分析,从侧面来发现问题所在; 例:某网络出现全网的切换成功率变差的情况,现在对切换成功率采用TOP N分析方法分析问题;

详细操作可以参考如下案例:

第一步:按照关注指标的条件筛选出TOP N小区;

我们用 KPI分析功能筛选出TOP N小区(也可以用其他的工具选出,导出到EXCEL 排序),这里我们取切换失败次数高的个最坏小区;

表 4-1 TOP N最坏小区列表

开始时间 结束时间 ME ID名称 0040_广州广州大桥南FE(40) 0040_广州广州大桥南FE(40) 0040_广州广州大桥南FE(40) 1484_广州周门丽安大厦FEprc(1484) YY-切换成功率分子 YY-切换成功率分母 切换失败次数 2013-12-30 00:00:00 2013-12-31 00:00:00 12264 24458 12194 2013-12-28 00:00:00 2013-12-29 00:00:00 7403 16749 9346 2013-12-29 00:00:00 2013-12-30 00:00:00 8967 17625 8658 2013-12-30 00:00:00 2013-12-31 00:00:00 2721 5263 2542 2013-12-29 00:00:00 2013-12-28 00:00:00 2013-12-30 00:00:00 2013-12-29 00:00:00 0301_广州碧海大4844 厦FE(301) 1484_广州周门丽安大厦2424 6938 2094 3986 1562 13

开始时间 结束时间 ME ID名称 FEprc(1484) 2013-12-28 00:00:00 2013-12-29 00:00:00 0301_广州碧海大4558 厦FE(301) 5726 YY-切换成功率分子

YY-切换成功率分母 切换失败次数 1168 第二步:检查TOP N最坏小区的 、传输、硬件问题,或者是不是由于某突发的外界事件造成,如恶劣天气、集会、节假日的高话务造成;

接下来对每个小区进行健康性检查,主要关注点在日常告警、BPL单板/RRU问题等等,经过检查发现这些站点的切换目标侧都无告警,但这些站点都出现切换过程中在目标侧准备失败的问题。

第三步:检查小区无线参数配置、邻区、小区半径,与正常小区进行比较; 1. 2. 3.

小区状态问题:经过核查,没有问题。 配置问题:小区参数配置,没有问题。

telnet到前台发现BPL单板核2无法连接,怀疑单板故障。现场更换BPL单板后,问题解决。

4.2 KPI性能分析基本技能

掌握KPI统计工具及分析工具的应用: 1. 2.

使用工具可以快速了解全网运行情况,快速的筛选出TOP N最坏小区列表; 使用不同的分析工具可以多方位多维度的定位问题,迅速找到问题点;

14

掌握信令流程和基本原理: ?

异常定位分析中能够有的放矢,根据流程和基本原理能够迅速查找其他的相关指标进行辅助分析。

? 熟悉流程和原理,可以把异常的KPI和网络问题(如覆盖问题、干扰问题等)有机关联,根据异常KPI大致确定问题的性质,从而选择相应分析工具进行深入分析。

性能分析工作要求工程师掌握基本的信令流程,熟悉标准口的协议栈,了解产品实现有哪些相关算法;对于名目繁多的RRM算法,工程师至少要从概念上有所了解,如果分析的商用网络中包含部分算法,则需要对这些算法进行深入的学习。

4.2.1 KPI监控常用工具

?

网管工具NetNumenU31:统计KPI原始数据、告警数据、小区无线参数配置、地面参数配置; ?

KPI日报生成工具:对重要指标按某种条件进行分类,筛选出最坏小区;

4.2.2 KPI分析用到的工具

?

CNO工具:CNO具有KPI分析功能,可以按照各种条件筛选最坏小区,并且指出该指标对应的计数器;该工具的使用方法参考《ZXPOS CNO1-LTE 应用指导书》或者软件帮助; ?

SignalTrace :跟踪ENB各接口信令;可以跟踪S1,X2口以及Uu口(和UE 的RRC层交互信令)的信令,查KPI问题最常用的就是RRC信令。能够进行ENB信令跟踪,这是对外场KPI优化及网优及维护人员的基本要求。该信令跟踪工具非常强大,用于KPI分析的主要是按照小区(UE_Cell)和按照IMSI(或GID)进行跟踪。前者可以跟踪多个用户的信令,后者只跟踪一个用户的信令,但如果RRC链接过程没有完成,则无法跟踪,主要是因为ENB只有在RRC链接过程完成后才能够从CN得到该用户的IMSI。该工具的使用方法参考《TD-LTE(12.13.xx)网管网优常用工具及操作指导书_R1.3》; ?

ENB关联日志:关联日志的应用场景一般是:出现异常且没有跟踪到RRC信令,可以通过关联日志进行异常时间上下文信令分析来定位。异常可以按照GID (或IMSI)和小区id来进行查询。关联日志的另一个应用是可以对各种异常进行汇总统计; ?

ENodeB LMT :ENodeB本地操作维护的工具,除具备OMCB的全部操作功能外,还可以提供更详细的小区,UE等信息采集。ENodeB的本地维护(LMT)系列工具包括EOMS,MTS

15

缩略语 英文全名 中文解释 RRU Radio Remote Unit 射频拉远单元 RSCP Received Signal Code Power 接收信号码功率 RTWP Received Total Wideband Power 接收总宽带功率 SAAL Signaling ATM Adaptation Layer ATM信令适配层 SCCP Signaling Connection Control Part 信令连接控制部分 Selective Combining Selective Combining 选择合并 SNR Signal to Noise Ratio 信噪比 TB Transport Block 传输块 TCP Transfer Control Protocol 传输控制协议 UDP User Datagram Protocol 用户数据报协议 UE User Equippment 用户终端 VIP Very Important People 重要客户 VP Video Phone 视频电话 WAN Wide Area Network 广域网 7.2 参考资料

《LTE基本原理》

《ZXSDR UniRAN TDD-LTE基站(V3.10.21) 性能计数器参考》 《ENB-PM(V2.1.0)U31 V12.13.30》

41

?

NodeB 异常探针: 在LTE商用局外场,ENodeB异常探针分析是监控基站运行状况的有效手段,ENodeB各模块在发现异常后会自动记录相关信息,便于定位问题。但此方法需要较专业的背景知识,即需要了解各单板及模块的功能和接口;现场人员如果不能做简单的分析,只要获取异常探针发给后方研发人员就可以。ENodeB上报的异常探针,存储在各自OMCB服务器上。NodeB异常探针分析,需要分别从不同的OMCB服务器FTP下载异常探针文件,再使用异常探针工具进行分析汇总。

? CTS工具:CTS是端对端工具,可以按照IMSI进行深度信令跟踪,尤其可以跨MME边界进行跟踪,这样就非常适合对VIP用户的跟踪;如果采用SignalTrace进行跟踪,则需要多个ENODEB进行跟踪,比较麻烦。CTS可以跟踪内部网元之间的交互信令,可以跟踪S1口及Uu口的信令,这就是所谓的深度跟踪。其基本原理就是在CTS server上建立IMSI任务,将该IMSI任务送到CN前台,CN前台再通过和CN个模块及ENODEB约定好的接口送给各个模块,各模块收集到这个IMSI相关信令后通过前台汇总到CTS server上。上述的接口属于私有接口,所以,这个工具只能支持我们自己的CN和ENODEB(其他厂商的核心网需要进行对接)。CTS信令可以采用离线工具进行查看分析。该工具的使用可参考《TD-LTE CTS信令跟踪工具使用指导手册》

? UE log: KPI指标的分析过程中,DT测试也是非常重要的辅助手段;很多问题,从网络侧的一些信令跟踪及trace常常无法定位问题,只有结合UE log才能最终分析定位。我们常用的路测软件有QXDM/APEX(QCAT),CNT/CNA等。 CNT/CNA都是网优常用路测软件,CNT/CNA的使用方法详见相应的帮助文档及网优工具部对外发布的说明文档。其中高通提供的QXDM及解析工具APEX(QCAT),功能非常强大,多年以来,为我们系统的稳定成熟及提高做出了重大贡献。

4.3 KPI优化分析过程

分析思路:

KPI优化过程就是一个发现问题并解决问题的过程;运维阶段的KPI优化主要是从后台网管提取所关注的性能数据,对性能数据分类汇总,将汇总的值与局方的要求值进行比较,如果某个指标比局方要求的值低,那么就要对该指标进行重点的分析,找到影响该指标的因素并提出解决方案,最后输出报告给局方;如果指标比局方要求的高则不需要特别关注。

KPI指标分析过程是一个从宏观到微观,从全局到局部的一个过程; 1.

第一步,从全网的角度来看重点指标的情况,如果没有什么问题则不用做何处理,否则要定位发生问题的ENB网元; 2.

第二步,对相应CLUSTER指标数据进行分析,找出指标有问题的CLUSTER;

16

3.

第三步,对问题CLUSTER下面的小区级指标进行分析,找出最坏小区或TOP N小区,如果该CLUSTER所有小区的指标普遍较低,这种共性的现象可能是由于参数设置造成,核查一下该CLUSTER下小区与正常CLUSTER下小区的无线参数配置是否一致;

4. 第四步,综合最坏小区的KPI数据、告警数据、DT测试数据、用户投诉情况四类数据综合分析,提出解决方案。 ?

问题排除法:

从网管的告警数据中可以直接检查该ENodeB,BPL板、传输的运行情况,如果问题存在明显的传输断链、硬件设备等,可以很快定位问题原因; ?

突发事件关联:

对大量站点出现的问题就需要考虑是否是由于突发事件造成;比如大型集会、恶劣天气、误操作等都会对网络指标造成影响,根据各自的程度深浅,影响的范围也有所区别; ?

无线参数比较法:

如果出现某些站点突然出现故障,还可以检查该小区无线参数的配置,与其它正常小区的无线参数配置是否一致,如果不一致则改为一致,因为该小区可能是由于无线参数被误改而造成指标下降; ?

指标关联法:

如果某指标较差,一定要看一下与之相关联的指标情况,往往从这些关联的指中能发现共同的问题; ?

综合定位法:

排除了以上几个原因后,运用DT数据、KPI数据、ENB信令分析等数据,综合分析指标问题,可以定位出小区的指标问题。

17

图 4-1 KPI优化分析流程图

开始性能指标提取eNB指标异常?Y突发、可自愈

原因分析和记录Y异常?气候变化、假日、集会、传输瞬断、电源故障等N存在设备改进建议告警?Y设备告警处理NYeNB指标恢复?N异常小区TOPN及地理化显示传输、软硬件版异常小区本、无线参数配置存在共性?YNCN/ENB传输硬件软件版本干扰无线参数时间段??相应共性专题分析NY问题解决?N单小区异常指标分析呼通掉话切换2/3G互操作PS速率??N相关专题处理若经多次处理后,确认为设备Bug或系统问题,向研发反馈指标正常?Y结束 18

5

KPI优化分析专题

本章主要介绍如何从网管数据来分析指标问题,以及如何结合计数器来优化KPI的思路,每个专题详细的分析方法及案例见各专题优化指导书。

5.1 RRC建立成功率

本章主要从网管的角度来分析问题,通过参数的调整达到优化的目的。

5.1.1 RRC建立成功率的定义

从空口信令上看,RRC建立过程如下:

图 5-1 RRC接入流程

本流程图表述了RRC连接建立过程。包含了RRC连接建立成功,RRC连接建立被拒绝和RRC连接建立失败过程。

? 采样点1:eNodeb接收到UE的RRC连接建立请求消息,进行采样统计。 ? 采样点2:eNodeb发送RRC连接建立消息,进行采样统计。

19

? 采样点3:eNodeb接收到RRC建立完成消息,进行采样统计。 ? 采样点4:eNodeb发送RRC连接拒绝消息,进行采样统计。

? 采样点5:eNodeb等待RRC连接建立完成消息定时器超时,采样统计。 RRC建立失败常见原因

表 5-1 掉话常见原因 指标或计数器 C373200001 C373200002 C373200003 C373200005 C373200006 C373200007 C373200009 C373200010 C373200011 C373200013 C373200014 C373200015 C373200017 C373200018 C373200019 指标公式或计数器描述信息 mt-Access类型RRC连接失败次数,定时器超时(次) mt-Access类型RRC连接失败次数,eNB接纳失败(次) mt-Access类型RRC连接失败次数,其他原因(次) mo-Signalling类型RRC连接失败次数,定时器超时(次) mo-Signalling类型RRC连接失败次数,eNB接纳失败(次) mo-Signalling类型RRC连接失败次数,其他原因(次) mo-Data类型RRC连接失败次数,定时器超时(次) mo-Data类型RRC连接失败次数,eNB接纳失败(次) mo-Data类型RRC连接失败次数,其他原因(次) highPriorityAccess类型RRC连接失败次数,定时器超时(次) highPriorityAccess类型RRC连接失败次数,eNB接纳失败(次) highPriorityAccess类型RRC连接失败次数,其他原因(次) emergency类型RRC连接失败次数,定时器超时(次) emergency类型RRC连接失败次数,eNB接纳失败(次) emergency类型RRC连接失败次数,其他原因(次) 5.1.2 影响RRC接入成功率的因素

影响RRU接入的主要因素如下,可在优化RRC成功率时参考 1,基站故障

2,基站参数,PRACH配置,最小接入电平设置, 3,上行干扰,NI太高

4,弱场接入,RRC无法完成。

5.1.2.1 弱场接入案例

就某项目外场统计结果来看,RRC接入失败多发生在C373200005(mo-Signalling类型RRC连接失败次数,定时器超时)即初始接入MSG5超时。现场在排除无线环境、NI、基站故障等异常的情况下,仍然发现不少基站存在MSG5超时的问题。查看版本默认配置的小区最小接入电平值(当前为-130dBm),怀疑此值设置过于宽松,容易

20

造成远距离接入而导致MSG5超时。对经常发生MSG5超时的基站统计其TA,TA分布如下。

图 5-2 TA接入统计分布

求和项:TA在范围[0,1]的?求和项:TA在范围[2,3]的?求和项:TA在范围[4,5]的?求和项:TA在范围[6,7]的?求和项:TA在范围[8,9]的?求和项:TA在范围[10,11]?求和项:TA在范围[12,13]?求和项:TA在范围[14,20]?求和项:TA在范围[21,27]?求和项:TA在范围[28,34]?求和项:TA在范围[35,40]?求和项:TA在范围[41,50]?求和项:TA在范围[51,80]?求和项:TA在范围[81,最?求和项:最大TA值(16Ts)100000009000000800000070000006000000500000040000003000000200000010000000系列1 为了保证接收侧(eNodeB侧)的时间同步,LTE提出了上行定时提前(Uplink Timing Advance)的机制。

在UE侧看来,timing advance本质上是接收到下行子帧的起始时间与传输上行子帧的时间之间的一个负偏移(negative offset)。eNodeB通过适当地控制每个UE的偏移,可以控制来自不同UE的上行信号到达eNodeB的时间。对于离eNodeB较远的UE,由于有较大的传输延迟,就要比离eNodeB较近的UE提前发送上行数据。最终目的是当不同距离的UE接入同一eNodeB时,为了保证上行传输的正交性,避免小区内(intra-cell)干扰,eNodeB要求来自同一子帧但不同频域资源(不同的RB)的不同UE的信号到达eNodeB的时间基本上是对齐的。 1TA=16Ts=16*32.55ns*300000000/2=78m

从以上统计可以看出,问题基站的TA都集中在TA[14,20]以后了,即14*78m=1092m。按照项目现场布局,属于远距离接入,且数量较多符合之前的猜想。对此,项目组决定统一修改小区最小接入电平值由-128dbm改为-120dbm,规避超远距离接入带来的MSG5超时问题同时降低掉话率。 优化措施

21

2013年12月11日对全网修改此参数后,RRC建立成功率和无线掉线率指标明显提升。

图 5-3 优化后RRC建立成功率

集团-502RRC连接建立成功率99.60?.40 13-12-11 00:00:00, 99.41?.20?.00?.80?.60?.40?.20?.00?.80?.60?.40% 22

图 5-4 优化后无线掉线率

集团-502无线掉线率1.40%1.20%1.00%0.80%0.60%0.40%0.20%0.00 13-12-11 00:00:00, 0.93% 5.1.2.2

上行干扰案例

提取TOP小区每小时的RRC建立成功率,与每小时粒度的NI相对比,观察是否RRC建立成功率低时,NI值升高。

23

对比底噪值与RRC连接建立成功率可以发现,当100个RB计数器噪声之和超过-9000dBm之后,RRC连接建立成功率将明显下降。

如果因干扰导致接入成功率突降,需要进行干扰排查

5.1.2.3 基站故障案例

[TDD]西安陕西宾馆新办公楼3小区均出现RRC建立成功率低,核查发现基站出现故障。

小区名称 [TDD]RRC连接建立成功率(百分比) RRC失败次数 mt-Access类型RRC连接建立成功次数(次) mo-Signalling类型RRC连接建立成功次数(次) mo-Data类型RRC连接建立成功次数(次) highPriorityAccess类型RRC连接建立成功次数(次) emergency类型RRC连接建立成功次数(次) mt-Access类型RRC连接失败次数,定时器超时(次) mt-Access类型RRC连接失败次数,eNB接纳失败(次) mt-Access类型RRC连接失败次数,其他原因(次) mo-Signalling类型RRC连接失败次数,定时器超时(次) mo-Signalling类型RRC连接失败次数,eNB接纳失败(次) [TDD]西安陕西宾馆新办公楼 39.43% 5575 7109 1706 39274 0 0 1202 897 470 471 2535 24

网元反复出现如下告警,导致RRC连接建立成功率降低。

网元 告警级别 主要 严重 主要 西安陕西宾馆新办公楼 严重 主要 次要 主要 主要 严重 告警码 小区退出服务(198094832) RRU链路断(198097605) 天馈驻波比异常(198098465) 设备掉电(198092295) CPU过载严重告警(198092390) CPU过载告警(198092391) 光口接收链路故障(198098319) 单板处于初始化状态(198092348) 软件运行异常(198097604) 发生时间 2014-4-14 16:11 2014-4-14 16:14 2014-4-14 16:02 2014-4-14 16:11 2014-4-13 11:15 2014-4-13 11:12 2014-4-13 10:43 2014-4-13 10:39 2014-4-13 10:39

告警类型 服务质量告警 处理错误告警 设备告警 设备告警 处理错误告警 处理错误告警 通信告警 处理错误告警 处理错误告警

5.2 ERAB建立成功率

ERAB建立失败较多时,首先核查基站有无影响业务的告警,如传输类,RRU类故障。如果没有告警,则需要继续分析失败原因。通过跟踪基站信令观察ERAB建立失败过程。

[TDD]E-RAB建立成功率(百分比) 初始的E-RAB建立失败次数,其他原因(个) 7433 3160 1395 起始时间 小区名称 2014-4-13 [TDD]西安小寨ZT-XABO719TL-0(1) 2014-4-13 [TDD]西安小寨ZT-XABO719TL-1(2) 2014-4-13 [TDD]西安小寨ZT-XABO719TL-2(3) 64.14% 63.35% 64.58% 使用系统工具中的信令跟踪功能,跟踪UE级小区信令;

25

查看ERAB建立失败原因,针对具体原因进行排查

5.3

5.3.1

切换成功率优化专题

切换成功率的定义

切换分同频、异频切换,小区间、基站间切换。本章节以S1口基站间同频切换为例,其切换流程如下

26

图 5-5 S1切换流程

当eNodeB接收到从UE来的测量报告消息,根据消息进行判决,如果条件满足eNodeB间S1切换,则触发UE在eNodeB间切换过程。eNodeB发送切换请求消息给MME。目标eNodeB接收到MME的Handover Request消息,进入资源准备。如果资源准备成功,给MME回复Handover Request Acknowledge。如果资源准备失败,则给MME回复HandoverFailure。MME给源侧eNodeB发送Handover Preparation Failure,切换准备过程结束。源侧eNodeB接收到从MME来的Handover Command消息,则发起切换过程,给UE发送Handover Command(i.e. RRC Connection Reconfiguration)。 目标侧eNodeB接收到UE的RRC重配完成消息后,发送Handover Notify消息给MME,指示UE已经成功切换到了目标小区。MME接收到Handover Notify消息后,给源eNodeB发送UE Context Release Command消息,切换过程成功结束。 切换失败常见原因

切换成功率统计点都是在切换出一侧进行统计,排查该指标时建议使用网管EUTRAN邻区关系对进行统计,通过该手段能及时发现切换出源侧和目标侧的问题,如在目标侧准备失败、在目标侧无法建立回源侧发起重建立、切换等待响应超时等。

27

图 5-6 EUTRAN邻接关系

5.3.2 切换成功率低处理思路

切换过程中包含切换准备阶段,与切换执行阶段,2个阶段涉及到的因素各不一样,因此需要分开来处理。

具体来说,切换准备失败问题,多由外部邻小区参数配置错误(邻区配置正确)或者切换准备目标基站故障引起。分类原因有

换出准备失败次数,等待切换响应定时器超时(次) 切换出准备失败次数,目标侧准备失败(次) 切换出准备失败次数,其它原因(次) 切换出准备失败次数,源侧发生重建立(次) 切换执行失败,发生在切换命令下发后,终端执行时失败,与无线环境,邻区配置的合理性强相关。分类原因有

源侧发生重建立(次) 目标侧发生重建立(次) 其它原因(次) RRC重配完成超时(次) 分析切换失败,可定制测量类型为:[LTE]E-UTRAN邻接关系的KPI报表,统计每一个邻区对的切换情况。需要用到的计数器模板如下:

28

对于整网切换成功率较低的网络,可以先按切换细分模板提出整网指标,分析切换准备与执行那个导致的失败次数较多,再按TOP小区针对分析处理。

5.3.2.1 切换准备失败处理

切换准备失败需要提取切换准备相关的计数器分解,查看具体的准备失败原因。切换准备失败主要关注邻区参数的正确性。

切换准备失败需要定期核查现网邻区数据,保证数据的有效与准确 核查对象:

1.现网中邻区参数配置错误的,如外部小区定义中与邻接基站定义不一致的;定期提取规划数据,进行核查

2,现网中对异厂家站点邻区定义错误的,需定期索取异常家工参核查;

现网中邻区基站ID错误的,即不存在于异厂家网管,也不存在与中兴网管中的邻区关系。需要删除这类邻区数据。

3.定期核查现网中超远邻区关系。市区内暂以2.5KM为界,郊县不受此限制 核查外部邻小区配置参数是否正确。

核查规划参数配置表中ExternalEUtranCellTDD邻小区的相关配置参数,是否与邻接基站无线参数配置一致。

推荐核查工具:健康卫士

29

核查结果:

切换准备失败原因为切换出准备失败次数,其它原因(次)时,需要详细分析。

5.3.2.2 切换执行失败处理

切换执行阶段失败同样需要提取切换准备相关的计数器分解,查看具体的执行失败原因。 ?

切换出执行失败次数较多,且成功率为0的小区对,重点核查切换目标小区是否与周边站点同频同PCI,邻区配置是否合理,是否加了较远的站点为邻区,且与周边站点同PCI。 ?

切换出执行次数较多,有一定几率成功,有一定几率失败的邻区对,核查目标基站否存在上行干扰,如果存在上行干扰,即需要进行干扰排查。 ?

超级小区配置邻区,当主小区与辅小区邻区PCI相同时,只能配置超级小区主小区之间的邻区,不能配置主小区到辅小区的邻区。非超级小区也不能添加对辅小区的邻区。否则会造成切换执行失败。 ?

对于异频切换执行失败较多的站点,核查异频启动测量A2事件和A3事件配置是否合理。

5.3.3

5.3.3.1

案例

切换准备失败案例

两个小区(71129、71238)均为切换至昌平沙河东北ZL-2(0:460:00:71246:2)失败,失败原因均为切换准备时目标侧准备失败,而且绝大多数均为X2切换失败:

30

切换准备失败信令跟踪:

基站分布图

失败原因是由于在做切换时,发送X2切换请求后,目标侧基站回复准备失败,拒绝原因是“未知的MME Code”,经核查发现是由于目标侧基站配置SCTP偶联时只配置了对一个MME,漏配了一个。把对相应MME的SCTP进行添加后,问题解决。

5.3.3.2 切换执行失败案例

提取小区对级的切换指标,统计邻区对的切换成功率

31

小区名称网元小邻区关系名称区

切换出执行成功率(小区对)切换出执行失败[TDD]西安外国语学院-ZLH-XABO436TL-2(3)591258[TDD]西安城南客运站-ZLH-XABO260TL-1(2)59108232591258_3_591243_1(0:460:00:591243:1)0.00D591082_2_591035_3(0:460:00:591035:3)0.00'eNB间S1口小区间同频切换出准备成功次数(次)4427eNB间S1口小区间同频切换出执行成功次数(次)00 [TDD]西安外国语学院-ZLH-XABO436TL-2(3)小区切换至目标小区591243_1小区切换出执行成功率为0,核查该站外部邻区关系中(ExternalEUtranCellTDD)591243_1小区PCI为69。但该站ID在中兴网管中并不存在,在异厂家工参中也不存在,是错配邻区。

srcENBId mcc mnc 591258 591258 591258 460 460 460 00 00 00 eNBId cellLocalId plmnIdList freqBandInd earfcn pci 460,00 460,00 460,00 39 39 39 1890 1890 1890 69 70 71 591243 1 591243 2 591243 3 观察该站周边站点,发现临近站点西安华东服饰广场第1小区PCI为69,可见邻区配置错误。

解决办法:删除原因无用邻区,包括EUtranRelation与ExternalEUtranCellTDD邻区中对591243错误的数据,重新添加西安华东服饰广场591545的邻区关系

管理网元ID 591545 591545 591545 小区标识 1 2 3 1 2 3 基带资源配置 PLMN列表 460,00 460,00 460,00 物理小区识别码 69 70 71 32

5.3.3.3

切换执行失败案例

邻区关系591082_2_591035_3切换执行成功率为0,核查目标小区591035_3周边存在同PCI小区590771_3,该站PCI分配完全与591035站点相同

管理网元ID 591035 591035 591035 590771 590771 590771 小区标识 1 2 3 1 2 3 基带资源配置 1 2 3 1 2 3 PLMN列表 460,00 460,00 460,00 460,00 460,00 460,00 物理小区识别码 150 151 152 150 151 152

33

解决方法:

重新规划2个站点中某个站点的PCI,解决近距离同PCI问题。

5.3.3.4 异厂家同频同PCI配置

某站切换成功率低,通过EUTRAN邻接关系发现在其无法在目标侧切换入,切换在源侧发起重建立。后前台测试发现HW有同频同PCI配置基站在问题站点附近,修改ZTE基站PCI,这两站点切换恢复正常。

34

图 5-7 同频同PCI配置

5.3.3.5

邻区错配

基站1与基站2有切换关系,但实际邻区配置为基站1与基站3有双向邻区关系,导致切换异常。删除原有邻区关系,新增加基站1和基站2的邻区关系,切换指标恢复正常。导致该问题的大量产生,是工程督导使用的新开站模板中带有原有基站的邻区配置数据。

图 5-8 邻区错配

35

5.3.3.6

优化措施

底躁偏高

切换异常问题。

图 5-9 优化后切换成功率

负责人汇报并督促其加快NI处理速度,切换成功率明显提升。

99.00?.50?.00?.50?.00?.50?.00?.50?.00?.50?.00%切换成功率

2013-12-02 00:00:002013-12-03 00:00:002013-12-04 00:00:002013-12-05 00:00:002013-12-06 00:00:002013-12-07 00:00:002013-12-08 00:00:002013-12-09 00:00:002013-12-10 00:00:002013-12-11 00:00:002013-12-12 00:00:002013-12-13 00:00:002013-12-14 00:00:002013-12-15 00:00:002013-12-16 00:00:002013-12-17 00:00:002013-12-18 00:00:002013-12-19 00:00:002013-12-20 00:00:002013-12-21 00:00:002013-12-22 00:00:002013-12-23 00:00:002013-12-24 00:00:002013-12-25 00:00:002013-12-26 00:00:00目标基站NI统计均值在-90左右,造成源侧切换无法在目标发起建立。短时间内无法

针对上述典型问题。使用《健康卫士》检查外部邻区一致性问题,NI偏高站点向局方

接入NI偏高,通过调整切换偏移和迟滞值,将切换次数减少,尽量减低NI高带来的

36

5.4 掉线率处理

当前掉线率中,分母有10个种计数器,除过由于Inactivity,ENB重定向,CCO原因之外的计数器,都算在掉线率分子中。 掉线率统计公式

指标或计数器 [LTE]无线掉线率(%) C373220600 C373220656 P311178 C373220612 C373220613 C373220614 C373220615 C373220616 C373220618 C373220620 C373220621 C373220622 C373220635 P311439 C373220615 C373220618 C373220635 指标公式或计数器描述信息 (P311178-P311439)/(C373220600+C373220656) Context建立成功次数(次) 遗留上下文个数(个) C373220612+C373220613+C373220614+C373220615+C373220616+C373220618+C373220620+C373220621+C373220622+C373220635 Context释放,ENB空口失败引发释放次数(次) Context释放,ENB切换失败引发释放次数(次) Context释放,由于小区关断或复位引发释放次数(次) Context释放,ENB由于Inactivity引发释放次数(次) Context释放,ENB由于其它原因引发释放次数(次) Context释放,ENB重定向导致释放次数(次) Context释放,ENB重建立失败导致释放次数(次) Context释放,ENB由于S1链路故障导致释放次数(次) Context释放,ENB检测到UE被异常拔掉(次) Context释放,ENB由于CCO原因引发释放(次) C373220615+C373220618+C373220635 Context释放,ENB由于Inactivity引发释放次数(次) Context释放,ENB重定向导致释放次数(次) Context释放,ENB由于CCO原因引发释放(次) 掉线率处理思路:

1,按照掉线率分子,提取细分原因的计数器,查看由那类计数器引起的失败次数最多,针对性处理。

2,正常情况下,某个小区周边都存在邻区,如果无线环境不是很差,都可以通过切换的方式改变下行信号质量。当某个站点缺失邻区或者邻区添加不合理,会导致无法切换出而掉死。因此处理掉线率较高的小区时,需要核查邻区配置是否合理。

3,小区存在异频邻区时,需核查异频切换类参数是否配置合理,A2,A3事件配置 4,核查小区是否存在超远覆盖,导致覆盖孤岛,无法切换到周边邻区。可以通过后台跟踪信令,观察测量报告,并补齐漏配的邻区。随后需要对覆盖进行控制。

5,对于因弱覆盖导致掉线,可以添加系统间邻区,使用重定向到3G的方式,减少掉线次数。但门限设置需要合理,不能太容易去到3G。

37

5.5 KPI常见原因处理手段

指标种类 原因值 处理手段 查询基站高峰时段话务,检查基站负荷接纳参数配置,查询PRB利用率。PRB利用率高而用户数少,通过闭塞解闭塞小区,将异常用户踢走 调整userinactive时间,减少用户重复接入系统的概率。601版本后会解决CPU防冲击的问题 检查UE侧和基站侧LOG,查看信令具体流程。修改最小接入电平,避免远距离用户接入。除此之外还应检查上行NI和上行功率控制参数设置,上行NI偏高,功率参数设置不合理均会导致MSG5超时,重启基站复位CC板,上诉均不行则上报第一响应组 排除现场无线环境问题后,在BPL0单板环境内关闭RLF开关。 查看NI图,判断干扰类型。阻塞杂散干扰通过增加空间隔离度or更换RRU解决。 联合核心网侧一起抓包排查。 检查邻区TAC,PCI,ENBID配置,目标基站是否barred,目标基站是否出现退服告警等。 检查UE侧和控制面定时器。 检查现场无线切换环境,排除NI问题导致的在目标侧无法接入而反馈源侧进行重建立。排查邻区关系是否正确,剔除超远邻区垃圾邻区的配置后关系。 接纳失败 CPU过载 接入类 MSG5超时 Context释放由于空口失败 掉线类 NI过高 GTPUERRIND 目标侧准备失败 切换响应定时器超时 切换类 目标侧切换失败,返回源侧重建立 6

结束语

影响网络质量的因素较多,这就要求网规网优人员不仅要关注无线网络优化的原理与手段,还需要了解无线侧设备的调测,核心网的知识,通过实际的网络优化经验,不断的提高自身优化水平,优化过程要注重理论与实践相结合,同时做好总结,为部门做好知识积累。

38

7

附录

7.1

缩略语

缩略语 英文全名 中文解释 ATM Asynchronous Transfer Mode 异步传输模式 CDR Call Drop Rate 掉话率 CE Channel Element 信道单元 Cluster Tuning Cluster Tuning 簇调整(簇优化) CN Core Network 核心网 CPICH Common Pilot Channel 公共导频信道 CQI Channel Quality Indicator 信道质量指示 CQT Call Quality Test 拨打测试 DT Drive Test 路测 E-DCH Enhanced uplink Dedicated Channel 增强上行专用信道 HSDPA High Speed Downlink Packet Access 高速下行分组接入 HS-DSCH High Speed Downlink Shared Channel 高速下行共享信道 HS-SCCH High Speed Shared Control Channel 高速共享控制信道 HSUPA High Speed Uplink Packet Access 高速上行链路分 39

缩略语 英文全名 中文解释 组接入 ICMP Internet Control Message Protocol 互联网控制报文协议 Initial Tuning Initial Tuning 初始调整 IP Internet Protocols 网际协议 IPoA Internet Protocols Over ATM ATM承载IP协议 KPI Key Performance Index 关键性能指标 LAN Local Area Network 局域网 MAC Media Access Control 媒体访问控制 Max Rate Combining Max Rate Combining 最大比合并 MBMS Multimedia Broadcast and Multicast 多媒体广播组播Service 业务 NodeB Node B 基站 OMC Operation & maintenance Centre 操作维护中心 On-Going On-Going 持续性优化 PDP Packet data protocol 数据传输协议 PI Performance Index 性能指标 PPP Point to Point Protocol 端对端协议 PS Packet-Switched domain 分组交换域 QoS Quality of Service 服务质量 RAB Radio Access Bearer 无线接入承载 RF Radio Frequency 射频 ENODEB Radio Network Controller 无线网络控制器 RRC Radio Resource Control 无线资源控制 40

缩略语 英文全名 中文解释 RRU Radio Remote Unit 射频拉远单元 RSCP Received Signal Code Power 接收信号码功率 RTWP Received Total Wideband Power 接收总宽带功率 SAAL Signaling ATM Adaptation Layer ATM信令适配层 SCCP Signaling Connection Control Part 信令连接控制部分 Selective Combining Selective Combining 选择合并 SNR Signal to Noise Ratio 信噪比 TB Transport Block 传输块 TCP Transfer Control Protocol 传输控制协议 UDP User Datagram Protocol 用户数据报协议 UE User Equippment 用户终端 VIP Very Important People 重要客户 VP Video Phone 视频电话 WAN Wide Area Network 广域网 7.2 参考资料

《LTE基本原理》

《ZXSDR UniRAN TDD-LTE基站(V3.10.21) 性能计数器参考》 《ENB-PM(V2.1.0)U31 V12.13.30》

41

本文来源:https://www.bwwdw.com/article/kwmv.html

Top