中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(20

更新时间:2023-04-06 10:58:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务

IT支撑手段需求规范

——端到端监控需求分册

(2019版)

中国移动通信有限公司网络部

2019年9月

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

目录

1.综述 (3)

1.1需求背景 (3)

1.2使用对象及功能 (3)

2.功能需求 (3)

2.1 故障呈现 (3)

2.1.1告警监控 (4)

2.1.2告警查询 ............................................................ 错误!未定义书签。

2.1.3拓扑管理 (4)

2.1.4诊断测试 (5)

2.1.4.1OLT诊断测试 (5)

2.1.4.2ONU诊断测试 (6)

2.1.4.3用户端到端诊断 (7)

2.1.4.4 定制化批量测试 (8)

2.2故障处理 (8)

2.2.1 工单处理 (8)

2.2.2端到端能力前置 (10)

2.2.3移动运维 (10)

2.2.4告警策略设置 (10)

2.2.5告警派单 ............................................................ 错误!未定义书签。

3.与一体化支撑功能需求关系 ........................................... 错误!未定义书签。

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

1.综述

本手册为中国移动有线宽带业务IT支撑手段需求规范体系中的端到端监控功能需求分册,为各省公司家客端到端监控手段的建设和完善提供参考指引。1.1需求背景

宽带业务作为长流程业务,涉及网元及其维护部门较多,任一环节存在问题,都可能影响用户的整体业务感知。如何提高一线人员跨专业故障定位的效率,如何快速发现并优先处理影响用户较多的设备告警,成为运维工作的难点,这就需要具备面向客户和业务的家客端到端监控能力。

工作难点:

?宽带客户投诉的网络故障定位和处理流程中,代维人员收到客户投诉工单后,无法在上门前定位故障段落及问题原因,需现场逐级排查,其问题定位(尤其是涉及跨专业和维护职责的问题)及处理耗时较长,效率较低,影响客户感知。

?现网专业网管主要面向网元,且各专业网管数据未做关联,无法定位某一网元告警影响的业务和用户范围。发生家客设备故障时,无法根据告警影响的业务和客户,进行有效预处理;工单生成后,故障处理人员无法优先处理影响用户更多的故障,需进行优化。

1.2使用对象及功能

通过为网络监控、家客管理及装维服务人员提供如下功能:

?对于网络监控人员,可实时监控承载家客业务的各类告警,通过告警过滤、告警关联等设置,快速发现影响业务的告警,并跟踪故障工单的处理进度;?对于家客管理人员,通过对影响家客业务的告警进行跟踪,协调相关专业安排人员,优先处理影响业务规模较大的告警,如主干光缆中断等。

?对于装维服务人员,可通过拓扑呈现、端到端诊断等功能,对用户级的故障进行快速定位,通过app移动终端,提高现场服务的支撑效率。

2.功能需求

2.1 故障呈现

通过将设备网管与资源信息、客户信息进行关联,支持实时监控告警影响的小区及用户信息。当发生故障时,可根据各省故障管理要求,进行派单或预警提中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

醒,并通过诊断测试功能,提高问题的处理效率。支持监控的层级应至少包括传输接入层,同时支持对BRAS等城域网设备、radius认证服务器账号状态等监控。

各省在功能实现时,应根据省内故障管理和告警标准化要求,统筹考虑功能分布,支撑对家客的业务监控和故障处理。

2.1.1告警监控

通过与传输网管、PON网管、数据网管等信息接口,将采集来的对承载有线宽带业务的各类设备告警信息,经过压缩过滤、合并关联、自动升级等处理,以列表方式提供给监控人员、家客运维人员。通过与用户及业务信息的关联,实现了全网故障的快速定位和用户业务影响性的关联分析,帮助相关人员准确了解故障影响区域、用户数量,以便有针对性的进行故障派单或预警,此外还支持告警查询、告警策略设置等功能。

对于告警压缩、告警关联、工单派发等,各省应根据省内故障监控管理相关专业要求进调整。各省应根据总部监控规范,结合省内故障监控管理相关专业要求进行告警衍生、告警关联。

告警监控为用户提供实时监控的视图,支持按照时间先后的顺序显示未清除的告警信息,用户可在告警列表中查看未清除的告警信息,告警信息与业务相关联。使用人员可通过告警实时过滤规则设置只显示自己最关注的告警信息。支持一屏呈现活动告警、已确认告警和已清除告警的分状态告警列表。

各省应能对家客告警进行标识:

应能对ONU设备标识是FTTH还是FTTB方式;应能对OLT设备标识下挂ONU 数量;应能对OLT、ONU设备标识承载家客用户数;告警正文中应能体现告警对应的设备类型,若为OLT告警能够呈现上联是双链路还是单链路,能呈现PON

口数量,以及每个PON口下挂ONU数量及用户数量。

可分级展示告警影响的小区、用户等信息,并支持触发用户级端到端拓扑呈现和实时诊断测试。

2.1.3拓扑管理

拓扑管理功能作为告警监控的辅助手段,支持通过直观的图形化界面对有线宽带业务所涉及的网络设备、端口等拓扑关系及告警信息进行呈现,便于维护人员快速定位故障位置、及时了解告警影响范围。通过拓扑图可查看具体网元配置、

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

告警、板卡、端口等信息,且将拓扑节点与用户信息进行关联,支持查看拓扑节点覆盖的用户数量及覆盖的范围数量等。

具体实现时,各省应根据省内告警监控及故障处理相关专业要求,统筹考虑功能分布,进行相关功能完善。

功能说明

1、某区域下所有BRAS设备、汇聚交换机

2、某区域下所有OLT

3、某OLT下所有POS和ONU

?支持左侧树型结构直接定位网元;

?支持告警数量冒泡显示;

?支持网元的配置信息查看;

?支撑端口链路性能超限的直观呈现,当链路性能指标超阀值时,链路呈现红色或黄色;

?设备与业务相关联,点击覆盖用户数、覆盖范围数,可列出所有覆盖的用户帐号、用户名称、联系方式和覆盖地址信息。

?支持放大、缩小、全屏、对齐、后退等一些常用功能操作;

?支持根据网元名称和IP地址定位网元;

?支持右键触发下一级拓扑图查看、故障诊断、告警详细信息查看、历史告警查看、性能指标查看、历史性能指标趋势呈现。

2.1.4诊断测试

业务诊断测试功能旨在将客户业务资源数据信息,与各类设备网管、设备厂家支持的排查手段相结合,实现面向家客网元的告警及运行状态远程测试,并在此基础上实现业务端到端的连通性测试及故障远程诊断。实现远程快速定位并查找故障根源及原因,支撑设备运维管理,提高设备运行的可靠性、安全性和有效性。

具体实现时,各省应根据省内告警监控及故障处理相关专业要求,统筹考虑功能分布,进行相关功能完善。

2.1.4.1OLT诊断测试

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

OLT故障诊断是面向设备的诊断功能,实现对OLT设备健康性的全面诊断,主要提供运维及监控人员使用,作为日常运维工作的辅助,通过诊断结果来指导故障处理和修复,提高运维工作效率。

?测试方式:

用户可手动输入或者通过选择按钮选择一个OLT设备,自动显示设备信息,包括:OLT IP、设备名称、型号、软件版本、硬件版本、诊断时间等信息,并针对选定的OLT设备进行测试。用户也可在设备拓扑上选择网元,通过右键选择“远程测试”来对某一设备的告警、性能等情况进行远程测试。该功能也可通过告警、性能监控发出的异常提醒,直接链接至相应网元进行测试。

?测试内容:

主要测试OLT常见故障,包括但不限于:设备离线、上联口故障、设备性能状态(CPU、内存率)等。

?测试结果:

选定设备后,一键式进行远程测试,诊断项及结果包括但不限于以下内容:

测试完毕后,提供测试结论及处理意见,用户可查看诊断过程、当前告警、诊断结果及处理建议等信息。

支持以不同的状态图标显示每项诊断结果:正常和故障。

支持测试结果导出通知功能,便于告之相关人员故障点及故障信息。

诊断功能所使用的参数阈值,以“诊断参数设置”模块所设定的值为准,超出则为故障。

2.1.4.2ONU诊断测试

ONU故障诊断功能是通过用户提供的ONU设备唯一标识,对其健康情况进行诊断,诊断结果用于运维人员及监测人员快速排查故障和分责派单,提高故障处理的效率和故障定位的准确性。

?测试方式:

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

用户可手动输入或者通过选择按钮选择一个ONU设备,自动显示设备信息:IP、设备名称、软件版本、硬件版本、诊断时间等信息,并针对选定的ONU进行测试。用户也可在设备拓扑上,通过右键点击网元,选择“远程测试”来对某一设备的告警、性能等情况进行远程测试。或通过告警、性能监控发现的异常提醒,链接至相应网元进行测试。

?测试内容:

对于ONU故障,通常包括但不限于:OLT PON口状态、ONU设备状态(在线、脱网)、ONU收发光功率(当前值,是否超限)

?测试结果:

选定设备后,一键式进行远程测试,测试完毕后,给出测试结论及处理意见,用户可查看此次诊断的诊断过程、当前告警等信息。

支持以不同的状态图标显示每项诊断结果:正常和故障。

支持测试结果导出通知功能,便于告之相关人员故障点及故障信息。

诊断功能所使用的参数阈值,以“诊断参数设置”模块所设定的值为准,超出则为故障。

2.1.4.3用户端到端诊断

整合各专业网管告警与设备状态监控信息,实现其与资源信息、业务信息的关联,在面向网元、设备的监控测试的基础上,实现面向有线宽带客户业务端到端的连通性测试及故障远程诊断,快速定位影响客户的网络故障,向故障处理人员提供一键定位故障功能。

?测试方式:

用户可手动输入或者通过选择按钮选择一个用户(根据用户账号信息),自动显示用户相关的资源信息及业务信息,如业务类型、接入方式、LOID代码、SN号、ONU IP地址、ONU地址、OLT IP地址、OLT名称、所在小区、安装地址、账号速率、套餐类型、套餐有效期等,并针对选定的用户的端到端网络进行测试。用户也可以在其他显示用户账号信息的位置(如告警影响的用户),选定特定用户,右键触发对该用户进行端到端测试。

?测试内容:

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

故障问题一键定位功能能涉及多个系统的信息,测试内容包括但不限于:NGBOSS的用户账号状态、Radius系统的账号认证信息及速率信息、OLT上联口状态、下行PON口状态、ONU状态等。

查询时,以图形化的形式显示用户所在的端到端网络,并对各环节的状态逐一排查。拓扑图显示包括但不限于:RADIUS认证服务器、BRAS、OLT、分光器、ONU、光纤连接关系信息等,并以不同的颜色显示各设备的状态。

?测试结果:

支持以不同的状态图标及文本形式显示每项诊断的结果,如有异常提示故障产生的大致原因和处理建议。测试后用户可查看此次诊断过程、当前告警、历史告警、诊断历史。

通过点击故障点或设备,可以进行设备拓扑、故障、性能信息的详细展示,显示告警类型、告警时间、性能劣化指标等,如可以通过告警信息关联至告警监控窗口的告警。

支持测试结果导出通知功能,便于告之相关人员故障点及故障信息。

诊断功能所使用的参数阈值,以“诊断参数设置”模块所设定的值为准,超出则为故障。

2.1.4.4 定制化批量测试

对于大面积网络故障查修验证及施工完成后的批量验收,可批量执行业务拨测任务,验证割接涉及用户所承载网络是否正常。支持手动批量拨测和定时自动批量拨测。用户可对拨测任务进行增、删、改、查等操作。

功能说明:

?输出参数包括:任务名称、拨测类型、业务、设备、业务类型;

?提供批量拨测任务的新增、修改、删除功能;

?点击某条批量拨测任务查看拨测结果,输出内容包括:测试结论、失败原因、测试时间。

2.2故障处理

2.2.1 工单处理

对于采集的告警信息,各省可根据省内故障管理专业要求进行工单派发及后续处理。

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

(1)功能要求:

?家客业务故障处理针对网管监测到的网络故障、客户投诉的故障,生成相应的故障工单,依据故障工单的产品信息、客户信息、故障现象等内容,实现对故障工单的管理,驱动并执行相应的故障处理流程,实现对故障工单处理各环节的调度和监控。

(2)故障处理流程

?家客业务的网元告警、性能门限预警及故障派单:通过客户信息与网元信息的相关联,将主动监控发现的面向网元的告警和性能门限告警变为面向业务的告警信息呈现,进行预判断后,结合客户业务等级、故障等级、客户区域派发故障工单,实现告警监控—故障派单—工单调度—故障处理—故障消障—告警归档的全流程调度和管控;

?家客业务的割接信息、客户投诉等故障派单:通过割接信息、客户投诉故障,进行预处理后,结合客户业务等级、故障等级、客户区域派发故障工单,实现对投诉预处理—故障派单—工单调度—故障处理—故障消障—投诉回访的全流程闭环处理与管控;其中割接信息指预先了解的割接任务,可提前设置割接公告,用于投诉预处理;客户投诉故障,指根据故障诊断测试等,对用户所在的设备进行诊断和客户使用指引等预处理工作,预处理失败时再进行派单。

?家客业务的故障时限管理需求:根据故障等级、故障类别(设备故障、线路故障)、故障地域(城市、农村、校园)等自动确定故障处理的总体时限和分配各环节时限。

?用户权限功能需求:便于代维单位使用,同时保护信息安全,代维人员通过系统可以根据账号查询到对应的ONU端口信息。

?故障工单派发及处理相关功能,各省应结合省内集中故障等专业要求,进行细化调整。

(3)故障统计分析

?支持网络设备故障情况的趋势分析、告警级别、告警类型统计;按照客户等级、故障等级、区域(市、县区、乡镇)、地域(城市、农村、校园)等不同维度进行分时段、分类型统计,支持报表输出功能;

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

?支持对家客业务故障区域、故障发生次数、故障平均历时、故障原因等进行分类统计分析。

2.2.2端到端能力前置

可为客服人员提供端到端监控和故障诊断的能力,提高其工作效率。

故障拦截的字段信息应包括故障的类型、故障的可能原因、故障的发生时间和预计解决时间等,便于客服解释。

将用户端到端故障诊断能力提供给客服专家席使用,可通过用户宽带账号等信息直接诊断用户的网络及设备是否存在故障,如果存在故障,提示客服及用户,并进行相关处理。

相关诊断测试功能应确保测试的实时性和准确性,以及与相关页面整合或集成的风格一致性,客服人员无需切换多个页面即可进行便捷处理。

需提供对诊断测试和故障拦截功能的次数统计、成功率统计、耗时统计等功能,对于异常或超时问题,针对性发现和处理。

2.2.3移动运维

从一线装维人员、用户视角出发,通过手机app等形式,整合故障告警、故障定位、故障小区公告等功能,供装维人员户外作业时使用,提升工作效率。

主要功能有:

?小区故障告警实时通知及故障确认、定位——代维人员通过相关功能,实时查询所维护小区是否有故障告警及故障派单信息,能对具体告警信

息进行设备实时诊断,定位故障点位置及影响的用户范围。

?小区大面积故障公告展示及查询——对所维护小区的大面积故障信息进行统一查询和管控,便于维护工作开展。

?故障影响用户分析和诊断——对代维区域内用户进行端到端故障诊断。

2.2.4告警策略设置

①告警过滤器设置

用户可以通过预先定义告警过滤器,在实时告警列表中滤除不关注的告警信息。从而滤除不必要的干扰信息,以便将精力集中在重要的告警信息的监视和处理上。同时,告警过滤器可作为家宽告警转发到综合监控平台的规则,符合规则的告警被转发。

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

具体实现时,各省可与告警监控、告警标准化等专业要求一并考虑,进行功能分布调整和字段优化。

功能说明:

?输出参数包括但不限于:

过滤器名称、是否取反、告警类型、告警级别、告警状态、告警名称、告警位置、创建用户、创建时间、最后修改时间。

?提供告警过滤器的管理功能,例如根据影响用户数设置告警过滤器,呈现影响用户数为30户、影响小区数为5个【支持自定义设置】以上的告警。包括新增、修改、删除告警过滤器,仅限有权限的用户使用。

?根据设定的过滤规则,告警在实时告警列表中进行呈现,但在当前告警列表或历史告警列表中仍可以查询和查看被过滤掉的告警信息。

?提供数据的导出功能。

②告警关联设置

应支持跨专业告警关联,通过设置设备告警相关性规则,将衍生告警与根源告警进行关联,当衍生告警和根源告警同时(30秒内)发生时,根据关联规则,帮助用户快速确定故障根源。用户可停用和启用此规则。支持对关联规则进行查询、增加、修改、删除。

具体实现时,各省可与告警监控、告警标准化等专业要求一并考虑,进行功能分布调整和字段优化。

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

功能说明:

?输出参数包括但不限于:

厂商、规则状态、主告警、次告警。

?提供告警关联规则的管理功能,包括新增、修改、删除,仅限有权限的用户使用。

?当前故障列表中只显示表示真实问题所在的主告警,其它的次告警都被自动屏蔽。

?提供数据的导出功能。

③重要告警通告

通过分析告警将大面积掉电、主纤断、OLT设备坏等告警主动呈现在列表中,同时支持手动添加,便于运维人员将割接信息通告给客服人员。呈现信息包括但不限于:所属地市、区/县、开始时间、结束时间、答复口径、影响小区、小区地址、影响用户数、故障现象。

具体实现时,各省可与告警监控、告警标准化等专业要求一并考虑,进行功能分布调整和字段优化。

功能说明

输出参数包括但不限于:

?所属地市、区/县、开始时间、结束时间、答复口径、影响小区、小区地址、影响用户数、故障现象。

?通过分析告警将大面积故障(大面积掉电、主纤断、OLT设备坏等故障)主动呈现在列表中。

?支持大面积通告的手动添加,便于运维人员将割接信息进行通告。

?提供大面积通告的修改、删除功能,仅限有权限的用户使用。

?提供数据的导出功能。

中国移动有线宽带业务IT支撑手段需求规范-端到端监控需求分册(2019版)

本文来源:https://www.bwwdw.com/article/jl2l.html

Top