中国联通通信网络运行维护规程--OSS系统分册

更新时间:2024-06-08 19:01:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

运行维护规程

OSS系统分册

中国联合网络通信集团有限公司

二零一三年七月

目 录

第一章 通则 .......................................... 1 第二章 运行维护组织体系及职责界面 ..................... 2 第一节 维护组织机构及职责 .......................... 2 第二节 维护岗位与编制 .............................. 4 第三节 维护界面划分 ................................ 4 第三章 基本维护要求................................... 6 第四章 维护作业计划................................... 8 第五章 故障管理 ...................................... 9 第六章 质量管理 ..................................... 11 第七章 监控管理 ..................................... 13 第一节 系统平台监控管理 ........................... 13 第二节 应用监控管理 ............................... 13 第八章 交维管理 ..................................... 15 第九章 变更管理 ..................................... 15 第十章 安全管理 ..................................... 17 第一节 安全管理制度 ............................... 17 第二节 技术手段运用 ............................... 18 第十一章 应急保障管理 ................................ 19 第一节 应急保障工作 ............................... 19 第二节 应急通信手段 ............................... 19 第十二章 仪器仪表及备品备件管理 ...................... 21

附录1 总部OSS系统故障处理流程 ....................... 23 附录2 省级分公司OSS系统故障处理流程 ................. 24 附录3 故障上报表 .................................... 25 附录4 中国联通OSS系统作业计划 ....................... 26 附录5 中国联通OSS系统维护指标参考 ................... 27

第一章 通则

第1条. 中国联通OSS系统是为通信网络的运行维护、网络优化、业务管理提供手段与支撑的系统。系统立足于设备、网络、业务的监控与维护,提供面向客户感知、快速准确响应的能力,满足维护生产、服务支持、考核管理等各层面对OSS系统的应用需求,以切实保障网络运行效率与服务质量。

第2条. 中国联通OSS系统包含的范围如下: EMS/OMC类网元级网管,NMS类网络级网管,网管DCN网络,信令监测、网络优化、拨打测试、服务支撑、业务开通等各类支撑系统,以及资源管理、电子运维、安全管理、费用台账等综合类管理系统等。

第3条. OSS系统日常维护工作主要包括:系统硬件平台、软件平台的维护,网管数据的维护与保障,安全管理等内容。硬件平台包括主机硬件设备、相关的网络设备(路由器、交换机、防火墙、拨号设备、协议转换设备等)、存储备份设备(光纤交换机、磁盘阵列、磁带库、磁带及光盘等)、安全设备(入侵检测设备 、补丁服务器、防病毒服务器及软件、网管配套使用的 VPN 接入设备等)、时间服务器、信号采集设备(分光器等)及相关连接光电缆等。软件系统包括系统软件(操作系统、数据库、中间件等)、应用软件等。

第4条. 为规范中国联通OSS系统的维护与管理,确保OSS系统各类设备的正常运行,保障网管系统数据质量和网元同步接入网管,提高OSS系统服务支撑质量,特制定本规程,作为中国联通OSS系统的维护、管理工作依据。

1

第二章 运行维护组织体系及职责界面

第一节 维护组织机构及职责

第5条. OSS系统的维护管理采用统一领导、分级管理、分级负责的管理原则,按总部、省级和地市三级设置。各省分公司、地市分公司应根据公司整体管理模式设定维护组织体系,确保OSS系统运行维护工作正常、有序的开展。

第6条. 总部OSS系统维护、管理工作职责:

1. 负责组织制定OSS系统的维护管理规程,监督各省落实维护规程,对各省的维护工作给予指导。

2. 负责制定OSS系统质量考核指标和考核办法,检查和分析OSS系统的运行质量,组织考核评比。

3. 负责OSS系统重大故障和重大安全事件的管理。

4. 负责为OSS系统的设备维护、优化和故障处理提供技术支持。 5. 负责7×24小时监控总部OSS系统的运行状况,负责总部OSS系统的日常维护、故障处理、资源调度、软件装载等工作,确保系统正常运行。

6. 负责定期分析总部OSS系统的运行状况,做好系统预警工作,制定并实施相应的改造、优化措施。

7. 负责总部OSS系统的安全工作,组织制定总部OSS系统的应急保障方案并定期演练。

8. 负责对总部OSS系统的设备、软件版本进行管理。

9. 负责对网元设备软件版本、补丁入网测试中与OSS系统接口的测试管理。

10.负责总部OSS系统的开发建设及验收测试工作,并指导省分公司完成 省级OSS系统的开发建设及验收测试工作。

11.负责编写制订OSS系统的相关技术标准与规范,OSS系统指标体系、 接口规范的建立与更新。

12.负责牵头组织全国OSS系统维护人员的技术、业务交流与培训。

2

第7条. 省分公司OSS系统维护、管理工作职责:

1. 贯彻总部OSS系统的维护管理规程,根据本省情况制定切实可行的维护管理实施细则。

2. 负责落实总部OSS系统运行质量考核指标和考核办法,建立省内OSS系统的质量分析制度和质量监督体系。

3. 负责7×24小时监控省内OSS系统的运行状况,负责省内OSS系统的日常维护、故障处理、资源调度、软件装载等工作,以及总部OSS系统在省内站点设备的日常维护和故障处理等工作。重大故障和较大故障需向总部OSS系统维护管理部门报告,并组织解决省内OSS系统运行维护中的问题。

4. 负责省内OSS系统相关网管数据的及时性、完整性、准确性的管理及保障工作。

5. 负责制定省内OSS系统的网络结构、路由原则和省内OSS系统的网络实施方案。

6. 负责制订OSS系统作业计划,定期分析省内OSS系统的运行状况,做好系统预警工作,制定并实施相应的改造、优化措施。

7. 负责省内OSS系统的安全工作,组织制定省内OSS系统的应急保障方案并定期演练。

8. 负责省内OSS系统至总部OSS系统互联的网络及设备的维护工作,确保部省接口的省分公司侧正常运行。

9. 对省内OSS系统的设备、软件版本进行归口管理。 10.负责省级OSS系统的开发建设及验收测试工作。

11.负责牵头组织省内OSS系统维护人员的技术、业务交流与培训。 第8条. 地市OSS系统维护、管理工作职责:

1. 贯彻落实总部及省分公司制定的OSS系统维护管理规程和实施细则。 2. 负责承担属地设备的现场维护职责和故障处理等工作。重大故障和较大故障需向省分OSS系统维护管理部门报告。

3. 负责属地内OSS系统至上级OSS系统互连的网络及设备的维护工作,确保网元至上级OSS系统接口的属地侧正常运行,确保网元数据的正常采集。

4. 负责属地内OSS系统相关网管数据的及时性、完整性、准确性保障工

3

作。

5. 配合省分公司进行OSS系统的维护作业、故障处理、软件装载、工程割接等工作中需现场完成部分,按照省分公司要求进行OSS系统的测试工作。

6. 配合省分公司进行OSS系统应急通信保障预案演练与实施。

7. 协助省分公司分析省内OSS系统的系统运行状况,配合实施相应的改

造、优化措施。

第二节 维护岗位与编制

第9条. OSS系统维护岗位的设置应符合《关于加快推进运行维护专业资格管理工作的通知》中国联通集团人力[2012]45号、《中国联通运行维护专业资格管理办法(试行)》中国联通集团[2012]217号文件的要求。在总部、省级和地市三级维护机构下,结合属地内OSS系统维护能力需求,可设置以下7类OSS系统维护岗位:网管支撑类IT设备监控、网管支撑类应用数据保障、网管支撑类IT设备优化、网管支撑类应用技术支持、网管支撑类数据分析、网管支撑类系统管理、网管支撑类系统整体架构规划。

第10条. OSS系统维护人员编制核定原则:结合总部、省级和地市三级维护机构管理的OSS系统数量,核定各级OSS系统维护人员编制。原则上每10个网元级网管应配备1人,每5个网络级网管或独立的系统应配备1人,另外应在省级公司单独配备全省网管DCN网络的维护人员不少于2人。

第三节 维护界面划分

第11条. 对于直连网元情况,OSS系统与所管辖网元的维护分工界面是以所管辖网元的网管采集端口为界,网元数据采集端口往OSS系统设备侧归属OSS系统专业维护,该端口另一侧(含网元数据采集端口)归属网元所属专业维护。

第12条. OSS系统专业与传输网专业的维护分工界面是以OSS系统设备直连到传输网DDF/ODF 架的端子或传输网络接入设备端口为界,该端子或端口往OSS系统设备侧归属OSS系统专业维护,该端子或端口另一侧设备归属传输专业维护。

4

第13条. OSS系统专业与电源专业的维护分工界面是以OSS系统连接至电源列头柜的第一个接线端子为界,该接线端子往OSS系统设备侧归属OSS系统专业维护,该接线端子往电源侧的设备及线缆归属电源专业维护。

第14条. OSS系统专业与企业信息系统专业的维护分工界面是以OSS系统连接至企业信息系统(BSS、MSS)之间的防火墙为界, 防火墙往OSS系统设备侧归属OSS系统专业维护, 防火墙另一侧归属企业信息系统专业维护。网管网络由企业信息系统DCN网络作为支撑网络的,维护分工以边界路由器为界,互联问题由问题发现方牵头处理,对方负责配合。

5

第三章 基本维护要求

第15条. OSS系统维护工作主要包括系统本身及相关设备的日常维护、安全管理、数据保障、故障处理等。

第16条. OSS系统应由专人维护,并配备必要的维护工具,技术支持渠道畅通、高效,保证各种设备故障及时得到技术支持,保证OSS系统设备稳定、安全正常运行。

第17条. OSS系统数据保障,应满足集团对数据完整性、准确性和及时性的考核标准。

第18条. OSS系统应确保在新设备割接入网前完成新增网元的OSS系统接入工作,在发生网元割接、退网、网络扩容、网络调整等情况后及时更新OSS系统相关数据。

第19条. OSS系统用户帐号和密码管理符合 IT 内控的相关要求。 1. 加强OSS系统安全管理,专人负责系统安全管理工作,明确维护人员权限。对于OSS系统所涉及的操作系统、数据库和应用系统,密码须定期更换。

2. 厂家 OMC 网管、业务平台网管所涉及的重要业务数据的增、删、改操作,应确保系统详细记录操作人员用户帐号信息,并可在要求时限内保存具体操作日志,以备追溯查询。在条件不具备的情况下,应保存相关操作的纸质记录。

第20条. 制定OSS系统的安全管理规范,包括登录访问、网络权限、目录安全、属性安全、网络服务器安全、端口和节点安全及防火墙安全控制策略,并定期分析系统运行日志,及时发现系统隐患。

第21条. 不得在OSS系统上安装与维护工作不相关的软件。不经允许,不得在OSS系统上外接设备,如笔记本电脑、移动硬盘、存储卡等,以免破坏OSS系统数据。做好病毒防范工作,定期进行系统补丁升级及病毒库更新工作,确保OSS系统安全。

第22条. 不得以任何方式(如双网卡、修改IP地址切换信息点及拨号等方式)使用OSS系统终端访问公共网络或外部非受控网络。

第23条. 严格控制系统维护远程接入操作。必须提供远程接入权限时,应首先经维护部门主管领导书面确认,开启适当权限的临时帐号,处理完毕后应及时

6

关闭帐号。任何情况下系统超级用户帐号不得授予厂家技术人员使用,设备割接入网后收回全部临时帐号。

第24条. 制订OSS系统的备份策略,执行数据备份保障工作。对OSS系统执行定期备份。OSS系统升级前需进行全量备份操作,包括:OSS系统数据、系统软件和应用软件。系统全量备份工作尽量保证在不影响生产的情况下进行。备份介质必须保存在安全的环境中,避免遭受破坏,失去备份作用。

第25条. 定期评估OSS系统运行情况,合理调整系统配置和网络资源,必要时提出更新改造计划,经批准后实施。

第26条. OSS系统的软件版本和补丁管理:

1. OSS系统的软件主要包括操作系统软件、应用软件和数据库软件、中间件等,软件版本及补丁的管理工作包括软件的功能变更、新版本确定、升级计划、补丁更新和激活,以及建立相应文档资料等。

2. 由设备厂商提供的新软件版本和补丁,经批准后,组织进行现网或实验室测试并出具测试报告,测试合格后方可进行安装使用。

3. 对OSS系统建立软件版本和补丁档案,完整记录软件版本信息、补丁信息、维保信息和历史信息。

第27条. OSS系统的升级、割接以及网络调整前应做好各项前期准备工作,制定出详细的技术方案(包括组织方案、应急预案等),提前将相关方案报批,收到方案批复后,应严格按照批复方案中规定的时间和程序操作,确保网络安全。

第28条. OSS系统相关的维护单位须配合业务开通、服务保障、网络调整和工程割接等工作。

第29条. 建立健全必要的系统技术资料和维护资料的档案(包含技术资料、操作说明、图纸资料、竣工文档等),建立OSS系统故障处理的相关知识库。

第30条. 各级OSS系统维护单位应建立起完善的技术支持渠道并确保渠道畅通,以保证出现故障时能第一时间得到支持。

第31条. 根据实际工作需要,各级OSS系统维护单位应配备必要的维护工具,包括:操作维护终端、仪器仪表、安全软件、工具软件、备份介质等。

第32条. 根据实际工作需要,各级OSS系统维护单位应配备必要的备品备件。

7

第四章 维护作业计划

第33条. 维护作业计划规定了OSS系统专业主要维护作业项目,由于各OSS系统功能、架构及软硬件组成差异较大,各级OSS系统维护单位可在本作业计划基础上根据具体系统有选择的执行,并可以适当增加维护作业项目,以确保能够对所维护管理的设备进行定期预防性巡视检查,及时发现和处理设备存在的问题。

第34条. OSS系统专业维护管理部门负责制订本专业维护作业计划实施细则(包括维护作业计划大纲、记录表格、考核办法等)

第35条. OSS系统专业的主要维护作业项目参见附件4。

8

第五章 故障管理

第36条. OSS系统故障处理职责:

1. 总部OSS系统维护管理部门负责管理全网OSS系统重大故障,协调各省进行疑难故障处理,通报重大故障和全网性设备硬件或软件版本缺陷问题,处理属于总部管辖范围内的OSS系统故障。

2. 省分公司OSS系统维护管理部门负责处理省内OSS系统和总部OSS系统本省内节点的故障,必要时可申请总部和其它省分公司进行配合,对于重大故障、较大故障和共性的设备软硬件版本缺陷问题,须上报总部。

3. 地市OSS系统维护管理部门负责处理总部及省内OSS系统本地市节点的故障,必要时可申请省分公司和其它地市分公司进行配合,对于重大故障、较大故障和共性的设备软硬件版本缺陷问题,须上报省分公司OSS系统维护管理部门。

第37条. OSS系统故障分类: 1.

设备故障:OSS系统的主备用设备由于各种原因不能正常运行,或

对业务正常运行造成了隐患但尚未影响相关功能的正常使用。

2.

业务故障:由于OSS系统硬件设备不能正常运行、应用软件错误、

系统接口故障、人为差错等原因,造成OSS系统相关功能无法正常使用。

3.

在业务故障和设备故障同时出现的情况下,定义为业务故障。

第38条. OSS系统故障分级:

1. 重大故障,以下情况发生任意一种即为重大故障:

1) OSS系统完全瘫痪,导致系统所有功能均不可用,或所管辖系统的网管信息完全不可用的时长超过24小时;

2) OSS系统部省接口故障,导致系统不能进行接口信息传递,超过24小时;

3) 网管网主备用核心交换机、主备用核心路由器全部中止通信超过24小时。

2. 较大故障,以下情况发生任意一种即为较大故障:

1) OSS系统完全瘫痪,导致系统所有功能均不可用,或所管辖系统的

9

网管信息完全不可用的时长超过12小时;

2) OSS系统部省接口故障,导致系统不能进行接口信息传递,超过12小时;

3) 网管网主备用核心交换机、主备用核心路由器全部中止通信超过12小时。

3. 一般故障,除重大故障和较大故障外的其他故障为一般故障。 第39条. OSS系统故障处理原则。 1.

凡系统发生故障或事故时,OSS系统维护人员必须立即组织抢修,

协调厂家技术支撑人员及时响应。对于重大故障应立即上报。

2. 3.

OSS系统维护人员应熟悉故障处理流程,熟练掌握操作步骤和方法。 故障处理应遵循端到端的原则以及“先抢通,后修复;先核心,后

边缘;先本端,后对端;先网内,后网外,分故障等级进行处理”的原则。当两个以上的故障同时发生时,对重大故障、影响业务开通与服务保障的故障等予以优先处理。

4.

OSS系统维护单位对已处理的故障,必须查清故障原因,确定故障

性质和责任,采取防范措施,避免同类故障再次发生。

第40条. 建立OSS系统故障上报制度,重大故障及较大故障确认后应立即上报。

第41条. 建立OSS系统故障通报制度,总部和省分公司发现重大故障及较大故障后,应向OSS系统相关使用部门通报故障情况。

第42条. 定期进行故障统计分析,包括:故障归类统计、故障发生及主要原因分析、专业部门故障处理报告填写是否及时、相应解决措施是否合理,以及提出改造和优化建议等

第43条. 在重大故障、较大故障发生后,应认真总结经验教训,当月必须召开专题分析会,制定防范整改措施,并形成会议纪要。

10

第六章 质量管理

第44条. 为完善对OSS系统各个环节的质量控制,应建立健全各级检查体系。维护基本指标的制定要与公司整体运营管理指标相结合。OSS系统专业维护的基本指标分为管理类指标、维护类指标。

第45条. OSS系统专业管理类指标:

1. OSS系统接口数据一致性,即各级OSS系统之间接口传送数据不得发生遗漏缺失,确保逐级上传数据的一致性。

2. OSS系统采集数据的完整性、准确性和及时性,即要求OSS系统从网元获取的各类数据与网络实际情况完全一致,客观准确,及时可用。

3. OSS系统数据合理性,即要求针对OSS系统的性能数据、配置数据和告警数据进行规则核查,加强数据解析核查力度,解决数据解析和上报中存在的问题,提高OSS系统数据准确性、真实性和合理性。

4. OSS系统可用性,即在要求时限内确保OSS系统故障历时低于一定门限要求,保证OSS系统可用率。

5. 网元接入OSS系统的及时率,即新增网元、网络调整、升级等情况下,确保网元在规定时间内及时接入OSS系统,向上级系统提供网络数据。

第46条. OSS系统专业维护类指标:

1. 主机、存储类指标:主要包括CPU占用率、内存占用率、磁盘空间使用情况、文件系统、操作系统交换区、主存储设备I/O平均占用率等影响主机及存储正常运行与否的指标。

2. 数据库类指标:主要包括数据库CPU占用率、内存占用率、共享内存、PGA命中率、锁数量、表空间利用率等影响到数据库正常运行与否的指标。

3. 重要进程的运行情况:主要包括系统软件的重要进程和应用软件的重要进程正常运行与否的指标。

4. 网络类指标:设备CPU占用率、内存占用率、网络带宽利用率、网络流量、网络时延、网络故障中断及历时等。

5. 中间件指标:中间件及第三方管理软件CPU、内存占用率、JVM内存利用率、会话利用率、连接池的利用率等影响到中间件正常运行与否的指标。

11

(具体指标参考值见附录5)

第47条. OSS系统专业各级管理部门需针对各类OSS系统(包括综合网管、厂家 OMC 系统等)的配置数据、告警数据、性能数据及数据的合理性制订考核管理办法细则,明确数据考核范围、考核方法和分值计算,并确保考核管理细则得以贯彻实施。

第48条. OSS系统专业各级管理部门需制订OSS系统数据保障管理办法,针对新网元入网、网络割接、网元升级等大规模网络调整情况,与网络维护专业以及工程建设部门共同制订相关工作流程。涉及业务开通、服务保障、客服支撑等流程变更的调整,需与相关支撑专业及业务部门共同制订相关工作流程。

1. 新网元割接入网前,必须完成与OSS系统的联调工作,确保配置、告 警、性能数据的准确性、完整性、及时性,入网后及时完成相关基础数据更新。

2. 网络割接、网元升级后,必须及时完成配置、告警、性能的数据更新, 并进行指标核对,验证数据的准确性、合理性。

第49条. OSS系统专业各级管理部门需结合对应网络维护专业有关维护要求、建设部门相关工程管理办法、业务部门相关业务及支撑要求,明确各类管理办法的流程要求和具体时限要求,以符合通信网络总体维护要求。

12

第七章 监控管理

第50条. OSS系统的监控管理主要是对OSS系统的系统平台、应用运行状态进行监控,以提高对OSS系统的数据保障能力和快速响应前端的支撑水平。OSS系统的监控管理主要包括OSS系统的系统平台监控管理,和对OSS系统的应用监控管理。

第51条. OSS系统的各级维护单位应逐步借助OSS 统一监控系统,完善针对OSS系统的运维监控和优化分析。

第52条. 各级OSS系统维护单位需按照OSS系统监控管理相关内容要求制定OSS系统的维护作业计划。

第一节 系统平台监控管理

第53条. 系统平台的监控管理主要包括对OSS系统的主机、存储、数据库/中间件、网络等基础架构组件的监控管理。通过监控OSS系统的系统性能和告警信息,以检查系统的可用性,从而保障OSS系统的资源使用。

第54条. 系统平台监控管理内容:

1. 主机设备硬件检查、系统日志检查、文件系统检查、raid状态检查、cluster检查、存储检查、数据库及中间件检查等;

2. 网络设备硬件检查、网络设备cpu及memory、io利用率检查,网络设备线路状态及连通性检查、设备日志检查等。

第55条. OSS系统平台可以参照OSS系统维护规程中质量管理的参考指标进行性能评估与优化。

第二节 应用监控管理

第56条. 应用监控管理通过监控OSS系统的应用性能,以快速定位应用故障,提升OSS系统的服务质量和服务能力。

第57条. 应用监控管理的内容:

1. 对OSS系统应用自身运行情况的监控:各关键服务进程状态、性能情

13

况、应用日志检查等;

2. 对部省接口的监控:OSS系统部省接口的状态、数据传送情况等; 3. 对OSS系统与网元接口的监控:互联接口、系统运行参数、账户及采集端口状态检查等;

4. 对OSS系统之间接口的监控:互联接口、应用端口状态及日志检查等; 5. 对OSS系统与外部接口的监控:接口状态、采集程序运行状态检查等。

14

第八章 交维管理

第58条. 交维包括OSS系统自身的交维以及OSS系统所管理的网元割接入网。

第59条. OSS系统上线后,OSS系统维护单位要逐步介入系统的运行维护工作。系统终验后正式移交OSS系统维护管理部门,并由OSS系统维护管理部门依据终验验收报告向OSS系统维护单位下达移交手续,系统转为正式运行,并由OSS系统维护单位承担维护支撑工作。

第60条. OSS系统终验前,应完成对OSS系统维护人员的支撑技能培训。 第61条. OSS系统验收包括软件系统上线验收(硬件项目为设备到货验收)、初验、试运行、终验。系统验收由OSS系统维护管理部门、OSS系统维护单位等人员共同参加验收,并依据验收结果在验收报告上签字。

第62条. OSS系统正式交维前,建设单位必须向维护单位交接文档。 第63条. OSS系统正式交维时不应有遗留问题。终验通过后,建设单位、承建单位和维护单位应在3个工作日内共同签署工程验收合格证书;没有通过终验的工程不得正式交维。

第64条. OSS系统所管理的网元割接入网前,网元建设单位要依据OSS系统相关规范提前做好与OSS系统对接的准备工作,包括提供系统接口文档、提交网元所需的静态配置信息数据以及与OSS系统对接联调工作等。

第65条. 网元建设单位应在网元割接入网前至少两个工作日通知OSS系统维护单位,并由OSS系统维护单位确认具备接入OSS系统的条件后方可开始实施割接。割接后由OSS系统维护单位确认完全按割接内容接入OSS系统并且各应用数据准确后,方可结束割接。否则,网元建设单位需负责尽快解决存在问题,若在规定时限内无法解决时,OSS系统维护单位有权利要求网元建设单位退回割接前状态。当网元割接不成功时,网元建设单位需按规定及时删除OSS接口对接数据,待条件具备后再次申请实施网元割接入网流程。

第九章 变更管理

第66条. OSS系统变更是指:

15

1. 对已经上线的OSS系统进行自身的补丁或版本升级和局部修改,包括应用系统变更、操作系统变更、数据库变更、网络变更等。经立项进行的重大升级改造,或者是开发实施阶段的变更,应归入项目的开发与实施进行管理;

2. OSS系统所管理的网元进行的补丁或版本升级、局部修改以及网元间挂接关系、归属关系割接调整等。

第67条. 对于OSS系统自身的变更,OSS系统维护单位应根据系统变更申请,组织相关人员、相关单位对必要性和技术实现的可行性两个方面进行审核、确认,并提交上级维护管理部门进行批准方可实施。变更需求必须有正式通知或申请,并经上级维护管理部门审批后,才给予办理。OSS系统维护单位应严格遵守要求的流程、标准,按照变更方案进行变更实施,并在变更后组织验收测试并形成相关报告。

第68条. 对于OSS系统管理的网元进行的变更,网元维护单位需在变更前确认和上级OSS接口方式是否有变化,及对接入OSS系统的配置、告警、性能数据是否造成影响,若有变化或影响需提供详细的清单加以说明。OSS系统维护单位要参与网元变更流程,确认OSS系统是否需要进行相应的调整,并对变更后相关OSS系统有关数据进行验证,确认没有问题后方可结束变更流程;否则,网元维护单位需负责尽快解决存在问题,若在规定时限内无法解决时,OSS系统维护单位有权利要求网元维护单位退回变更前状态。

第69条. 变更前,OSS系统要根据情况做好相关备份,包括操作系统、网络配置文件、操作系统启动文件、操作系统配置文件、用户数据、文件系统、数据库、应用程序等,并做好备份记录,以确保能恢复到原始状态。如果时间点到达而变更不成功,需立即采用系统变更方案中制定的回退方案恢复变更前状态,同时向上级维护管理部门汇报,并根据指示做相应处理。

第70条. 变更结束后应形成相关变更报告等文档,及时进行归档。对涉及系统的资源资产、软件版本、补丁等信息变更的情况,应及时更新台账记录、维护手册等资料。

16

第十章 安全管理

第71条. OSS系统的安全管理是以确保各类OSS系统数据安全为基础,保障OSS系统安全可靠运行。从管理制度、技术手段运用两方面进行规范,做好日常OSS系统数据的安全管理。主要涉及主机安全管理、操作系统安全管理、数据库安全管理、应用系统安全管理、网络安全管理、防病毒安全管理、终端安全管理、账户与口令安全管理、应用开发安全管理等。

第一节 安全管理制度

第72条. 负责定期进行OSS系统重要配置文件、数据文件的备份。 第73条. 生产系统禁止安装与提供不必要的服务及端口,需进行必要的安全性配置,使系统具备一定的安全防范能力。

第74条. 严格控制对OSS系统的远程接入,特殊情况下应取得上级同意,由系统管理员提供专门的数据连接加密通道并通过认证授权,同时进行详细记录,原则上禁止通过超级用户远程登录。

第75条. 各级OSS系统维护单位须制定防病毒的管理制度和操作指南,设立专、兼职管理员负责防病毒的管理工作。

第76条. OSS系统终端的软件安装必须经过审核,除维护管理必须使用的软件外,任何人不得在维护终端上安装其它无关软件。

第77条. OSS系统维护单位负责对OSS应用系统、网络、服务器或其他OSS系统设备的用户帐号、权限进行管理;对用户帐号和权限进行登记备案。

第78条. 对系统、网络、数据库、OSS系统数据的访问采用分级管理,根据人员职责设定权限。用户帐户只能拥有本岗位内的权限,且采取最小授权原则配置。

第79条. 开发和测试过程只允许在开发、测试环境中进行,禁止直接接入在线系统,建议设置单独的网段,开发、测试环境和在线系统之间采用安全隔离措施。

17

第二节 技术手段运用

第80条. 定期(至少每季度一次)检查OSS系统漏洞,并出具安全检测报告,需打补丁解决漏洞则按相关规定执行。

第81条. 应对核心系统和设备的网段进行重点保护,使用防火墙等安全设备以及相关访问控制方式与其它网段隔离,保证网络系统稳定可靠、接入安全、易于故障隔离和排除。

第82条. 核心网络必须有备份设备,可采取热备方式,骨干链路应有备份路由,重要的服务器采用“双上联”方式进行网络接入。

第83条. 网管网络和信息系统的互连必须实施严格的安全措施,如安装防火墙、实施入侵检测、部署互访内容审计系统等。

18

第十一章 应急保障管理

第一节 应急保障工作

第84条. OSS系统的应急保障管理指的是当发生自然灾害、重大故障或OSS应用出现中断严重影响正常的服务支撑时,OSS系统的维护单位应采取应急工作,保证迅速恢复系统,快速支持生产运营。OSS系统的维护单位应建立多手段、多层次的保障机制,以提高网络安全程度。

第85条. OSS系统的维护单位应设置应急响应组织,负责制定和实施整体应急预案,管理OSS系统的应急事务,协调相关应急响应人员和资源,并向上级维护管理部门汇报应急响应工作情况。

第86条. OSS系统的维护单位应根据系统的重要程度和可能遭遇的问题严重程度,分别制定不同的应急保障预案。应急预案应包括组织成员、应急工作内容、故障处理原则、详细流程和操作步骤、应急所需物资等。

第87条. 应急保障组织应定期对应急预案中各种安全事件的应急方案进行演练和测试,确保应急预案的可操作性和可靠性,同时锻炼应急人员的应急响应速度和熟练程度。

第88条. 应急演练和测试均应有详细的记录。应急预案演练后,OSS系统维护单位应认真进行评价和总结,及时修订、优化应急预案。

第89条. OSS系统维护单位应定期对应急人员进行相应的培训,使得应急人员掌握应急预案中的各种应急方案和技术措施,清楚相关职责和实施过程并能熟练操作。

第二节 应急通信手段

第90条. 为配合业务网络的应急抢修,OSS系统维护单位可提供多种应急通信支撑手段,如远程拨号连接、视频通信等,以支持业务网络的故障处理和指挥调度。

第91条. OSS系统的远程连接仅限紧急情况下,由网元维护单位向OSS系统维护单位申请,供相关维护人员远程进行设备故障排除或疑难问题处理、重大

19

用户投诉处理使用,以便迅速诊断问题,修复故障,消除用户投诉。平时非紧急情况下,处于物理断开状态,不提供使用。

第92条. 提出远程连接使用申请的网元维护单位不得随意操作维护终端及运行设备,未经许可,不得随意修改、删除、保存网络资料与用户数据,需确保网络安全。

第93条. OSS系统维护单位负责接收网元维护单位的远程连接使用申请,对申请人进行核实,并对远程连接进行接入,同时做好远程连接使用记录。

第94条. 远程连接应急处理工作完成后,OSS系统维护人员应及时断开远程设备端口,如使用管理员权限,应对管理员密码进行修改。

第95条. OSS系统维护人员应定期检查应急通信支撑手段的相关使用记录,对应急通信支撑设备定期进行检查测试,以确保应急通信支撑设备正常可用。

20

第十二章 仪器仪表及备品备件管理

第96条. 仪器仪表和工具是OSS系统运行维护工作必需的物质条件。OSS系统的仪器仪表工具应根据测试和运行维护的需要进行合理配置。各机房配备的工具不能用于非生产用途,并应确保性能优良。

第97条. 所有仪器仪表应有专人负责保管并建立使用登记制度,可根据需要分散保管或集中保管。保管时尽量放置在机房现场,领用及归还时进行登记,做到帐物相符。

第98条. 仪器仪表应确保使用质量。说明书原件应专门存放,日常可使用复印件。仪器仪表机历卡应认真填写和保存。所有仪器仪表都应按原购时的配置确保完整齐全,使用质量应符合相应技术要求。

第99条. 维护人员在使用仪器仪表和工具时应按说明书和操作规程进行,使用结束后应存放在仪表柜、仪表箱或工具箱内。仪器仪表在发生故障后,要及时送修,并做好检修记录。

第100条. 及时对仪器仪表进行升级以满足实际维护工作需求。 第101条. 各级OSS系统维护单位应配置的主要仪器仪表设备如下表:

仪器仪表名称 常用维修工具箱 网线测试仪、制作工具 万用表 光源、光功率计 网络分析仪 漏洞扫描仪表 应急终端 配备情况 必配 必配 必配 选配(可共用) 选配(可共用) 选配(可共用) 选配 第102条. 为保证OSS系统的运行正常和故障抢修,所有重要设备和容易损坏的设备应保存适量的备品备件。OSS系统各级维护单位应加强备品备件的管理,根据实际情况建立备品备件库。

第103条. 建立备品备件的使用登记(含返修记录),做到帐物相符。 第104条. 运行维护用备品备件要求数量和种类配置齐全,确保版本、性能和功能正常。原则上备品备件应按照相应技术规定定期进行测试,保证备品备件的可用性。

21

第105条. 所有备品备件应放置在机房的专用机柜中,重要备件应重点保管,并进行防静电、防盗、防潮和防虫防鼠保护。

第106条. 要加强备品备件的计划管理,每年按时汇总,并办理申报手续。 第107条. 备品备件和材料贮备的种类、数量应综合考虑以下因素确定: 1. 足以保证OSS系统可靠安全运行,确保取用及时快速。 2 .备品备件和材料的昂贵程度。 3. 备品备件和材料的易损性。

第108条. 各级OSS系统维护单位应配置的主要备品备件设备如下表:

备品备件名称 网络设备及关键部件 主机设备关键部件 存储设备关键部件 采集设备及关键部件 配备情况 选配 选配 选配 选配 22

附录1 总部OSS系统故障处理流程

附图:总部OSS系统故障处理流程省级OSS系统维护管理部门总部OSS系统维护管理部门系统使用部门系统使用部门发现故障发现故障故障申告是否总部侧故障故障发现和上报阶段否是是否为重大或严重故障是省级分公司OSS系省级分公司OSS系统故障处理流程统故障处理流程否1、启动应急预案2、通告系统使用部门3、上报总部否处理故障故障处理阶段故障升级时限内是否处理结束处理故障是1、记录存档,2、故障处理结果回复源故障申告单位。故障记录和汇总处理结束23

附录2 省级分公司OSS系统故障处理流程

附图:省级分公司OSS系统故障处理流程省级分公司OSS系统维护管理部门总部OSS系统维护管理部门系统使用部门系统使用部门发现故障发现故障故障申告是否省侧故障故障发现和上报阶段是否是否为重大或严重故障是否1、启动应急预案2、通告系统使用部门3、上报总部否总部OSS系统故障总部OSS系统故障处理流程处理流程处理故障故障处理阶段故障升级时限内是否处理结束处理故障是故障记录和汇总1、记录存档,2、重大故障和严重故障处理结果上报总部,3、故障处理结果回复源故障申告部门。处理结束

24

附录3 故障上报表

中国联通OSS系统故障上报表

中国联通 分公司 填写人: 签批: 故障发现人 故障受理人 故障处理人员 故障历时 故障影响范围 及现象 起始时间 故障地点 通知时间 结束时间 故障级别 故障原因 分析 处理过程 吸取的教训及 整改措施 备 注 填写时间: 年 月 日

25

附录4 中国联通OSS系统作业计划

中国联通OSS系统作业计划.xls

26

附录5 中国联通OSS系统维护指标参考

1、 主机、存储系统维护工作参考 (一)主机忙时CPU使用率:

1、本指标用来衡量核心主机的忙时性能。

计算方式:(CPU时间总量-CPU空闲时间量)/CPU时间总量*100%;对于每台核心主机,在小于10分钟的时间间隔内取CPU利用率。

2、目标值:

核心业务系统主机业务忙时间段CPU平均占用率参考标准为<80%。 (二)主机忙时内存可用率:

1、本指标用来衡量核心主机的忙时性能。

计算方式:内存的使用量/内存总量*100%;对于每台核心主机,在小于10分钟的时间间隔内取内存使用率。

2、目标值:

核心业务系统主机内存使用率参考标准为<80%,各分公司视具体运行情况而定。

(三)主机文件系统空间占用率:

1、本指标用来衡量核心主机的文件系统空间使用情况。 计算方式:文件系统实际使用量/文件系统总大小*100%。 2、目标值:

核心业务系统主机文件系统占用率参考标准如下:/ <90% ;/var <80% ;/tmp <85% ;/usr <95% ;/opt <95%,各分公司视具体运行情况而定。 (四)主机swap space占用率:

1、本指标用来衡量核心主机的文件swap space使用情况。 计算方式:swap space实际使用量/swap space总大小*100%。 2、目标值:

核心业务系统主机swap space使用率参考标准为<80%,各分公司视具体运行情况而定。

(五)主存储设备I/O平均占用率: 1、本指标用来衡量主存储的忙时性能。

计算方式:实际使用存储带宽/总存储带宽*100%;对于每台主存储设备,在

27

小于10分钟的时间间隔内取I/O利用率。 2、目标值:

核心业务系统主存储设备忙时I/O利用率参考标准为<80%。

2、 数据库系统维护工作参考 (一)数据库表空间使用率:

1、本指标用来衡量系统关键数据库的性能。

表空间使用率的计算方式为:表空间实际使用量/可用表空间*100%;对于每个关键数据库,在小于10分钟的时间间隔内取表空间使用率的抽样值。 2、目标值:

核心系统数据库表空间使用率参考标准为<80%,各分公司视具体运行情况而定。

(二)数据库共享内存使用率:

1、本指标用来衡量系统关键数据库的性能。

共享内存使用率的计算方式为:共享内存实际使用量/可用共享内存*100%;对于每个关键数据库,在小于10分钟的时间间隔内取共享内存使用率的抽样值。 2、目标值:

核心系统数据库共享内存使用率参考标准为<70%,各分公司视具体运行情况而定。

(三)数据库PGA命中率:

1、本指标用来衡量系统关键数据库的性能。

2、目标值:核心系统数据库PGA命中率参考标准为>95%,各分公司视具体运行情况而定。 (四)数据库锁数量:

1、本指标用来衡量系统关键数据库的性能。

2、目标值:核心系统数据库锁数量参考标准为<100个,各分公司视具体运行情况而定。

3、 关键进程维护工作参考

28

(一)监控应用系统进程的运行状态,是否有告警信息,定期查看应用进程对主机资源和数据库资源的占用情况;定时检查运行日志,关注是否有异常信息。如有,应及时报障,进行处理,保证各进程正常运行。

(二)监控各应用程序进程质量,是否存在僵尸进程、无效进程。

4、 网络维护工作参考 (一)网络设备忙时CPU使用率:

1、本指标用来衡量核心网络设备的忙时性能。

计算方式:(CPU时间总量-CPU空闲时间量)/CPU时间总量*100%;对于每台核心网络设备,在小于10分钟的时间间隔内取CPU利用率。 2、目标值:

核心网络设备忙时间段CPU平均占用率参考标准为<40%。 (二)网络设备忙时内存可用率:

1、本指标用来衡量核心网络设备的忙时性能。

计算方式:内存的使用量/内存总量*100%;对于每台核心网络设备,在小于10分钟的时间间隔内取内存使用率。 2、目标值:

核心网络设备忙时间段内存平均占用率参考标准为<50%。 (三)网络设备忙时带宽占用率:

1、本指标用来衡量核心网络设备的忙时性能。

计算方式:带宽实际使用大小/带宽总大小*100%;对于每台核心网络设备,在小于10分钟的时间间隔内取带宽占用率。 2、目标值:

核心网络设备的忙时最大带宽占用率参考标准为<50%。

5、 中间件维护工作参考 JVM内存利用率:

1、本指标用来衡量系统中间件的性能。

2、目标值:中间件JVM内存利用率参考标准为<80%,各分公司视具体运行情况而定。

29

本文来源:https://www.bwwdw.com/article/iyx6.html

Top