企业IT服务管理系统建设规范

更新时间:2024-04-03 19:22:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

企业IT服务管理系统

建设规范

I

目次

1 主题内容 .................................................................... 1 2 适用范围 .................................................................... 1 3 引用标准及规范............................................................... 1 4 术语和定义 .................................................................. 1 5 总则 ........................................................................ 2 6 体系结构 .................................................................... 3 7 功能要求 .................................................................... 5 8 其他要求 ................................................................... 81 9 附则 ....................................................................... 82

II

公司IT服务管理系统建设规范

1 主题内容

本规范规定了公司IT服务管理系统建设的基本要求,定义了IT服务管理系统涵盖的范围和基本功能,提出了系统体系结构、系统功能和应用系统集成的原则和建议,明确了系统建设的有关要求。 2 适用范围

本规范适用于企业总部、各分子公司以及各分子公司下属单位IT服务管理系统的建设与管理。 3 引用标准及规范

下列文件中的条款通过本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分,凡是不注日期的引用文件,其最新版本适用于本部分。

Q/CSG11801.2-2008 中国南方电网有限责任公司信息分类和编码第2分册:公共信息分类和编码 Q/CSGXXX-XXX IT集中运行监控系统建设规范 GB /T24405.1信息技术服务管理第1部分:规范 GB/T24405.2信息技术服务管理第2部分:实践规则 GB/T 17859-1999 计算机信息系统安全保护等级划分准则 GB/T 20984-2007 信息安全技术 信息安全风险评估规范 GB/T 16680-1996 软件文档管理指南 GB/T 14079-1993 软件维护指南

GB/T 14394-1993 计算机软件可靠性和可维护性管理 GB/T 12504-1990 计算机软件质量保证计划规范 GB/T 12505-1990 计算机软件配置管理计划规范 GB/T 8567-1988 计算机软件产品开发文件编制指南 GB/T 9385-1988 计算机软件需求说明编制指南 GB/T 9386-1988 计算机软件测试文件编制规范 4 术语和定义

4.1 IT集中运行监控系统

集网络管理、系统管理等子系统于一体,作为信息部门运维的统一、规范的IT运行监控管理平台。

1

4.2 IT服务管理系统

主要包括IT服务支持、IT服务交付管理、垂直化专业管理、IT运维管理模块,用于实现IT运维服务全生命周期管理的IT运维服务专业管理系统。 4.3 IT服务支持管理模块

基于信息服务国际标准ISO20000和业界最佳实践ITIL的IT服务管理系统的子模块,主要包括

事件管理、问题管理、配置管理、变更管理、发布管理、请求管理及知识管理。

4.4 IT服务交付管理模块

基于信息服务国际标准ISO20000和业界最佳实践ITIL的IT服务管理系统的子模块,主要包括服务级别管理、服务报告管理、业务关系管理、能力管理和供应商管理。 4.5 IT运维管理模块

结合电网调度运行管理经验,符合IT运维服务体系两级三线要求的IT服务管理系统子模块,主要包括机房管理、计划管理、移交管理和投退运管理。 4.6 垂直专业管理模块

IT服务管理系统的子模块,主要包括运维报告管理、任务管理和信息安全报告。 4.7 事件

IT服务管理内记录的最终用户报告的事件,以及来自IT集中运行监控系统的告警信息。 4.8 故障

指信息系统在没有预先安排的情况下出现的对用户提供服务的中断。 4.9 缺陷

指信息系统发生的异常或存在的隐患(包括信息安全漏洞),这些异常或隐患将影响信息系统安全可靠运行。缺陷按照其严重程度分为紧急(危急)缺陷、严重(重大)缺陷和一般缺陷;按照来源分为软件缺陷和硬件缺陷,软件缺陷主要包括协议缺陷、程序缺陷、配置缺陷等。 5 总则 5.1 指导思想

为确保信息化战略有效执行,建立南方电网信息化保障体系,以适应系统大集中模式转变,确保IT持续运行,促进IT成本优化,按照信息化规划提出的“全网统一的两级三线运维服务模式”,建立一体化的IT运维服务体系,围绕IT运维服务全生命周期管理、IT客户全方位管理理念,搭建网省两级的IT服务管理系统,实现“监控自动化、流程扁平化、运维属地化、服务调度一体化、管理指标化、分析智能化”。

2

5.2 建设原则

5.2.1 遵循“统一管理、统一规划、统一标准、统一建设”原则,按照“典设在前、试点先行、统一推广”的建设策略,开展全网IT服务管理系统建设,确保公司信息化建设的规范和统一。 5.2.2 IT服务管理系统应涵盖本规范规定的所有子模块,同时满足本建设规范的所有要求。 5.3 建设目标

5.3.1 建立集IT监控、服务管理、运维管理、资产配置、集中展现于一体的IT运维服务体系,作为信息部门统一规范的运维管理系统,依托省级集中的IT服务中心,实现运维服务的统一调度,通过技术平台联动,实现网、省规范高效的管理联动,最终实现“监控自动化、流程扁平化、运维属地化、服务调度一体化、管理指标化、分析智能化”。

5.3.2 实现运维管理的“体系化、规范化、指标化”,建立网、省两级IT服务管理系统。 5.3.3 提供分子公司统一的对外服务接口,理顺IT服务支持体系,通过流程保证事件、故障、异常的闭环管理。

5.3.4 促进运维质量和运维效率的提高,提高服务质量和用户满意度,满足信息运维工作集约化、精细化管理要求,保障服务水平的持续提升。 6 体系结构 6.1 系统逻辑架构

6.1.1 下图为IT集中运行监控系统和IT服务管理系统的逻辑架构图,本规范的IT服务管理系统为整个系统的协同调度层。

3

公司总部垂直专业管理任务 管理运维报告安全报告IT运维服务指标管理网络指标应用系统指标桌面指标服务指标公司总部集中展现层安全指标系统指标集中展现层告警管理系统监控业务管理网络管理IT运维服务指标管理网络指标安全指标应用系统指标桌面指标服务指标统一信息库安全管理运维管理资产管理报表管理系统指标协同调度层垂直专业管理任务管理运维报告安全报告投运管理退运管理IT服务管理系统IT运维管理移交管理值班管理交接班机房进出替班管理计划管理作业表单实时库IT服务支持管理事件管理问题管理配置管理变更管理请求管理发布管理知识管理IT服务交付管理能力管理供应商业务关系服务级别服务报告实时数据用户安全性能资产故障告警运维分子公司流程协调控制数据处理层网络管理拓扑管理地址管理性能数据处理配置数据处理系统管理性能管理用户模拟体验故障数据处理安全管理威胁管理风险管理脆弱性管理……历史库历史数据数据处理告警处理安全风险性能数据配置数据故障数据数据采集日志数据安全事件数据IT基础层中间件服务器数据库中间件应用系统网络设备安全设备机房环境桌面微机

图6-1 IT集中运行监控系统和IT服务管理系统逻辑架构图

6.1.2 IT基础层为IT集中运行监控系统的监控管理对象,包括各类型的网络设备、安全设备、操作系统、数据库、中间件、Web应用以及能产生相关事件的信息系统。

6.1.3 数据处理层实现对网络设备、安全设备、服务器、数据库、中间件、应用系统、机房环境等的运行状态、实时事件日志、告警信息、配置数据、性能参数以及各类事件数据进行标准化、归并压制、过滤、汇聚等预处理工作,并发送至统一信息库集中存储。

6.1.4 协同调度层包括IT服务支持管理、IT服务交付管理、IT运维管理、垂直专业管理;IT服务支持管理通过数据处理层过滤后形成的性能告警、安全告警、配置告警等提供事件管理、问题管理、变更管理、配置管理、发布管理等流程的支持,网络管理、系统管理、安全管理模块所产生事件能够自动触发事件管理流程,实现闭环操作;IT服务交付管理提供业务关系管理、服务级别管理、服务报告管理、供应商管理、能力管理等功能;IT运维管理提供值班管理、交接班管理、替班管理、计划管理、机房进出管理、作业表单管理、投运管理、退运管理、移交管理等功能;垂直专业管理负责处理网、省运维管理的联动,包括任务管理、运维报告、信息安全报告等管理功能。

4

6.1.5 集中展现平台提供一个图形化的显示界面,各系统的展现可以通过该统一平台进行实现,提供指标管理、告警管理、系统监控、业务管理、网络管理、安全管理、运维管理、权限管理、报表管理等功能。

6.1.6 统一信息库存储网络管理、系统管理、安全管理以及IT服务管理的性能数据、配置数据、故障数据、告警数据、资产信息和运维工单信息等,包括历史数据和实时数据,是集中展现平台的重要数据支撑。 6.2 部署架构

6.2.1 公司总部、各分子公司部署IT服务管理系统,建立网、省两级IT服务管理系统。

6.2.2 各分子公司下属单位不部署IT服务管理系统,通过浏览器远程访问所在分子公司的IT服务管理系统。

公司总部各分子公司

图6-2 IT服务管理系统部署架构图

7 功能要求

7.1 IT服务支持管理

IT服务支持管理主要包括的流程有:事件管理、问题管理、配置管理、变更管理、发布管理、请求管理及知识管理。 7.1.1 事件管理 7.1.1.1 流程目的

事件管理流程的目的是在成本允许的范围内尽快恢复服务。 7.1.1.2 流程范围

5

事件管理流程适用于记录、处理、关闭事件,并监督整个过程的管理活动。 7.1.1.3 流程角色和职责

事件管理流程主要角色有:事件经理、一线支持人员、二线支持人员、三线支持人员。 7.1.1.3.1 事件经理

事件经理负责事件解决过程中的协调和监控,以及事件升级的判断与执行。 职责:

1) 负责对事件的解决协调资源,保证故障的最终排除;

2) 当事件优先级为紧急或者事件将超过规定的时限,负责按照升级方法对事件进行处理,确保有效协调资源,促进支持工程师快速恢复正常服务;

3) 确保和问题管理流程经理的有效合作;

4) 确保正确和广泛地收集和分析事件数据,发现IT和业务相关的问题。 7.1.1.3.2 一线支持人员

一线支持人员负责接收所有的事件,对事件进行初步的处理,将事件分派到相应的支持工程师。 职责:

1) 在指定的响应时间内响应所有热线电话、邮件、传真等事件报告;

2) 完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等;

3) 为事件进行适当的分类、为事件分配优先级等属性; 4) 尝试使用工具、初步诊断、分析相关信息等方式解决问题; 5) 如果一线支持不能解决,将事件分配相应的支持小组/人员来处理;

6) 检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件处理进展; 7) 与用户确认事件,进行满意度调查,关闭事件。 7.1.1.3.3 二线支持人员

二线支持人员负责对事件进行初步的处理,可根据实际情况将事件分派到相应的三线支持小组/人员。

职责:

1) 响应事件的分派;

2) 验证事件的描述和信息,与用户直接进行沟通,补充相关信息; 3) 尝试使用工具、初步诊断、分析相关信息等方式解决问题; 4) 将不能解决的事件分配给相应的三线支持小组/人员来处理; 5) 为三线支持人员提供未解决事件的解决过程和测试结果记录; 6) 提供解决方案给事件经理进行审核。

6

7.1.1.3.4 三线支持人员

三线支持人员是相关系统的支持人员或是相关问题领域的专家,负责对一线支持和二线支持人员无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。

职责:

1) 验证事件的描述和信息,进一步收集相关信息;

2) 根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动; 3) 提供有效的解决方案;

4) 更新事件解决过程信息,已解决的事件返回一线支持人员,由一线支持人员关闭事件; 5) 必要时引入供应商的支持;

6) 更新事件记录,确保事件状态代码真实反映事件状态; 7) 如果不能在解决时限内解决事件,应进行事件升级。

7.1.1.4 流程相关定义 7.1.1.4.1 事件信息项

表7-1事件信息项表

序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 信息项 事件ID 申告人信息 事件分类 事件性质 事件来源 事件发生时间 事件标题 事件详细描述 分配对象 事件优先级 重复事件标记 关联配置项 建单人(受理人) 建单时间 事件状态 事件完成期限 说明 IM—××××××(单位码)—××××××(日期编码)×××××(5位流水号),单位码为公司范围内的唯一编码 事件申告人的信息 参见“事件分类”定义 参见“事件性质”定义 参见“事件来源”定义 事件发生的准确时间 事件的简要描述 对于整个事件内容的详细描述 被分配的技术支持组和人员 参见“事件优先级”定义 标记为重复事件 记录出现故障的配置项代码 创建事件请求工单的记录人 在一线生成事件记录的时间 参见“事件状态”定义 对应每一个事件优先级,自动设定最终的完成期限

7

序号 17 18 19 20 21 22 23 24 25 26 27 信息项 业务恢复时间 事件日志 解决方案 故障厂商 事件解决人 处理是否超时 实际完成时间 事件结束代码 事件关闭时间 客户满意度 附件 说明 针对故障的业务恢复实际时间 反映事件信息项的变化历史,如一个事件在处理过程中事件状态变化的时间点等信息 事件解决方案的描述 记录故障厂商或集成商信息 事件的最终解决人 参见“处理是否超时”定义 记录事件最后解决的时间 参见“事件结束代码”定义 记录事件被关闭的时间 记录客户满意度信息,分为非常满意(5)、满意(4)、一般(3)、不满意(2)、非常不满意(1) 上传附件 7.1.1.4.2 事件性质

表7-2事件性质表

编号 1 2 3 4 5

7.1.1.4.3 事件来源

表7-3事件来源表

编号 1 2 3 4 5 6

7.1.1.4.4 事件分类

事件的分类层次一般不超过三层,事件分类如下表所示。

表7-4事件分类表

8

代码 故障 投诉 咨询 缺陷 其他 指用户投诉抱怨 描述 指IT服务中断或受到影响的事件 指对系统操作、业务流程等方面的求助和询问 信息系统存在的隐患、缺陷 可按需要扩充 代码 电话 自助服务 监控系统 巡检发现 邮件报告 其他 描述 用户通过电话报告的事件,由一线支持人员录入 用户通过网站方式提交的事件 通过监控系统自动转发或录入的事件 在日常巡检过程中发现的故障事件 用户通过邮件方式报告的事件 可按需要扩充

一级分类 终端系统 二级分类 台式机 笔记本 外设 三级分类 桌面软件 终端网络 应用系统 运维支撑系统 基础设施 病毒木马 其他(根据需要扩展) 资产管理系统 营销管理系统 财务管理系统 人力资源管理系统 综合管理系统 协同办公系统 其他(根据需要扩展) IT集中运行监控系统 防病毒系统 文档加密系统 AD域 其他(根据需要扩展) 服务器 打印机 扫描仪 显示器 键盘鼠标 其他 操作系统 办公软件 工具软件 其他 信息点 网线 网卡 其他 根据需要扩展 根据需要扩展 根据需要扩展 根据需要扩展 根据需要扩展 根据需要扩展 根据需要扩展 根据需要扩展 根据需要扩展 根据需要扩展 设备 软件 其他 数据库 中间件 其他 设备 链路 其他 设备 链路 其他 UPS

系统软件 网络 存储 机房 9

其他(根据需要扩展) 7.1.1.4.5 事件优先级

空调 视频监控 烟感 温湿度 照明 布线 其他 事件优先级从事件的影响程度和事件紧急程度两个维度来确定。事件优先级可分为四级:紧急、高、中、低。

表7-5事件影响度表

编号 1 2 3 影响度 高 中 低 说明 领导、所辖运维范围内二分之一及以上单位 所辖运维范围内二分之一以下单位 个别用户 (1-3个人) 表7-6事件紧急度表

编号 1 2 3 4

表7-7事件优先级表

事件优先级 紧急 高 中 低 不同事件优先级对应不同的事件响应时限和解决时限:

表7-8事件优先级对应时限表

编号 1 2 优先级代码 紧急 高 响应时限要求 20分钟 30分钟 解决时限要求 4小时 8小时

10

紧急度 紧急 高 中 低 说明 信息安全事件、关键应用系统、关键信息基础设施故障、VIP用户计算机终端故障 其他应用系统、信息基础设施故障、申诉 非VIP用户计算机终端故障 服务请求、硬件第三方维保等 紧急度 高 紧急 高 中 中 影响度 中 高 中 中 低 低 中 中 低 低

编号 3 4 优先级代码 中 低 响应时限要求 1小时 2小时 解决时限要求 2天 3天 7.1.1.4.6 事件状态

表7-9事件状态表

编号 1 2 3 4 5 6 7 8 9 代码 已登记 已分派 一线处理中 二线处理中 三线处理中 拒绝重分配 挂起中 已解决 结束 描述 已由一线登记 已由一线分派任务 一线技术支持处理中 已分派到二线并接受 三线技术支持处理 拒绝返回给一线进行重分配 事件过程因为特殊原因处于挂起状态 已解决事件 事件已关闭

7.1.1.4.7 事件结束代码

表7-10事件结束代码表

事件结束代码 一线解决 根本解决 替代方法 二线解决 根本解决 替代方法 三线解决 根本解决 替代方法 未解决 自动消失 误报 无效申请

7.1.1.4.8 处理是否超时

每个优先级对应相应的解决期限,“处理是否超时”用来标明事件的处理是否超过解决期限。

表7-11处理超时标记表

编号 1 2 7.1.1.5 流程图

11

描述 由一线支持人员维护解决 由二线支持人员解决 由三线支持人员解决 没有解决 事件自行消逝 属于误报事件 代码 未超时 超时 未超时 描述 事件已超出规定的解决时限

事件管理流程图用户系统用户报告监控/巡检知识管理一线支持二线支持三线支持其他流程7.1.1.6 流程主要内容 7.1.1.6.1 事件接收和记录

事件接收和记录是事件管理流程的起点,一线支持人员在事件发生时快速准确地进行接收和记录,此环节需要验证用户的信息,必要时要对用户信息进行更新。 7.1.1.6.2 分类和初步支持

对于每个事件,需要确定事件优先级和事件分类,并在知识条目中查找是否有现成的解决方案或变通方法匹配,一线支持人员无法解决时,将事件分派到二线或三线支持人员处理。 7.1.1.6.3 调查和诊断

若支持人员无法利用现成方案或变通方法解决事件,则可以收集更多的信息,并运用自身技能、诊断工具等进行更加深入的分析以找到恢复服务的解决方案或临时措施,必要时可调用多名支持人员以寻求解决措施。 7.1.1.6.4 解决和恢复

二线或三线支持人员实施事件的解决方案,并将解决完毕的事件返回一线支持人员,由一线支持人员通知用户解决的结果,并与用户确认。必要时,解决方案实施前需要通过事件经理审批,事件经理根据解决方案的具体情况决定是否触发RFC。事件处理超过预期解决时限时,按照升级原则升级给相应的管理人员,以引起管理者的重视和参与。 7.1.1.6.5 事件关闭

当用户确认事件解决后,进行满意度调查,并关闭该事件。

//接收和记录分类和初步支持事件关闭解决和恢复调查和诊断变更管理发布管理问题管理 图7-1事件管理流程图

12

7.1.1.7 与其他流程关系 7.1.1.7.1 配置管理

一线/二线/三线支持人员在处理事件过程中,从配置数据库中获取必要的配置项相关信息,并在处理过程中对配置项的变更及时更新。 7.1.1.7.2 问题管理

未解决事件、需要升级的替代解决方案事件和重大事件,在事件分析报告中提出的存在趋势或潜在隐患的事件,应创建问题,问题创建后启动问题管理流程。 7.1.1.7.3 变更管理

一线/二线/三线支持人员在处理事件过程中,可根据需要提交变更请求,启动变更管理流程。 7.1.1.7.4 作业表单管理

事件处理过程中可选择相应的作业表单,并按照作业表单规定的作业步骤进行处理和记录。 7.1.1.8 流程功能要求

1) 事件登记方式

a) 人工方式

用户打电话向一线支持人员报告问题,一线支持人员根据记录的内容,注册事件。 b) Web方式

经过授权的最终用户可以登录web界面输入事件信息,能够查看知识库,判断是否可以自助解决故障,事件注册后可自动将故障处理请求的ID号发送请求者,可根据需要随时查看自己提交的事件状态。

c) 监控系统

IT集中运行监控系统以及其他相关系统产生的各类事件,通过IT运维服务流程协同注册事件,自动填写事件ID、配置项、事件标题、事件描述、优先级,并按照预先定义的事件管理流程完成事件的处理。

d) 呼叫中心系统

与呼叫中心系统进行集成,有电话来电时根据来电号码自动弹出窗口,显示对应客户信息及相关资料。

能够按流程自动记录唯一编码匹配对应的录音信息。 能够提取一线支持人员当前的任务数和任务内容。 2) 事件信息模版

根据不同的类型提供预先定义好的事件信息模板,对新建的事件提供默认值,大多数的数据项由系统自动产生,不需要用户手动输入。

3) 重复事件

13

通过不同渠道登记的事件发现是同一件事情时,把相关事件标记为重复事件,同时需要把所有的重复事件进行关联,所有标记为重复事件的事件可以不需要分配和处理,当主事件关闭时,所有的重复事件都同时自动关闭。

4) 投诉事件

在对外服务电话号码外设定用户投诉电话号码处理用户投诉事件。 5) 附件功能

事件描述需要相应的图片或者其他文件作为补充说明时,可以添加附件。 6) 事件分配方式

事件可以分配给不同的工作人员进行处理,在分配中事件模块必须提供如下分配方式:

a) 分配到组

可以选择某一工作组进行分配,工作组内部可以再分配给某个人员或者由组员主动领取。 b) 分配到个人

事件的当前责任人可以根据事件的具体情况直接将事件分配给某一个人员,分配时可显示各运维人员的忙闲状态以及正在处理的工单数量。 7) 事件通知

在事件分配后,应该对被分配人员进行邮件或者短信通知。对于一定时间内无人响应的事件自动通过邮件或短信方式通知事件经理。

8) 事件的接收

事件的被分配人可以选择接收分配给自己的事件,接收后事件状态自动改变为相应状态。 9) 事件的拒绝

事件的被分配人可以拒绝接受事件分配,事件自动回到分配人手中。拒绝后事件状态自动改变为相应状态,同时被分配人要求填写拒绝原因。

10) 事件的再分配

对于退回的事件,可以进行再次分配,所有的分配过程应该有详细记录。 11) 事件与配置项关联

事件单与配置项关联,随时查询配置管理数据库的内容。 12) 知识库的查询

可以查询知识库中是否有此种事件处理的标准步骤,如果有,则直接按照标准步骤进行操作。 13) 事件调查诊断记录

事件的责任人在事件的处理过程中需要填写事件的诊断过程和结果,事件的诊断过程采用追加的方式,不允许修改以前的诊断过程。

14) 解决方案记录

14

事件解决人在解决事件后,整理并总结事件解决方案手工录入系统。 15) 生成变更请求

需要通过变更才能解决的事件,可以在事件管理中生成新的变更申请。主要功能包括:

a) 通过事件生成变更申请单,将事件中的相应信息自动拷贝到变更申请单中。 b) 已有变更申请单和事件单的关联,一个变更申请单可以关联多个事件单。 16) 满意度调查

事件在关闭时,自动向事件的申告人发送电子邮件或短信,进行满意度调查,事件申告者可以通过邮件、短信或web方式进行满意度和客户意见反馈。

17) 发起问题

对于重大事件或者统计分析得到的事件发生趋势,可以产生相应的问题记录。主要功能包括: a) 通过重大事件生成问题单,将事件中的相应信息自动拷贝到问题单中。 b) 已有问题单和事件单的关联,一个问题单可以关联多个事件单。 18) 生成知识

事件在关闭的时候,可以将解决方案提交到知识库中,做为知识库的备选知识。 19) 报表功能

a) 统计来电数量和来电呼损数量及比例 b) 按事件分类统计事件数量 c) 按事件性质统计事件数量和比例 d) 按事件优先级统计事件数量和比例 e) 按客户满意度统计事件数量和比例 f) 按人员统计客户满意度 g) 按事件状态统计事件数量和比例 h) 按小组、人员统计解决的事件数量和比例 i) 按人员统计各处理状态事件数量 j) 按事件结束代码统计事件的数量及比例 k) 统计升级告警的事件数量和比例 l) 统计事件平均响应时长 m) 统计事件平均解决时长

7.1.2 问题管理 7.1.2.1 流程目的

问题管理流程主要目的是识别和管理事件的根本原因,减少或避免客户服务受到中断。

15

7.1.2.2 流程范围

问题管理流程适用于通过对问题原因的识别、分析、管理直至关闭,最小化对业务影响的服务管理活动。

7.1.2.3 流程角色和职责

问题管理流程主要角色有:问题经理、问题分析专家。 7.1.2.3.1 问题经理

问题经理负责协调日常的问题管理工作,包括对问题的审核、监控、所需资源的协调、定期产生报表等。

职责:

1) 定期组织相关人员对事件记录进行分析,发现潜在问题; 2) 确认和审核问题; 3) 必要时对问题进行上报;

4) 监视问题的诊断、分析和处理过程;

5) 必要时与一线支持人员及问题请求者沟通问题的相关信息; 6) 必要时协调所需资源;

7) 定期制定问题报表,提供正确决策信息。 7.1.2.3.2 问题分析专家

问题分析专家为问题的诊断及解决提供技术支持。 职责:

1) 接受问题经理分派的问题; 2) 分析和诊断问题,确定根本原因; 3) 确定和测试解决方案; 4) 提交变更请求并监控变更实施;

5) 协助事件支持人员进行重大或紧急事件的处理; 6) 需要时协调第三方的资源来帮助诊断和改正问题。 7.1.2.4 流程相关定义 7.1.2.4.1 问题信息项

表7-12问题信息项表

序号 信息项 1 2 问题ID 申告者信息 描述 PM—××××××(单位码)—××××××(日期编码)×××××(5位流水号),单位码为全网范围内的唯一编码 问题请求人的信息,包括:姓名、部门、电子邮件、办公电话、手机、地点 16

3 4 5 6 7 8 9 10 11 12 13 14 15 问题来源 问题优先级 问题分类 问题标题 问题详细描述 重复问题标记 关联的事件单号 关联的变更单号 关联配置项 分配对象 建单时间 问题状态 建单人 16 问题日志 17 实际开始诊断时间 18 实际诊断结束时间 19 问题原因 20 解决方案 21 问题结束代码 22 问题关闭时间 23 问题厂商 24 附件 7.1.2.4.2 问题来源

参见“问题来源”定义 参见“问题优先级”定义 参见“问题分类”定义 简单描述问题 详细描述问题内容 标记为重复问题,用已有标题号标注 记录引发该问题的事件单号 记录由问题发变更时,关联的变更单号 记录问题的配置项代码 将问题分配到各组问题分析专家 生成问题记录的时间 参见“问题状态”定义 创建问题工单的IT人员 反映问题处理过程中问题信息项的变化历史,包括分配的人员,状态等信息 实际开始进行问题诊断的时间 实际结束问题诊断的时间 查找出问题的根本原因 问题解决方案的详细描述 参见“问题结束代码”定义 问题关闭的时间 表7-13问题来源表

编号 1 2 3 代码 事件升级 描述 多次发生的突发事件或重大事件由支持人员升级为问题 维护中提出 技术专家在日常维护工作中提出的问题 趋势分析 分析事件记录找出的问题 7.1.2.4.3 问题优先级

问题的优先级是问题分析专家解决问题的参照标准,管理层应优先协调资源解决关键优先级问题。

表7-14问题优先级表

编号 代码 描述 影响因素: ? 影响到关键业务 ? 影响范围极大 ? 紧迫程度最高 ? 问题处理后可大幅节省投资、人力,有效提高服务质量和维护效率 影响因素:

17

1 紧急 2 高

影响到较关键业务 ? 影响范围较大 ? 紧迫程度较高 ? 问题处理后可有效节省投资、人力,一定程度提高维护质量 ? 影响因素: 3 中 对关键业务影响不大,但影响到非关键业务 ? 有一定影响范围,但影响范围不大 ? 问题处理后对维护质量和效率有一定提高 ? 影响因素: 4 低 影响到非关键业务 ? 影响范围很小 ? 问题处理后对维护质量和效率提升有限 ? 7.1.2.4.4 问题状态

表7-15问题状态表

编号 1 2 3 4 5 6 7 7.1.2.4.5 问题分类

同事件分类。 7.1.2.4.6 问题结束代码

表7-16问题结束代码表

编号 1 2 3 4 7.1.2.5 流程图

代码 根本解决 变通方法 无法解决 取消 描述 找出问题的根本原因,并得到解决方案,成功解决 没有根本解决方案或目前没有办法实施根本解决方案,但有临时解决方案作为变通方法 未找到问题的根本原因,没有解决方案,或目前无法实施解决方案,也无变通方法 问题被问题经理拒绝 代码 已登记 分析中 已定位原因 已有解决方案 已提出变更请求 已解决 已关闭 问题记录到系统中 问题分析专家正在分析问题过程中 问题根本原因已找出 解决方案已找到 已提交变更请求(RFC) 问题得到解决 问题结束 描述

18

问题管理流程图理事流件程管事件趋势分析事件升级通报服务台/问题请求者问题经理问题识别与记录问题审核与分派问题监控需关闭问题关闭问题回顾开发、确认、实施解决方案问题分析专家问题调查与诊断其它流程维护中提出变更管理流程 图7-2 问题管理流程图

7.1.2.6 流程主要内容 7.1.2.6.1 问题识别与记录

问题来源包括:

1) 事件直接升级:含未解决事件、需要升级的替代解决方案事件和重大事件; 2) 在事件分析报告中提出的存在趋势或潜在隐患的可能问题; 3) 技术专家在日常维护工作中提出的问题。 7.1.2.6.2 问题审核与分派

在接受和记录问题后,对问题进行分级和分类,问题经理对信息进行审核,确认问题有效,将问题分派给相应的问题分析专家。 7.1.2.6.3 问题调查与诊断

问题分析专家调查诊断问题后,可根据需要成立问题分析小组,举行问题根本原因分析研讨会议,必要时更新问题状态。 7.1.2.6.4 实施解决方案

19

问题分析专家找出问题的根本原因后,根据实际情况制定变通方法或根本性解决方案,更新问题记录,同时可触发变更管理流程执行解决方案。 7.1.2.6.5 问题回顾

通过问题回顾确认问题是否得到解决,或者找出需要改进的内容,包括问题的解决方案和管理流程方面,如改进升级规则、改进事件监测、找出技能差距和文档资料改进等。 7.1.2.6.6 问题关闭

确认问题的信息记录填写完整,并关闭问题记录。 7.1.2.6.7 问题监控

问题找到根本原因或解决方案之后,向一线支持或问题请求人员通报该问题的解决情况,帮助和提高事件的解决率。无法找到根本原因或虽有解决方案但目前无法实施(如实施的代价太大等),问题经理协调问题分析专家进行分析判断,决定是否继续诊断、解决或关闭。 7.1.2.7 与其他流程关系 7.1.2.7.1 配置管理

问题分析专家在处理问题过程中,需要从配置数据库中获取必要的配置项相关信息,并在处理过程中对配置项的变更及时更新。 7.1.2.7.2 变更管理

问题的解决方案常需通过变更管理实现,可通过问题管理提出变更申请给变更管理流程。 7.1.2.7.3 作业表单管理

问题处理过程中可选择相应的作业表单,并按照作业表单规定的作业步骤进行处理和记录。 7.1.2.8 流程功能要求

1) 问题创建方式

问题管理可以支持以下创建方式:

a) 通过事件管理创建问题

事件管理与问题管理具有关联,可以对系统中记录的历史事件进行统计分析,从中分析出潜在的问题,自动创建一个问题记录,该问题记录与相关事件信息进行关联。

b) 直接录入

在问题管理界面中创建问题记录,直接录入问题的信息。 2) 附件功能

问题描述需要相应的图片或者其他文件作为补充说明时,可以添加附件。 3) 问题审核

提供审核功能,供问题负责人审核该问题。 4) 问题退回

20

问题审核不通过时,可填写原因并退回问题发起人。 5) 问题与配置项关联

问题单与配置项关联,随时查询配置管理数据库的内容。 6) 问题分配

问题在处理的过程中,提供分配到组和分配到个人两种方式。 7) 解决方案记录

问题解决人在解决问题后,整理并总结问题解决方案手工录入系统。 8) 创建变更申请

需要通过变更才能解决的问题,可以生成新的变更申请。主要功能包括:

a) 通过问题单生成变更申请单,将问题中的相应信息自动拷贝到变更申请单中。 b) 已有变更申请单和问题单的关联,一个变更申请单可以关联多个问题单。 9) 生成知识

问题在关闭的时候,可以将解决方案提交到知识库中,做为知识库的备选知识。 10) 报表功能

a) 按问题状态统计问题数量和比例 b) 按问题结束代码统计问题的数量和比例 c) 按问题分类统计问题数量 d) 按问题优先级统计问题数量和比例 e) 统计找到问题根本原因所花的平均时长

7.1.3 配置管理 7.1.3.1 流程目的

通过建立、监控和维护配置管理数据库,正确识别所有配置项,记录配置项当前和历史状态,为信息系统运维服务实现提供基础数据保障。 7.1.3.2 流程范围

配置管理流程的范围包括生产环境的硬件、软件、文档以及开发测试环境中和备用的硬件以及系统软件(不包括处于开发或测试环境中的应用软件),具体内容包括识别、控制、汇报和审核等行为。 7.1.3.3 流程角色和职责

配置管理流程主要角色有:配置经理和配置管理员。 7.1.3.3.1 配置经理

配置经理是配置管理具体活动的负责人,包括带领执行配置项的鉴别、监控、控制、维护、审计等工作。

21

职责:

1) 确定配置管理工具的技术需求; 2) 规划和制定配置管理的范围; 3) 审批配置管理数据库结构的变更;

4) 建立配置管理数据库的安全控制手段,确保惟有授权的配置项才被使用; 5) 确定配置项命名和编号的规范,并确保所有配置项具有单一名字; 6) 确定配置项的分类、配置项属性、配置项的关系类型和配置项之间的关系; 7) 制定配置项(CI)的收集和CMDB建设的步骤; 8) 确定配置管理报表的格式和内容;

9) 定期对配置管理数据的内容进行审计和验证; 10) 定期主持配置管理回顾会议。 7.1.3.3.2 配置管理员

配置管理员负责管理和维护配置管理系统和配置管理数据库系统。 职责:

1) 记录和维护配置管理数据库(CMDB)中所有配置项; 2) 确保相关配置项被正确登记; 3) 确保配置项状态正确;

4) 通过手工或自动化操作增加及更改配置项; 5) 根据配置经理要求生成报表和数据分析。 7.1.3.4 流程相关定义 7.1.3.4.1 配置项分类

表7-17配置项分类和编码表

类别 子类别 0001 桌面微机 0002 笔记本电脑 0003 工作站 0004 图形工作站 0009 其他 0101 小型机 0102 微机服务器 0103虚拟机 0109 其他 0201 磁盘阵列 0202 磁带库 0203 存储交换机 0209 其他 0301 交换机 22

备注

00 PC机类 01 服务器类 02 存储设备类 03 网络设备类

04 安全设备类 05 辅助设备类 06 环境设备类 07 系统软件类 08 应用软件类 09文档类 0302 路由器 0303 集线器 0304 光端机 0305 接入设备 0306 光纤收发器 0309 其他 0401 防火墙 0402 IDS/IPS 0403 防病毒 0404 漏洞扫描 0405上网行为审计 0409 其他 0501 打印机 0502 扫描仪 0503 绘图仪 0504 移动硬盘 0505 PDA 0506 显示器 0507 投影设备 0508 仪器仪表 0509 其他 0601 门禁设备 0602 动力环境监控设备 0603 KVM设备 0604 视频监控设备 0605 UPS设备 0606 空调设备 0607 机柜设备 0609 其他 0701 操作系统 0702 数据库 0706 中间件 0709 其他 0801 财务管理系统类 0802 人力资源管理系统类 0803 生产管理系统类 0804 营销管理系统类 0805 工程物资管理系统类 0806 数据仓库及决策分析类 0807 运维支撑系统类 0808 综合业务系统类 0809 其他 0901 手册 0902 合同 0903 项目管理文件 0904 检修维护计划 23

12其他类 0909 其他 1201 GPS时钟 1202 卫星定位仪 1203 现场数据采集器 1204 电子白板 1209 其他 7.1.3.4.2 配置项编码规范

配置项编码定义:××××××(单位)-××××(设备类别)-××××(投入运行年份)-××××××(设备流水号)。

其中,××××××(单位)细化到地市级单位编码,第1、2位为省级单位编码,第3、4位为地、市级单位编码,具体参考《中国南方电网有限责任公司信息分类和编码第2分册:公共信息分类和编码》。

7.1.3.4.3 配置项关系

配置管理主要用于问题诊断和变更评估时,能兼顾考虑与某个CI直接连接的CI是否会受影响。

表7-18配置项关系表

编号 1 关系名称 集合 描述 用来描述逻辑配置项与元素成员之间的关系。如若干技术服务“集合”为一项业务服务。 用来描述逻辑实体与物理实体之间的影响的关系。某配置项的正常运行取决于另一配置项是否正确运行。如某服务需要依赖于另一软件的正常运行。 用来描述物理实体(包括各种硬件、网络设备)之间整体和局部的关系。如,内存是PC机的“组件”。 用于描述物理实体(包括各种硬件、网络设备)间外部的互为影响的关系。如,一台服务器“连接”交换机。 描述软件与相关硬件设备或其他软件之间的关系。如,windows软件运行于某台桌面PC。 描述数据、文档和各配置项之间的关系。如,关于某系统的使用手册关联某系统。 2 依赖 3 组件 4 5 6

7.1.3.4.4 配置项状态

连接 运行 关联 表7-19配置项状态表

编号 1 2 3 4 代码 入库 使用 回库 维护 描述 新设备入库 设备在使用 回库 维护

24

5 6 7 8 9 报废 闲置 捐赠 借出 借用 报废 闲置 捐赠 借出 借用

7.1.3.4.5 配置项审核状态

配置项属性以及配置项间的关系应定期审核,需对配置项信息与配置项物理存在性进行双向验证,确保与实际物理环境保持一致。

表7-20配置项审核状态表

代码 1 2 3 4 审核状态 已审核 未审核 不匹配 丢失 说明 CI成功通过审核 CI尚未完成审核 审核时发现CI的信息或者CI关系与实际不符 审核时发现实际环境中找不到对应的CI

7.1.3.4.6 配置项删除状态

配置项删除状态用于标明该配置项是否被删除,被置为“已删除”状态后,所有属性被冻结,不能修改。

表7-21配置项删除状态表

代码 1 2

7.1.3.4.7 配置项属性

1) PC机

表7-22 PC机配置项属性表

属性 设备编号 资产编号 搜索代码 设备类别 设备名称 品牌 型号 产品序列号 设备状态 联系人 使用部门 供应商 规则 自动 必填 必填 必填 必填 必填 必填 必填 必填 必填 25

删除状态 正常 已删除 说明 系统用设备唯一编码 财务资产管理编号 命名规范统一编码 子类别 设备的名称 设备的生产商/制造商 设备的型号 设备的序列号 设备的当前状态 使用该设备的人员 使用该设备的部门

投入运行时间 维保到期时间 用途概述 CPU信息 内存容量 内存类型 硬盘信息 主IP 网卡信息 光驱信息 逻辑卷信息 操作系统 操作系统正版类别 系统补丁 位置 备注 2) 服务器

必填 数组[型号、核心总数] 数组[型号、类型、容量] 管理IP地址信息 数组[型号、MAC地址、IP地址] 数组[逻辑卷路径、逻辑卷大小] 表7-23服务器配置项属性表

属性 设备编号 资产编号 搜索代码 设备类别 设备名称 品牌 型号 产品序列号 设备状态 维保到期时间 联系人 供应商 投入运行时间 用途概述 CPU信息 内存容量 内存类型 硬盘信息 主IP 网卡信息 光驱信息 光纤通道卡信息 内置磁带机信息 逻辑卷信息 操作系统 规则 自动 必填 必填 必填 必填 必填 必填 必填 必填 必填 必填 必填 必填 必填 必填 必填 说明 系统用设备唯一编码 财务资产管理编号 命名规范统一编码 子类别 设备的名称 设备的生产商/制造商 设备的型号 设备的序列号 设备的当前状态 管理人员或相关联系人 数组[型号、核心总数] 数组[型号、类型、容量] 管理IP地址信息 数组[型号、MAC地址、IP地址] 数组[光纤通道卡型号] 数组[内置磁带机型号] 数组[逻辑卷路径、逻辑卷大小]

26

操作系统正版类别 系统补丁 位置 备注 3) 存储设备

表7-24存储设备配置项属性表

属性 设备编号 资产编号 搜索代码 设备类别 设备名称 品牌 型号 产品序列号 设备状态 维保到期时间 联系人 供应商 投入运行时间 用途概述 主IP 控制器型号 驱动器型号 光纤模块型号 控制器数量 驱动器数量 光纤模块数量 硬盘型号 磁带型号 硬盘数量 磁带数量 RAID级别 应用系统分区表 备份策略表 光纤交换机类型 位置 备份 4) 网络设备

规则 自动 必填 必填 必填 必填 必填 必填 必填 必填 必填 必填 说明 系统用设备唯一编码 财务资产管理编号 命名规范统一编码 子类别 设备的名称 主机的生产商/制造商 设备的型号 设备的序列号 设备的当前状态 管理人员或相关联系人 管理IP地址信息 当子类别为磁盘阵列时使用 当子类别为磁带库时使用 当子类别为光纤通道交换机时使用 当子类别为磁盘阵列时使用 当子类别为磁带库时使用 当子类别为光纤通道交换机时使用 当子类别为磁盘阵列时使用 当子类别为磁带库时使用 当子类别为磁盘阵列时使用 当子类别为磁带库时使用 当子类别为磁盘阵列时使用 当子类别为磁盘阵列时使用 当子类别为磁带库时使用 当子类别为光纤通道交换机时使用 表7-25网络设备配置项属性表

属性 设备编号 规则 自动 27

说明 系统用设备唯一编码

资产编号 搜索代码 设备类别 设备名称 品牌 型号 产品序列号 设备状态 维保到期时间 联系人 供应商 投入运行时间 用途概述 主IP IP列表 设备软件版本 端口类型 端口数量 端口信息 位置 备注 5) 安全设备

必填 必填 必填 必填 必填 必填 必填 必填 必填 必填 财务资产管理编号 命名规范统一编码 子类别 设备的名称 设备的生产商/制造商 设备的型号 设备的序列号 设备的当前状态 管理人员或相关联系人 管理IP地址信息 所有IP列表 设备当前安装的软件版本号 光/电 数组[端口号、本端MAC、本端IP、对端MAC、对端IP] 表7-26安全设备配置项属性表

属性 设备编号 资产编号 搜索代码 设备类别 设备名称 品牌 型号 产品序列号 设备状态 维保到期时间 联系人 供应商 投入运行时间 用途概述 主IP IP列表 设备软件版本 端口类型 端口数量 端口信息 规则 自动 必填 必填 必填 必填 必填 必填 必填 必填 必填 必填 说明 系统用设备唯一编码 财务资产管理编号 命名规范统一编码 子类别 设备的名称 设备的生产商/制造商 设备的型号 设备的序列号 设备的当前状态 管理人员或相关联系人 管理IP地址信息 所有IP列表 设备当前安装的软件版本号 光/电 数组[端口号、本端MAC、本端IP、对端MAC、对端IP]

28

本文来源:https://www.bwwdw.com/article/mb2r.html

Top