IT事件管理流程v5.01-ch - 图文

更新时间:2024-06-14 09:47:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

文件名称 文档密级:

流程名称 版 本 文件编码 拟 制 人 审 核 人 批 准 人 适用范围 IT运维事件管理流程V5.01 V5.01 BR&IT/OM/ IT.IM/P01 陈冬香 陈风 胡泽新 全球 生效日期 流程架构 L1 L2 L3 L4 IM 即为批准日期 BR&IT 运作/维护 事件管理 标准角色 1 概述

本流程旨在规范管理IT事件处理,确保所有事件按照规范尽快解决,维持承诺的服务水平。

本流程适用于IT生产环境发生的所有IT事件,包括试运行期间的IT事件。

2 目的

尽快恢复正常的IT服务,将对业务系统产生的负面影响减到最少。

3 术语

名称 定义 事件在某一服务中不属于标准操作的、并能导致或可能导致这个服务的中断或下(Incident) 降的任何事件(Event)。事件不仅包括与软硬件有关的错误,还包括服务请求。 用户想要获得支持、递送、信息、建议或文档的请求,它并不属于IT基础设服务请求 问题 施方面的故障。 可能或已经导致一个或多个事件的潜在、未知的故障原因 4 业务范围

流程起点 流程终点 输 入 2013-04-17

事件发生 事件关闭并完成事件分析 用户或监控发现服务中断或下降的任何事件(Event)和用户提交的服务请求 华为机密,未经许可不得扩散

第1页, 共10页

文件名称 文档密级:

输 出 事件管理月报 5 流程绩效指标

指标名称 指标定义 计算公式 事件及时处理率 事件及时解决率 接收事件后,根据提交事件的渠道在规定的时间内给予处理,并已向用户反馈了事件处理状态和计划的事件占总接收事件数的百分率 在接收用户事件后,按事件的级别在规定的时间内给予解决的事件占总接收事件数的百分率。其中,1级和2级事件的及时解决率权重为0.4,3级事件及时解决率权重为0.6,4级事件不计入。 及时处理事件数之和/接收事件总数×100% (及时解决的1级、2级事件数之和)/(接收的1级、2级事件数之和)×40%+(及时解决的3级事件数之和)/(接收的3级事件数之和)×60% 6 流程总体要求

当发生IT运维事件时,除了按照本文要求的活动进行管理外,同时,还要按《IT运维事件升级通报管理规定》要求,进行升级通报。

7 流程中的角色及其职责

角 色 IM 职 责 管理事件流程日常操作,按照《IT运维事件升级通报管理规定》负责IT运维升级通报 事件提出人 用户 通过IT求助渠道解决工作中遇到的IT困难或疑问 监控 ? 集中监控全球机房设施、网络、系统(软硬件)、应用,及时发现异常并登记、诊断、分类、传递事件; ? 负责现场巡检、健康检查,发现异常并登记事件。 Super User ? 负责IT应用使用咨询和操作类事件的解答。 ? 及时将无法解决的事件传递给IT热线或现场支持。 ? 配合其他IT技术支持现场处理应用事件。 ? 编写典型IT应用操作类事件案例并组织培训、宣传。

2013-04-17

华为机密,未经许可不得扩散 第2页, 共10页

文件名称 文档密级:

一线支持工程师 IT热线 ? 作为用户接口,受理用户通过热线电话、邮件、IT服务平台等方式提交的IT事件; ? 负责解决客户端、应用类事件。根据案例或相关操作指导书,对用户事件进行初步诊断、分析,提供解决方案。对于不能解决的事件,传递给其他相关技术支持; ? 承担IM(Incident Manager)职责,端到端跟踪所有事件的处理和解决。遵照《IT运维事件升级通报管理规定》进行1级/2级IT运维事件的升级通报工作,推动重大事件及时解决; ? 负责IT系统故障公告的拟制和发布,组织与受事件影响相关用户的沟通; ? 及时总结,形成案例; ? 通过定期的用户宣传和IT基础技能培训,提升用户的IT自助能力; ? 定期进行事件统计分析,推动将重复发生的事件纳入问题管理流程。 例行支持 ? 根据操作指导或案例,对机房设施、网络、系统(软硬件)、应用的IT事件进行例行化处理,不能解决的事件及时传递给其他技术支持; ? 对机房设施、网络设备、系统(软硬件)及线路故障按操作指导向供应商报障并跟踪; ? 及时填写所解决的一二级事件故障报告; ? 及时总结,形成案例; ? 定期进行事件和监控告警信息统计分析,推动将重复发生的事件纳入问题管理流程。 现场支持 ? 根据案例、操作指导或配合其他技术支持现场解决当地机房或用户的IT事件; ? 现场协助供应商处理事件; ? 当地机房及机房IT设施设备的现场管理; ? 及时填写所解决的一二级事件故障报告; ? 及时总结,形成案例。 二线支持工程? 负责接收一线支持工程师传递的事件或非例行化的事件,对事件做进一华为机密,未经许可不得扩散

第3页, 共10页

2013-04-17

文件名称 文档密级:

师 步诊断、分析及处理,并及时解决事件。对无法解决的事件及时传递给三线支持工程师进行处理; ? 及时填写所解决的1、2级事件故障报告; ? 负责将重复发生、根因不明或已知缺陷的事件,转入问题管理流程; ? 协调、配合供应商对事件的处理,进行供应商绩效评价; ? 通过案例和例行化、脚本化等手段,提升一线支持的事件解决能力。 三线支持工程师 ? 对二线支持工程师所传递的IT事件进行定位、分析,提供解决方案并实施; ? IT生产环境BUG类事件的定位、分析、提供Workaround或彻底解决方案并实施; ? 及时填写所解决的1、2级事件故障报告; ? 将根因不明或已知缺陷的事件,转入问题管理流程; ? 协调、配合供应商对事件的处理,进行供应商绩效评价; ? 总结案例并向一、二线支持工程师进行技能转移。 注: ? 新系统试运行期间,项目组承担二线支持工程师、三线支持工程师职责;

? 老系统优化项目试运行期间,二线支持工程师职责由SO和项目组共同承担,事件优先传

递给SO的二线支持工程师。三线支持工程师职责由项目组承担。

2013-04-17

华为机密,未经许可不得扩散 第4页, 共10页

文件名称 文档密级:

8 流程图

9 流程说明

活活动活动内容 角色 动名称 编号 001 发现1、用户遇到IT困难或疑问时,可以选择以下方式解事件事件 决: 提出? 在W3 IT服务频道查找解决方案自助解决,或人 向Super User求助。转002; ? 或通过电话、E-MAIL、填写电子表单等方式与一线支持工程师联系,报告事件、描述错误信息或故障现象、时间/地点、受影响的应用程序或功能等。转004。 2、监控人员根据监控系统的报警、机房巡检时发现的异常情况、健康检查时发现的异常情况、《IT运维事件举例》,确认是否为事件。若为事件,转2013-04-17

华为机密,未经许可不得扩散

输入 输出 用户或监控发现服务中断或下降的任何事件(Event)和用户提交的服务请求 事件记录 第5页, 共10页

文件名称 文档密级:

002 诊断事件 003 提供/实施解决方案 004 004;如果不是则不做处理。 了解事件状况,分析确定原因及影响、确定有无解决方案。 ? 对于能解决的事件,转003; ? 对于不能解决的事件,指引用户向一线支持工程师求助。转001。 根据事件的原因及影响,向用户提供解决方案,或帮助用户在客户端实施解决方案,流程结束。 Super 事件记录 事件User 记录更新 Super 事件记录 事件User 记录更新 一线打开事件管理平台填写记录单,内容包括:用户信记录支持息(如:姓名、工号、部门、办公地点等)和事件事件 工程类别、事件描述等。 师 005 诊断事件 006 提供解决方案 007 实施解决2013-04-17

1、按《IT运维事件升级通报管理规定》的事件级别定义、事件及时处理时间要求,参考《IT运维事件举例》确定事件级别;进行初步诊断、分析原因、设置事件类别、分析能否解决。能解决时,转006;不能解决时,根据CMDB库中的技术支持名单,传递给正确的二线支持工程师处理,转008。 2、同时,IM应根据《IT运维事件升级通报管理规定》进行事件跟踪、升级通报。按《IT故障公告管理规定》发布公告信息。转019。 注: ? 传递事件时,传递人必须确认被传递人有效接收传递信息。确认方式包括但不限于:短信、邮件、电话等。 1、根据事件的原因及其影响,根据案例或操作指导,确定解决方案。 2、解决方案需要用户在客户端处理时,通过电话或者邮件为用户提供解决方案。需要用户提交电子流的事件,如IT账号申请,指导用户提交服务请求到IT服务申请平台。 3、解决方案需要在系统上操作时,一线支持工程师实施解决方案。需要修改系统配置时,要提交变更申请,触发变更流程。 实施已确定的解决方案,实施后转016 华为机密,未经许可不得扩散

用户或监事件控发现服记录 务中断或下降的任何事件(Event)和用户提交的服务请求 事件记录 事件记录更新 一线支持工程师 一线 支持工程师 事件记录 事件记录更新 一线 支持事件记录 事件记录第6页, 共10页

文件名称 文档密级:

方案 008 接收事件 009 诊断事件 010 提供解决方案 011 实施解决方案 012 接收事件 工程师 接收一线支持工程师传递的事件,确定事件传递的二线 有效性,按《IT运维事件升级通报管理规定》中的支持事件及时处理时间要求,尽快处理。 工程 师 注: ? 如果事件传递不正确,要尽快转给正确的人处理。 ? 传递事件时,传递人必须确认被传递人有效接收传递信息。确认方式包括但不限于:短信、邮件、电话等。 按《IT运维事件升级通报管理规定》中的事件及时二线 解决时间要求,了解事件记录中描述的事件状况和支持事件特征,核实事件的严重等级,了解事件目前状工程态,确定大概的原因、确定可能的解决方案。能解师 决时,转010;不能解决时,根据CMDB库中的技术支持名单,传递给正确的三线支持工程师处理,转012。 注: ? 传递事件时,传递人必须确认被传递人有效接收传递信息。确认方式包括但不限于:短信、邮件、电话等。 1. 根据事件的原因及其影响,确定对其他用户影二线 响最小的恢复程序或解决方案。 支持2. 解决方案需要用户在客户端处理时,通过电话工程或者邮件为用户提供解决方案。 师 3. 解决方案需要在系统上操作时,二线支持工程师实施解决方案。需要修改系统配置时,要提交变更申请,触发变更流程。 实施已确定的解决方案,实施后转016 二线 支持工程师 接收二线支持工程师传递的事件,确定事件传递的三线 有效性,按《IT运维事件升级通报管理规定》中的支持事件及时处理时间要求,尽快处理。 工程 师 注: ? 如果事件传递不正确,要尽快转给正确的人处理。 ? 传递事件时,传递人必须确认被传递人有效接收传递信息。确认方式包括但不限于:短信、邮件、电话等。 华为机密,未经许可不得扩散

更新 事件记录 事件记录更新 事件记录 事件记录更新 事件记录 事件记录更新 事件记录 事件记录更新 事件记录 事件记录更新 2013-04-17

第7页, 共10页

文件名称 文档密级:

013 诊断? 按《IT运维事件升级通报管理规定》中的事件事件 及时解决时间要求,了解事件记录中描述的事件状况和事件特征,核实事件的严重等级;了解事件目前状态,确定大概的原因、确定可能的解决方案。 014 提供1. 根据事件的原因及其影响,确定对其他用户影解决响最小的恢复程序或解决方案。 方案 2. 解决方案需要用户在客户端处理时,通过电话或者邮件为用户提供解决方案。 3. 解决方案需要在系统上操作时,三线支持工程师实施解决方案。需要修改系统配置时,要提交变更申请,触发变更流程。 注: 对于待计划解决的事件,解决方案为三线支持工程师需要提供解决计划。 015 实施实施已确定的解决方案,实施后转016 解决方案 016 三线 支持工程师 三线 支持工程师 事件记录 事件记录更新 事件记录 事件记录更新 017 018 019 三线 支持工程师 验证确认解决方案的有效性。如果事件得到解决,转事件解决017;如果事件不能解决,按提供解决方案的责任提出方案 人,分别转回给相关的责任人,即: 人 ? 一线支持工程师提供解决方案时,转005 ? 二线支持工程师提供解决方案时,转009 ? 三线支持工程师提供解决方案时,转013 关闭1. 把完整的调查结果和处理过程,包括联系用户一线 事件 及采取行动的时间和日期,解决方案更新到事支持件记录中去,关闭事件。 工程2. 对于1级/2级事件,转018。 师 3. 对于3级/4级事件,如果是原因不明且重复出现的事件时,需要提交问题申请,触发《IT问题管理流程》,流程结束。 注: 若连续三天仍联系不上用户时,默认为事件已解决,事件将自动关闭。 提交事件处理责任人到“事件跟踪管理平台”数据库提一线 故障交故障报告或者故障原因,流程结束。 二线 报告 三线 支持工程师 升级根据《IT运维事件升级通报管理规定》和《IT故障IM 通公告管理规定》要求,跟踪事件处理进展,进行升报,级通报,发布故障公告。 华为机密,未经许可不得扩散

事件记录 事件记录更新 事件记录 解决方案的验证结果 解决方案的验证结果 事件记录更新 1级/2级事件事件记录 事件故障报告 1级/2级事件事件记录 事件通报记录 2013-04-17

第8页, 共10页

文件名称 文档密级:

发布本活动为流程KCP1,控制要素如下,其遵从性测试故障计划见支持文件: 公告 1、根据事件描述检查一二级事件是否登记为三四级,对于登记的一二级事件降为三四级是否在ITSM中有产品经理和事件流程经理审核通过记录。 2、在以下关键时间点是否按规范通报: 二级事件10分钟内打电话联系事件处理人;一级事件20分钟内发布故障公告;一级事件持续1小时前后10分钟内向BP&IT总裁发送事件进展短信。 10 支持文件

序号 文件名称 文件编码 01 02 03 04 05 事件管理流程业务场景操作指导 IT运维事件升级通报管理规定 IT故障报告管理规定 IT故障公告管理规定 事件管理流程KCP遵从性测试计划 BR&IT/OM/IT.IM/M01/P01/W01 BR&IT/OM/IT.IM/M01/P01/R01 BR&IT/OM/IT.IM/M01/P01/R02 BR&IT/OM/IT.IM/M01/P01/R03 BR&IT/OM/IT.IM/P01/R05 11 相关流程及接口

上层文件 前端流程 IT全球技术支持体系框架 转产管理流程(IN:转产项目后产生的事件) 告警管理流程(IN:告警发现的事件) 变更管理流程(IN:变更实施引发的事件) 备份/恢复管理流程(IN:备份、恢复中出现的事件) 配置管理流程(IN:配置不准确引发的事件) 帐号权限管理(IN:帐号权限申请引发的事件) 服务等级管理(IN:事件服务水平指标) 后端流程 问题管理流程(OUT:所有1、2级事件、重复发生的3、4级事件生成问题) 变更管理流程(OUT:需要通过变更解决的事件) 可用性管理流程(OUT: 事件的故障时间) IT服务持续性管理流程(OUT: 事件升级为灾难) 帐号权限管理(OUT:因解决事件需要申请帐号权限) 服务等级管理(OUT: 事件相关服务指标结果) 2013-04-17

华为机密,未经许可不得扩散 第9页, 共10页

文件名称 文档密级:

12 记录的保存

记录名称 保存责任人 保存场所 归档时间 保存期限 到期处理方式 事件记录 各级技术支持人员 ITSM系统 季度 3年 清除 13 补充说明

14 文件拟制/修订记录

版本 V1.0 V2.0 V3.0 V4.0 V5.0 V5.01

拟制/修订责任人 拟制/修订日期 赵俊 赵景玲 赵景玲 兰发挥 兰发挥 陈冬香 2002-10-16 2003-12-30 2005-04-20 2006-12-27 2008-11-08 2010-05-17 修订内容及理由 新拟制 参考ITIL标准进行优化 根据BS15000认证顾问意见及实际运作经验进行优化 根据精细化管理要求进行优化 全球支持体系优化需修订相关内容 根据流程内控要求,增加流程KCP要求 胡泽新 批准人 2013-04-17

华为机密,未经许可不得扩散 第10页, 共10页

本文来源:https://www.bwwdw.com/article/odu6.html

Top