IBM P系列小型机报错日志解析

更新时间:2024-06-08 06:20:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

项目编号 版 本 号 1.0 密 级 机密 IBM P系列小型机报错日志解析 作 者 审 核 批 准 刘禄川 编写时间 审核日期 批准日期 2012.7.31 深圳市紫金支点技术股份有限公司版权所有 未经深圳市紫金支点技术股份有限公司的书面许可,请勿以任何形式提供给任何第三方。

一、 处理报警流程

1. 首先,每台IBM P系列小型机报警后,会直接在ECC监控中心显示,工行设备一线人员会收到报警邮件。 2. 工行设备一线人员会将报警日志中的errpt.out文件与vpd文件发送给我方,并进行电话通知。

3. 我方收到报警日之后,需根据内容进行分析,并把分析结果以邮件的形式回复给用户。

二、 日志分析过程

1. 报警日志内容输出事例

LABEL: SC_TAPE_ERR4 IDENTIFIER: 07A33B6A

Date/Time: Mon Jul 23 20:47:22 2012 Sequence Number: 637 Machine Id: 00CECEC44C00 Node Id: br0f07 Class: H Type: PERM

Resource Name: rmt16 Resource Class: tape Resource Type: ost

Location: U5791.001.9920XMN-P2-C3-T2-W500507630F794623-L0 VPD:

Manufacturer................IBM

Machine Type and Model......ULT3580-TD4 Serial Number............... Device Specific.(Z3)........0000

Description

TAPE DRIVE FAILURE

内部资料,未经许可请勿传播 ?深圳市紫金支点技术股份有限公司, 2012 1/5

Probable Causes ADAPTER TAPE DRIVE

Failure Causes TAPE DRIVE ADAPTER

Recommended Actions

PERFORM PROBLEM DETERMINATION PROCEDURES

Detail Data SENSE DATA

0600 0A00 0400 0000 0000 0000 0000 021E 0000 0000 0000 0000 0200 0302 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0004

2. 报警日志内容输出各个名词解释 1).LABEL 事件的预定义名称 2).IDENTIFIER 事件的数字标识符

内部资料,未经许可请勿传播 ?深圳市紫金支点技术股份有限公司, 2012 2/5 3).Date/Time 事件的日期和时间 4).Sequence Number 事件的唯一编号 5).Machine ID 系统处理器部件的标识号 6).Node ID 系统的缩写名(助记名)

7).Class 错误的一般原因。可能的错误类型有: H 硬件

S

软件

O 指示性信息 U 未确定的

8).Type 发生的错误的严重性。可能有如下错误类型: PEND 一个设备或部件将很快丧失其可用性 PERF 设备或部件的性能已降级至可接受的水平以下 PERM 不可能恢复的状况。此类错误通常是最严重的错 误,并可能意味着硬件设备或软件模块损坏。 TEMP 多次不成功的尝试之后,被恢复的状况。此错误 类型也用来记录指示性的信息条目,如 DASD 设备的数据传输统计。 UNKN 不能确定错误的严重性

INFO 指示性的错误日志条目,和不是错误的结果 9).Resource Name 发现错误的资源名称。对于软件错误, 这是一个软件部件、或一个可执行程 序的名称。对于硬件错误,这是一个

内部资料,未经许可请勿传播 ?深圳市紫金支点技术股份有限公司, 2012 3/5 设备、 或系统部件的名称。 10).Resource Class 发现故障的资源通用类。(如,disk 设 备等)

11).Resource Type 发现故障的资源类型

12).Location Code 设备的路径。可能有多达四个字段,分 别涉及 drawer(抽屉)、slot(插槽)、 connector(连接器)、port(端口)。 13).VPD 关键产品数据(Vital product data)。该字段的 内容是多种多样的。设备的错误日志条目比较典 型地, 返回关于设备厂商、序列号、工程变动 级别、只读存储器级别等方面的信息。 14).Description 错误的摘要

15).Probable Cause 列出一些可能导致错误的原因 16).User Causes 列出一些用户误操作导致故障的可能原 因。

Actions 描述校正用户导致的错误的推荐操作 17).Install Causes 列出由于不正确的安装或配置过程而 导致故障的可能性原因。 Actions 描述校正安装导致错误的推荐操作 18).Failure Causes 列出硬件、或软件可能的缺陷/故障 Actions 描述校正故障的推荐操作。对于硬件错误, 会运行诊断程序。

内部资料,未经许可请勿传播 ?深圳市紫金支点技术股份有限公司, 2012 4/5 19).Detailed Data 对于每一个错误日志条目都是唯一的 故障数据,如设备 sense 数据。

内部资料,未经许可请勿传播 ?深圳市紫金支点技术股份有限公司, 2012 5/5

19).Detailed Data 对于每一个错误日志条目都是唯一的 故障数据,如设备 sense 数据。

内部资料,未经许可请勿传播 ?深圳市紫金支点技术股份有限公司, 2012 5/5

本文来源:https://www.bwwdw.com/article/spt6.html

Top