EMC CX系列存储日常管理维护和故障排除手册 - 图文

更新时间:2023-11-17 04:40:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一、Clariion CX系列产品硬件介绍 1.Clariion CX系列产品的基本构成

构成:由SPS,DPE/SPE和DAE三部分组成 示例:CX4-960

(图1-0)

名词解释: SPS:Standby Power Supply,接DPE或者SPE+DAE OS,对Write Cache提供后备电源保护

SPE:Storage Processor Enclosure,包含两个全冗余的存储控制器 DPE:Disk Processor Enclosure,SPE和DAE OS在同一个Enclosure

DAE:Disk Array Enclosure,磁盘柜,包含15个硬盘槽位,磁盘ID从左至右为0-14 DAE_OS:包含控制器系统(OS)的DAE,占用DAE从左至右前五块硬盘

注:Clariion系列中采用DPE架构的有CX200/300/400/500,而CX600/700,3和4系列均为SPE架构

2. CX600 / CX700 基本部件及状态灯介绍

2.1 CX600 / CX700 Storage Processor Enclosure (SPE)--前视图

(图1-1)

(1) 3个热插拔风扇模块

(2) 风扇模块错误灯(黄灯亮表示有错误,在前面板上看不见,需拆下前面板才能看见) (3) SPE 电源指示灯(绿灯) SPE 错误指示灯 (黄灯)

2.2 CX600 / CX700 Storage Processor Enclosure (SPE)--后视图

(图1-2)

(1) Storage Processors A (2) Storage Processors B

(3) 2个热拔插电源模块 (active/active, 1+1) 2.3 CX600 / CX700 Storage Processor (SP)—细节图

(图1-2)

(1) 4 个前端(连主机)2Gb FC 端口(每个 Storage Processor ) (2) 4个后端(连扩展DAE)2Gb FC端口(每个 Storage Processor ) (3) 10/100 局域网管理端口

(4) SP Status LEDs--用于SP启动检测和检查SP的健康状态 (5) Port80h Card--在SP主板上,用与开机自检,

(6) SPS Monitoring Port--连接SPS的串口,用于SP与SPS之间的通讯和控制

(7) Serial/PPP Port--获取动态IP地址进行维护或也可通过HyperTerminal软件检测SP的启动 3. CX200 / 300 / 400 / 500 基本部件及状态灯介绍

3.1 CX200 / 300 / 400 / 500 Disk Processor Enclosure (DPE)

(四款产品均为DPE架构,除 SP的前端和后端端口数量有差别外,基本一样,下图为CX500的DPE)

(图1-4)

(1) BE0 – 后端总线端口0(HSSDC)--连接DPE和DAE (2) BE1 –后端总线端口1(HSSDC)--连接DPE和DAE (3) 两个前端 2Gb 端口(FC) 每个Storage Processor

(4) Enclosure 状态灯--绿色(电源灯),黄灯(错误灯或可用于检测启动过程) (5) 10/100 以太网管理端口

(6) Serial Mgmt Port (RJ-45)--获取动态IP地址进行维护或也可通过HyperTerminal软件检测SP的启动

(7) SPS Monitoring Port--连接SPS的串口,用于SP与SPS之间的通讯和控制 4. CX3-10 / 3-20 / 3-40基本部件及状态灯介绍

4.1 CX3-10 / 3-20 / 3-40 Storage Processor Enclosure (SPE)--前视图

(图1-5)

(A) 四个热插拔电源模块,从左至右依次为PS_A0 A1 B0 B1 (B) 电源模块故障指示灯,故障时亮黄色

(C) 系统电源指示灯:绿色,常亮系统故障指示灯:黄色,系统故障时亮 4.2 CX3-10 / 3-20 / 3-40 Storage Processor Enclosure (SPE)—后视图

(图1-6)

4.3 CX3-10 / 3-20 / 3-40 Storage Processor (SP)—细节图 (三款产品均为SPE架构,除 SP前端和后端端口数量有差别外,基本一样,下图为CX3-40的SP)

(图1-7)

A:SPS监控端口 B:管理串口

C:电源指示灯:绿色,常亮 D:故障指示灯:黄色,故障时亮 E:服务管理网口 F:客户管理网口 G:后端扩展端口 H:前端光纤端口

5. CX3-80基本部件及状态灯介绍

5.1 CX3-80 Storage Processor Enclosure (SPE)—前视图

(图1-8)

A:电源模块,上有黄色故障指示灯,故障时亮 B:冷却风扇模块,上有黄色故障指示灯,故障时亮 C:系统故障指示灯:黄色,故障时亮 D:系统电源指示灯:绿色,常亮

5.2 CX3-80 Storage Processor Enclosure (SPE)—后视图

(图1-9)

A:电源模块

B:SAN Management Module C:I/O 模块 电源模块

5.3 CX3-80 Storage Processor (SP)—细节图

(图1-10)

A:SP控制器工作状态指示灯 B:I/O Module

5.4 CX3-80 I/O Module --细节图

(图1-11)

A:后端端口工作状态LED B:后端端口 C:前端端口

D:前端端口工作状态LED

E:I/O模块电源与故障指示灯,黄色灯亮表示有故障 5.5 CX3-80 SAN Management Module --细节图

A:电源指示灯 B:故障指示灯 C:用户管理网络端口

D:服务管理网络端口,仅限于EMC服务人员使用 E:管理串口 F:SPS监控端口

(图1-12)

6. CX4-120 / 240 / 480 基本部件及状态灯介绍

6.1 CX4-120 / 240 / 480 Storage Processor Enclosure (SPE)—前视图

(图1-13)

A0:电源模块 A1:电源模块

B0:电源模块 B1:电源模块 C:CPU模块A D:CPU模块B

E:CPU模块A电源和故障指示灯 F:CPU模块B电源和故障指示灯 G:存储系统电源和故障指示灯

6.2 CX4-120 / 240 / 480 Storage Processor Enclosure (SPE)—后视图

(图1-14)

A:Management Module(管理模块) B:I/O Module(I/O模块)

C:Power / Fault LED(电源/故障指示灯)

6.3 CX4-120 / 240 / 480 Storage Processor (SP)—细节图

(图1-15)

A:Management Module(管理模块)

B:Back End Port on I/O Module(I/O模块上的后端端口,连接DAE) C:FC Front End Port on I/O Module(I/O模块上的前端光纤端口,连接主机) D:iSCSI Front End Port on I/O Module(I/O模块上的前端iSCSI端口,连接主机)

6.4 CX4-120 / 240 / 480 Management Module—细节图

A:Service LAN Port(服务端口,仅限于EMC服务使用) B:Management LAN Port(用户管理端口) C:SPS Port(SPS监控端口) D:Communications Port(管理端口)

E:NMI(系统维护用,勿触动)

(图1-16)

7. CX4-960基本部件及状态灯介绍

7.1 CX4-960 Storage Processor Enclosure (SPE)—前视图

(图1-17)

A1:Power Supply A(电源模块A) A2:Power Supply B(电源模块B) B1-B4:Blowers / Fans(风扇模块) C:Enclosure Fault LED(系统故障指示灯) D:Power LED(系统电源指示灯)

7.2 CX4-960 Storage Processor Enclosure (SPE)—后视图

(图1-18)

A:Power Supply B(电源模块B) B:Power Supply A(电源模块A) C:Management Module(管理模块) D:Management Module(管理模块) E:I/O Annex(I/O扩展模块)

7.3 CX4-960 Storage Processor (SP)—细节图

(图1-19)

A:Power LED(电源指示灯) B:Fault LED(故障指示灯)

C:Unsafe to Remove LED D1-D4:I/O Module(I/O模块)

7.4 CX4-960 Management Module—细节图

A:Fault LED(故障指示灯) B:Power LED(电源指示灯) C:USB

D:Management LAN Port(以太网管理端口)

E:Service LAN Port(以太网服务端口,仅限于EMC服务人员) F:NMI Button

G:Communications Port(服务端口) H:SPS Port(SPS 监控端口)

(图1-20)

8. Disk Array Enclosure (DAE)基本部件及状态灯介绍 8.1 Disk Array Enclosure (DAE) --前视图

(图1-21)

(10) 硬盘状态灯--绿灯表示连接状态,绿灯闪烁表示磁盘活动状态,黄灯亮表示磁盘报错 (11) 盘柜状态灯--绿灯表示供电正常,黄灯亮表示盘柜有错误

(12) Slot0-4 ,共5块DAE-OS Vault Drives (仅限于DAE_OS),从左至右,Slot 0--Slot4 8.2 Disk Array Enclosure (DAE) --后视图

(图1-22)

Two Link Control Card (LCC)

(1) LCC 状态灯--绿色表示电源,黄色表示有错误 (2) Expansion 端口(HSSDC)--灯亮表示有信号

(3) 光纤环路ID指示灯( Loop ID LED)--0,1,2,3, 表示后端连接的光纤换路(Loop) ID (4) Primary 端口(HSSDC)--灯亮表示有信号 Two DAE电源模块 (5) 两个集成了风扇的电源模块 (6) 风扇错误灯(黄色)

(7) 电源状态灯(绿色--有电,黄色--有错)

(8) 交流电源输入开关,对DAE-OS,DPE或SPE关电,应使用此开关 (9) Enclosure 地址开关-如是DAE-OS的Enclosure,则其必须被设置为0 8.3 Disk Array Enclosure 2P/3P (DAE 2P/3P) --后视图

(图1-23)

A:电源模块,下面电源模块为PS A,上面为PS B B:LCC模块,下为LCC A,上为LCC B

C:PRI端口,连接SP Back End端口或者上级DAE EXP端口 D:EXP端口,连接下级DAE PRI端口 E:Enclosure ID LED F:Loop ID LED G:电源与故障指示灯

9. Standby Power Supply (SPS) 基本部件及状态灯介绍 9.1 1 KW I U SPS

(图1-24)

(1) 电源开关 (2) 交流电源输入

(3) SPE & 启动盘所在DAE的交流输出

(4) SPS 监测端口--连接SP的串口,用于SP与SPS之间的通讯和控制 (5) 状态灯 (从下至上)

? 内部监测灯—亮黄色表示SPS内部监测出错

? 更换SPS指示灯—亮黄色表示电池寿命已到或者自检出错 ? 电池供电指示灯--当SPS给SP或DAE OS供电时亮黄色

? 电源灯--当SPS充满电后亮常绿,当SPS电池被充电时闪绿色 9.2 2.2KW 2U SPS

(图1-25) A:交流输入 B:交流输出 C:电源开关

D:SPS监测端口--连接SP的串口,用于SP与SPS之间的通讯和控制 E:状态灯(从下至上)

? 内部监测灯—亮黄色表示SPS内部监测出错

? 更换SPS指示灯—亮黄色表示电池寿命已到或者自检出错 ? 电池供电指示灯--当SPS给SP或DAE OS供电时亮黄色

? 电源灯--当SPS充满电后亮常绿,当SPS电池被充电时闪绿色 二、如何用 Navisphere看存储的状态

在 Navisphere 中,除正常状态以外,CX 磁盘阵列的四种常见状态

T:一个或者多个部件处于Transition状态,比如LUN正在Rebuilding,SPS正在充电 F:一个或者多个部件出现故障,注意,存储刚加电,由于SPS充电,也会出现F状态 X:存储系统不可访问,比如网络连接断开等情况 ?:当前Navishper版本不支持对该存储系统进行管理 举例如下: Array in Transition

Array Faulted

Array Inaccessible

如在 Navisphere 发现有报错,检查 CX磁盘阵列错误的简单方法 1、右击存储,选择fault,会显示具体报错信息

2、展开Physical项,可以定位具体故障部件

3、Clariion每个部件都有独立的故障指示灯,在Navishpere发现错误后,可以观察存储故障部件的错误指示灯进一步确认

三、 客户发现 Clariion出现问题,应如何报修?

(注:如客户已装了 dial-out或者Call-home, 存储会让管理工作站自动拨号并报修,若无,需客户自己发现并报修)

1.获取 Clariion CX系列阵列的序列号有以下五种方法:

方法一:EMC 工程师在存储安装时会在存储贴上写有序列号的白色标签 , 标签上会注明客户EMC报修电话、Site ID 、存储序列号等信息,参见下图:

方法二:如安装工程师漏贴标签,注意必须查SPE或DPE上的标签

(DPE架构的从机柜后面查看上图所示位置)

(SPE架构的从机柜正面拆下SPE挡板,查看上图所示位置)

方法三:通过serialization tag查看(仅适用于Clariion 4系列产品) CX4-120/240/480请查看存储SPE后部的黑色标签,上面有产品的PN(型号),SN(序列号)

CX4-960 和CX4-120/240/480差不多,也是在SPE后部有一个黑色标签,只是位置不同

方法四:通过 Navisphere命令查看 CX存储的序列号:(红色字体) C:\\Program Files\\EMC\\Navisphere CLI>navicli -h 192.168.2.164 getagent Name: K10 Desc: Node: A-CK200072300124 Physical Node: K10 Signature: 1912950 Peer Signature: 1912955 SCSI Id: 0 SP Identifier: A

Revision: 3.26.40.5.016 Model: CX3-40c Model Type: Rackmount Prom Rev: 3.58.00 SP Memory: 4096

Serial No: CK200072300124

Cabinet: SPE3 C:\\Program Files\\EMC\\Navisphere CLI>

方法五:通过 Navisphere图形界面查看 CX存储的序列号 右击存储,选择Properties,在弹出窗口General选项卡中的Serial Number一项

2.拔打 EMC 全球响应中心 800电话报修 ? 如用固定电话报修,请拔打 8008190009

? 如用手机报修, 请拔打4006700009 请依照语音提示进行报修

? 注意:必须事先准备好序列号,报修时需提供存储序列号( CX系列的序列号格式基本都

是 CK2000开头,后跟 8位数字),同时请提供具体的故障描述,如果部件故障,最好能提供故障部件的Part Number(PN),特别是硬盘的PN,以便于服务人员准确准备备件 四、EMC Clariion CX系列开关机注意事项及详细步骤 开机前注意事项:

1. 磁盘阵列在加电前,为确保磁盘柜散热和工作正常,请确认所有磁盘柜的每个槽位都已经插上硬盘和挡风板

2. 开机前需确保――SPE或 DPE至少要有一个正常工作的 SP,每个 DAE都至少要一块正常工作的 LCC

1. 检查所有供电线路联接是否正常,是否有松动或改动并改正 2. 从机柜顶部开始,由上至下打开所有 DAE磁盘机箱的电源。 3. 打开机柜最底部两个电池(SPS)(CX300可能只有一个)开关 4. 开机完成. 关机前注意事项:

1.警告: 请不要在关闭两个电池(SPS)的电源开关前,关闭 SPE,DPE,DAE等盘柜的任何一个电源,否则很可能会导致严重错误,并造成数据丢失! (CX300可能只有一个 SPS)

2. 即使关闭两个电池(SPS)的电源开关后,也需要等待 3分钟直到 CX存储写缓存中的数据完全写入硬盘,DAE OS磁盘柜指示灯熄灭后才可关闭 DAE,SPE或 DPE等盘柜的电源

3.停止所有对 CX磁盘阵列访问的应用,以便所有的 I/O能被从 SP的写缓存写回到前 5块盘上。 4.如果有 UNIX服务器连接在 CX磁盘阵列上,必须 umount UNIX服务器所有与 CX磁盘阵列相关的文件系统,Windows主机请关闭。 磁盘阵列关机步骤:

1. 关闭机柜最底部的两个电池开关并等待约 3分钟直到 CX存储写缓存中的数据完全写入到硬盘

上后,可看到电池的信号灯完全熄灭,且应看到因电池停止供电, SPE或 DPE机箱及 DAE-OS磁盘机箱的电源灯熄灭。

2. 由下至上,关闭所有 DAE磁盘机箱的开关(机柜内部的PDU) 3. 关闭机柜后面两侧机柜总开关 4. 关机完成.

五、 Clariion 主动性售后支持及 call-home的介绍 1. EMC Powerlink 网站介绍

客户注册登陆后,可免费获取许多 EMC相关的各类技术支持文档,界面和网址如下:

2.CLARiiON Proactive Support Call-home介绍 CALL-Home包括三项主要功能

a) 错误检测功能(需工程师安装软件在监控 PC上)

b) 报错功能:存储出错时,软件会自动拨出 (Dial out)或自动发送电子邮件 (Email out)到 EMC的全球技术支持中心

c) 远程诊断功能:EMC的全球技术支持中心收到“Dial out”或“Email out”或客户报修电话后,开始远程诊断

方法 1:通过客户提供的电话线路,远程拨入(Dial-in)

方法 2:通过客户提供给 PC管理工作站的 Internet access ,由客户上 WebEx网址申请,并允许 全球技术支持中心远程通过 WebEx IP连接访问 PC管理工作站(可选) 3. 客户开通 CLARiiON Proactive Support Call-home所需要提供的条件

a) 由客户提供管理工作站 PC –必须是英文版 Windows NT 4.0 SP 6A或 Windows 2000 SP 2以上版本,或Windows XP

b) 调制解调器 (ships with Clariion Systems)

c) 电话直线路 (不需打分机号码,由客户提供) – PBX extension或新设直通线路 d) 由 EMC工程师在管理工作站上安装 CLARAlert远程服务套件 – Navisphere Manager Event Monitor – Navisphere Host Agent / CLI – EMC远程主机及客户端 e) WebEx远程访问技术(可选,由客户提供 internet access给 PC管理工作站) – Minimum Windows Requirements – Windows 98 and higher

– Web Browser Support: Internet Explorer 5.x and 6, Mozilla 1.6, Netscape 4.7 4. CLARiiON Proactive Support 安全考虑事项

CLARalert软件套件安装在客户提供的工作站上。这样,CLARiiON Proactive Support 的安全级别不仅取决于 CLARalert的安全特性,而且也取决于您在应用程序、主机和网络级别实施的安全性

5.CLARalert 安全性

CLARalert具有强大的安全功能,并且在提供针对远程访问策略的选项方面也具有灵活性。您可以随时查看与远程访问活动相关的信息以进行审计。远程访问安全选项是由经授权的 EMC 人员代表客户设置的。这些选项包括:

a) 由客户指定的 EMCRemote 用户名和密码,这样它们就可以遵守您的与密码有关的策略 b) 拨入尝试通知,您可以对每次拨入请求进行批准/拒绝

c) 客户可以设定在 EMCRemote 发出身份验证失败消息之前可允许的重拨次数 d) 禁用 EMCRemote 远程访问功能的能力

e) 使用 EMCRemote 将所有登录和登录失败尝试记录到 CLARalert工作站上的一个文件中 f) 使用 Navisphere响应日志和消息文件以记录拨出尝试和错误代码文本

EMCRemote 是一种专用的客户端/服务器应用程序,服务器组件驻留在 CLARalert工作站上。这样,只有获授权的人员可以访问该客户端/服务器应用程序。客户端/服务器通信使用一种专有的按会话性质而设立的 40位算法加密。在拨入时,会在拨号器和客户端软件之间执行特定的“握手” 程序,此程序授权 EMC 客户服务人员连接到工作站上的 EMCRemote。

EMC 支持专家的系统和 CLARiiON Proactive Support 工作站之间的成功 “握手”是建立任何会话所必需的。“握手”过程中的协商是加密的,并且必须在协商成功后才能建立 PPP 会话。因此,利用疯狂拨号(war dial)技巧的潜在攻击者不可能仅凭发现并拨打电话号码而在工作站上建立会话

6. 介绍 Dial Out 的过程

a) 存储系统生成一个事件,此事件记录到系统的 Host Agent 或 SP Agent 的 navimon.log 文件中

b) Navisphere Event Monitor 中心监视器 Host Agent (事件监视器引擎)每隔2分钟轮询一次其配置文件中的每一个受监视的存储系统,并从每一个系统的 navimon.log文件中返回自上次轮询以来出现的新事件。每个系统的 navimon.log文件中的所有新事件接着将写入到中心监视器 Host Agent navimon.log 文件中。事件监视器逻辑根据 Dial Home筛选器模板文件配置决定是否触发 Dial Home。事件监视器生成一个 XML 格式的事件消息文件并将其放置到一个运行时目

中,排除外接电源问题,如果发现有部件故障指示灯亮,请不要自行插拔(硬盘也不可以),否则可能造成不可预知的故障,请即可拨打EMC全球服务热线报修

3. 我们想测试磁盘RAID的容错性,可以带电插拔硬盘么? 我们强烈建议不要这么做,RAID的容错性可以在系统的配置信息中确认,带电插拔硬盘有两个不利与您的因素

a) 当你拔出硬盘后,该硬盘所在的LUN会全部需要rebuild,这会降低您的磁盘读写性能 b) 磁盘属于机械设备,带电插拔,可能给磁盘带来潜在的或者不可预料的损害 如果一定要测试,建议由我们的工程师用命令行来执行磁盘离线测试 4. 忘记存储设备的管理IP该怎么办?

方法一、通过sniffer抓包程序,抓取来自控制器的以太网端口的TCP/IP信息,适用于所有机型 方法二、利用EMC服务专用端口,只适用于Clariion 3和4系列

CX 3和4系列有EMC服务专用端口,可以用默认的IP登陆,然后右击存储,选择属性,在弹出窗口的General选项卡中会出现两个SP的IP地址 注:左图中D端口即是EMC服务专用端口,但需要注意一点,如果您想连接SP A,请连接靠近SP B的服务端口,即两边的服务端口是错位的(容错考虑),其默认IP如下

SPA: 128.221.1.250 Subnet Mask 255.255.255.248

SPB: 128.221.1.251 Subnet Mask 255.255.255.248

方法三、利用Navisphere Storage System Initialization Wizard程序,会自动扫描到已经初始化过的存储,并显示IP配置信息 1. 忘记存储的帐号和口令怎么办?

2. 我们的工程师在存储安装时,会告诉您存储的管理信息,请妥善保存,如果您不幸忘记帐号口

令,请联系EMC ACCOUNT CE或EIC

6. 如何获取当前存储系统运行的flare版本 方法一、通过cli指令(红色字体) C:\\Program Files\\EMC\\Navisphere CLI>navicli -h 192.168.2.164 getagent Name: K10 Desc:

Node: A-CK200072300124 Physical Node: K10 Signature: 1912950 Peer Signature: 1912955 SCSI Id: 0

SP Identifier: A

Revision: 3.26.40.5.016 Model: CX3-40c Model Type: Rackmount Prom Rev: 3.58.00 SP Memory: 4096

Serial No: CK200072300124

Cabinet: SPE3 C:\\Program Files\\EMC\\Navisphere CLI>

方法二、登陆Navishpere,右击存储,查看存储属性,在弹出的窗口中选择software选项卡

3. 如何修改Clariiion存储的管理IP地址

风险提示:修改存储IP、网关等信息会导致控制器重启,有可能会造成控制器Panic等风险,甚至造成数据丢失,请谨慎评估影响,联系EMC全球服务热线确认 8.主机更换HBA卡,对存储有影响么?

主机更换HBA卡后,Clariion存储端需要将新HBA卡的WWPN注册,否则存储无法识别新的HBA卡,详细步骤,请登陆EMC PowerLink网站(http://powerlink.emc.com),下载最新的ClariionProcedure Generate程序,安装后生成相应文档操作

9. 浏览器无法通过IP访问存储 请按如下顺序排查故障 a) 看能否ping通控制器IP

b) 客户端是否安装了相应的JAVA程序,如果没有,请安装

c) 通过Navicli指令看能否获取控制器信息:Navicli –h sp_ip getagent, 正常应该会输出控制器版本等信息

d) 如果可以登陆,但非常慢,可能和您的客户端配置过低或者存储业务繁忙有关,请登陆EMC PowerLink网站下载Windows_UIs程序,这在一定程度上会解决访问存储过慢的情况

e) 如果问题还没有解决,请联系EMC全球服务中心

录中,ConnectEMC 服务将对它进行格式设置和处理,然后通过调制调解器发送到EMC。事件监视器在 response.txt 日志文件中记录此 Dial Home响应。

c) ConnectEMC 拨通调制解调器并启动 zmodem传输。XML 消息文件被传送到 EMC 技术支持中心前端处理器 (FEP)。在成功地将消息文件提交给 EMC 后,该文件的拷贝就存档在archive.txt 文件中,而且呼叫过程的步骤记录在 dialemc.log 文件中

d) SYR 报告系统从 FEP 接收消息文件,分析消息文件以应用产品和业务规则,并将有关数据保存到其数据存储区中

e) Clarify案例跟踪系统接收此消息文件,分析文件,应用业务规则,创建案例,并将案例放置到 CLARiiON Dial Home队列中 7. 介绍 Email Home 的过程

a) 存储系统生成一个事件,此事件记录到系统 Host Agent 或 SP Agent 的 navimon.log文件中 b) Navisphere Event Monitor 中心监视器 Host Agent(事件监视器引擎)每隔2分钟轮询一次其配置文件中的每一个受监视的存储系统,并从每一个系统的 navimon.log文件中返回自上次轮询以来出现的新事件。每个系统的 navimon.log文件中的所有新事件接着将写入到中心监视器 Host Agent navimon.log文件中。事件监视器逻辑根据 Dial Home筛选器模板文件配置决定是否生成发送到 EMC 总部的电子邮件。事件监视器生成一个 XML格式的事件消息文件,此文件写入到 Windows SMTP邮件程序或 Solaris Sendmail 守护程序。事件监视器在 response.txt 日志文件中记录此给总部发邮件响应

c) 取决于平台的电子邮件程序处理此事件消息邮件,并将此电子邮件转发到 SMTP网关服务器,此网关服务器将电子邮件发送到 EMC的电子邮件邮箱 emailalert@emc.com。然后将此电子邮件事件消息的一个拷贝存档到监视代理的消息目录日志中

d) EMC 电子邮件警报服务器处理传入的事件消息并将消息转发到 FEP

e) SYR 报告系统从 FEP接收消息文件,分析消息文件以应用产品和业务规则,并将有关数据保存到其数据存储区中

f) Clarify案例跟踪系统接收此消息文件,分析文件,应用业务规则,创建案例,并将案例放置到 CLARiiON Dial Home队列中 8. 介绍远程拨入访问过程

a) 从支持专家或客户工程师的 Windows 客户端系统启动 EMCRemote 客户端(也称为拨号器),也可以从 Clarify 呼叫跟踪系统启动拨号器

b) 调制解调器号码、登录和密码信息从数据库中检索出来并输入拨号器。如果拨号器是从未结案例中启动的,那么登录和密码信息将自动输入拨号器

c) EMCRemote 拨号器连接到调制解调器, EMCRemote 主机执行一次客户端加密(是一种因会话而异的 40位专有加密方法)握手例程,必须成功完成此例程才可以开始远程会话

d) EMC 支持人员可能会代表您在 EMCRemote 中做几项与安全性有关的选择,包括:在进行多少次拨入尝试后导致系统采取与不成功的拨入身份验证尝试有关的操作,以及密码的构成

e) 远程会话终止后, EMCRemote 主机将会话信息记录到 PWHOST.log文件中,EMCRemote 客户端(拨号器)将会话信息记录到 PWCLIENT.log 文件中 9. 介绍 Webex的访问过程

a) 以下由 EMC响应中心工程师做:

1.在浏览器中输入 Web地址-https://emcsupport2.webex.com 2. Click “Start support session” icon

3. Input user name and password to login

4. After you input the user name and password, you have started a Webex session and got its Session ID. You can tell the session ID to the on site engineer/customer, or you can send ID to them via Email (click “Send Email Invitation” button).

5. Once customer/on site engineer join the Webex session, they can share their Desktop to you and you can control the remote desktop through click “Request Control” button

Anytime you want to terminate the Webex session, please click “End Session”b) 以下由客户通过 Webex登陆后,并授权 EMC 支持中心访问 PC管理工作站: 1. 在IE地址栏中输入:https://emcsupport2.webex.com 2. 点击 “Join a support session” 图标

button.

3. 填入Support给予的Session ID以及其他信息 , 然后点击 “Submit”

4.当Support发出请求控制桌面时,会弹出如下对话框,建议打上选择框,然后点击OK” “

5.成功连接后,会看到桌面右下角有相关图标出现,此时移动鼠标,会提示被远程控制,可以点击鼠标左键,就可以重新控制鼠标

六、如何收集日志

1. 收集Clariion存储日志 1. 1利用CLI命令行收集

a) 进入Navisphere CLI 目录,对两个sp执行spcollect指令,执行成功后无任何提示 C:\\Program Files\\Emc\\Navisphere CLI>navicli -h spa_ip spcollect C:\\Program Files\\Emc\\Navisphere CLI>navicli -h spb_ip spcollect

b) 五分钟后执行命令(提醒:一定要等足够长的时间,因为SPcollect 生成的时间比较长) C:\\Program Files\\Emc\\Navisphere CLI>navicli -h spa_ip managefiles –list 注意查看最新

的zip文件是否生成,一般格式为:

CK200071800079_SPB_2008-12-26_20-25-27_1e330b_data.zip,也就是:序列号+SP名字+日期时间的zip文件,也有可能是: SP名字+序列号+日期时间的zip文件 c) 获取最新的zip 文件,执行命令

C:\\Program Files\\Emc\\Navisphere CLI>navicli -h spa_ip managefiles -retrieve -path d:\\splog -path 参数指定日志保存目录,默认在C:\\Documents and Settings\\Administrator(XP系统) -retriever参数指定要收取的文件,如果没有指定文件名,则会出现选择文件的提示,注

CK200071800079_SPB_2008-12-26_20-25-27_1e330b_data.zip前面对应的是10,则输入10,回车后确认后,会自动将文件存放到d:\\splog目录中

d) 用同样的方法收集另一个SP 的SPcollect 注:如果没有安装classic navicli或者存储端禁用了classic navicli(Clariion 4系列默认禁止了classic navicli模式),请使用secure naviseccli指令连接 C:\\ naviseccli –user xxx –password xxx –scope 0 -h spa_ip spcollect Xxx表示用户名和密码,除需要指定帐号和口令外,其余命令格式同classic navicli一样

1.2. 利用NST工具收集

点击Capture SPCollect图标,输入控制器SP的IP地址,根据提示下一步 1.3. Navishpere系统中spcollect(适用于Flare19 code以上,包含19) a) 打开IE 浏览器,在地址栏输入阵列IP 地址,输入用户名、密码

b) 在 Navisphere 界面右键单击“SP A”,点击“SP Collect”,在弹出的对话框中点击“OK”

c) 五分钟后在Navisphere 界面右击“SP A”,点击“File Transfer Manager”,弹出对话框, (注:在点击“File Transfer Manager”之前,要等待足够的时间,因为生成SPcollect 的时间会比较长。上一步点击“SP Collect” 弹出操作成功的对话框,这只是SP Collect 命令发送成功,而不是SP Collect 已经收集成功)

d) 在弹出的对话框中左侧选中最新的“zip”文件,点击对话框中右侧“Browse”按钮,选择文件输出位置,点击对话框中下侧“Transfer”按钮传送文件,在对话框右侧观察文件传送状态,如下

e) 按照同样的方法收集SP B 的SPcollect 1.4 使用CAP2工具 仅限于EMC服务人员 2. 收集交换机日志 EMC交换机分为三个系列:

B系列,M系列和MDS系列,不同系列收集日志的方法不一样 2.1 B系列(如DS-220B,DS-5000B,注:以B结尾)

a) 从 Start ′ Programs ′ Accessories ′ Communications ′ Hyperterminal打开超级终端程序

b) 创建一个新连接,选择Connection using modem to TCP/IP (Winsock),并输入交换机的IP并确认

c) 输入帐号和口令登陆交换机,然后从Transfer ′ Capture text ′ File C:\\supportshow.wri,选择捕获输出文字到文件c:\\supportshow.wri d) 运行指令 supportshow

e) 当指令执行完毕后,停止捕获文字Transfer ′ Capture text ′ Stop f) 完成后,输入指令quit退出登陆

2.2 MDS系列(如MDS-9120,MDS-9140,注:以MDS开头)

a) 从 Start ′ Programs ′ Accessories ′ Communications ′ Hyperterminal打开超级终端程序

b) 创建一个新连接,选择Connection using modem to TCP/IP (Winsock),输入交换机的IP并确认

c) 输入帐号和口令登陆交换机,然后从Transfer ′ Capture text ′ File C:\\supportshow.wri,选择捕获输出文字到文件c:\\supportshow.wri d) 运行指令 term len 0

show tech-support details

e) 当指令执行完毕后,停止捕获文字Transfer ′ Capture text ′ Stop f) 完成后,输入指令quit退出登陆

2.3 M系列(如DS-32M,DS-4700M,注:以M结尾) a) 通过浏览器登陆交换机

b) 选择Maintenance ′ Data Collection. c) 输入保存的文件名,并点击OK 3. 收集主机日志

EMC主机日志收集软件根据主机平台不同分为两类:unix平台和windows平台 Unix平台称为:emcgrab

请根据主机类型下载最新的emcgrab文件,然后通过ftp等协议传送到主机上,解包进入emcgrab目录,执行目录中的emcgrab.sh文件,一路回车,最后会在目录中outputs子目录中生成打包的日志文件,形如emcgrab_full_2008-06-30-07.15.54_aix_cdmid_prd_cc0000000000.tar 注:如果系统日志文件很大,请留意存放emcgrab文件所在磁盘的剩余空间

Windows平台称为:emcreports 请根据平台类型,选择合适版本,然后安装,生成的日志存放在安装目录COLLECTION子目录下

软件下载地址:ftp://ftp.emc.com/pub/emcgrab 七、常见故障处理

1. 存储开机后,SPE前面板故障指示灯亮 Clariion存储的启动需要一些时间,等控制器启动完毕后,因为会测试SPS电池的有效性,在SPS充放电的过程中,系统故障灯会亮,请等待两块电池充满电后再检查系统故障灯状态

2. 如果发现存储有部件显示故障指示灯,是否是部件松动,可以重新插拔么? 在系统工作过程

本文来源:https://www.bwwdw.com/article/5tfv.html

Top