HACMP5.4_for_AIX_5.3_测试报告

更新时间:2024-06-10 07:33:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

IBM HACMP5.4 for AIX 5L

测试报告

1. 测试概述 ................................................................................................................................................ 2

1.1. 测试目标 ..................................................................................................................................... 2 1.2. 测试环境 ..................................................................................................................................... 2

1.2.1. 拓扑结构 .......................................................................................................................... 3 1.2.2. 详细配置 .......................................................................................................................... 3

2. 测试过程 ................................................................................................................................................ 4

2.1. HACMP资源规划 ....................................................................................................................... 4

2.1.1. 网络规划 .......................................................................................................................... 4 2.1.2. 网卡分配表 ...................................................................................................................... 4 2.1.3. 共享卷组分配表 ............................................................................................................... 5 2.2. 操作系统安装及配置 ................................................................................................................... 5 2.3. HACMP软件安装及配置 ............................................................................................................ 5

2.3.1. HACMP的监视 ................................................................................................................ 5 2.4. 故障切换实验 .............................................................................................................................. 6

2.4.1. 模拟应用故障 ................................................................................................................... 6 2.4.2. 模拟网络故障 ................................................................................................................... 6

3. 结果验证 ................................................................................................................................................ 8 4. 结论 ....................................................................................................................................................... 9 5. 测试人签名 ............................................................................................................................................ 9

第 1 页 共 9 页

1. 测试概述

随着UNIX系统的发展和普及,关键性任务对主机的依赖程度也在逐渐减弱,越来越多的企业将他们的关键性任务应用从专有的主机系统迁移至基于UNIX平台上来。IBM公司的HAMCP for AIX软件是业界领先的,建立在UNIX平台上关键性任务计算环境的工具软件。HACMP for AIX软件能够保证关键性资源的高可用性。

1.1. 测试目标

本次测试是为了检验IMB HACMP for AIX软件保证资源高可用性的表现,本次试验运行的应用为oracle 10G具体的验证目标如下: 1 本次测试主要模拟以下故障:

? 应用故障时的切换

? 服务器掉电故障时的切换 ? 服务器硬件故障时的切换 ? 换切的里障故络网

2 考察在出现以上故障时,HACMP软件能否正常切换应用以及切换的效率。

1.2. 测试环境

本次测试环境为两台IBM P505服务器和一台IBM DS4400存储。两台服务器通过光纤连接到DS4400上。服务器上安装AIX5.3操作系统和HACMP5.4软件,两台服务器安装的系统版本跟HACMP版本一致。 DS4400上的5块阵列逻辑盘,做Raid 5阵列,划分成两个分区,一个分区做磁盘心跳,另一个分区安装oracle,oracle数据库在两台服务器上都可以启动。

第 2 页 共 9 页

1.2.1. 拓扑结构

Network 1 Network 2 en0 en1 en0 en1 Server 1 Diskhb( 磁 盘心跳) Server 2 IBM DS4400 图表 1 网络连接拓扑图

1.2.2. 详细配置

硬件平台 Server 1: IBM P505服务器,2核,2GB内存,1块SCSI 73GB硬盘 网络配制 hostname:p505_a boot1 ip: 192.168.68.13 boot2 ip: 172.168.1.13 server ip: 10.1.1.13 Server 1: IBM P505服务器,2核,2GB内存,1块SCSI 73GB硬盘 hostname:p505_b boot1 ip: 192.168.68.14 boot2 ip: 172.168.1.14 server ip: 10.1.1.14 AIX 5.3 ML06 HACMP 5.4 操作系统 AIX 5.3 ML06 应用软件 HACMP 5.4 表格 1 p505 硬件配置列表

第 3 页 共 9 页

2. 测试过程

本次测试按以下步骤来完成: ? 规划好整个测试环境的资源

? 安装AIX5.3操作系统,安装相应的补丁; ? 安装HACMP5.4软件跟oracle数据库; ? 配制HACMP;

? 设置各种模拟故障来测试HACMLP的切换与恢复;

2.1. HACMP资源规划

资源的规划是HACMP配制前要做的一件事,它占据了HACMP安装配制一半或一半以上的时间。这步工作是非常重要的。一个好的规划和设计可以避免很多不必要的故障的发生,也有利于综合的管理。HACMP的规划主要分为软件的规划、硬件的规划和资源组的规划。

2.1.1. 网络规划

网络规划分为IP网络和非IP网络,非IP网络用来做磁盘心跳,本次测试环境使用的心跳网络使用磁盘心跳。

网络名字

网络类型

网络地址 192.168.0.0

ethernet

Ether

172.16.0.0

diskhb

diskhb

N/A

255.255.0.0

N/A 网络掩码 255.255.0.0

表格 2 网络分配表

2.1.2. 网卡分配表

节点1:p505_a

接口名字 en0 en1 N/A

网卡标识 P5a_boot1 P5a_boot2 P5a_svc

网卡功能 Boot Standby Service

IP地址 192.168.68.13/16 172.16.1.13/16 10.1.1.13/16

网络类型 ether ether ether

网络名字 ethernet ethernet ethernet

表格 3 p505_a网卡分配表

第 4 页 共 9 页

节点2:p505_b

接口名字 en0 en1 N/A

网卡标识 P5b_boot1 P5b_boot2 P5b_svc

网卡功能 Boot Standby Service

IP地址 192.168.68.14/16 172.16.1.14/16 10.1.1.14/16

网络类型 ether ether ether

网络名字 ethernet ethernet ethernet

表格 4 p505_b网卡分配表

2.1.3. 共享卷组分配表

本次测试环境在光纤存储DS4400上共划分两个分区,在服务器上把这两个分区创建为卷组,其中一个卷组用来安装oracle数据库,另一个卷组用来做磁盘心跳,并注意做磁盘心跳的卷组一定要设置成并发卷组。

卷组名 data1vg diskhbvg 属性 Original concurrent 大小 10G 1G 应用 安装oraclle 10g 做磁盘心跳

表格 5 卷组分配表

2.2. 操作系统安装及配置

操作系统安装AIX5.3ML4升级补丁到ML06,这里不详细介绍,注意两台服务器的系统版本号和补丁包要完全一致,以使测试更加准确合理。

2.3. HACMP软件安装及配置

HACMP 的版本也要求两台服务器要一致,配制过程中要注意的就是需要准备oracle的启动与关闭脚本,双机环境至少需要一种心跳方式并且最好不要是网络心跳。安装配制的详细步骤请参考另一文档《HACMP5.4 for AIX 安装和配制》。

2.3.1. HACMP的监视

监视群集状态:

可以使用/usr/sbin/cluster/clstat来监视群集的状态。Clstat是监视单个或多个群集的工具,它依赖于clinfo进程。启动该进程可以监视以下状态:

第 5 页 共 9 页

? ? ? ? ? ?

群集的名称和ID 当前的时间和日期 群集的状态 每个节点的状态

每个网卡的IP标识和地址 网卡的状态

监视群集日志:

Cluster Manager的活动被记录在几个日志中,大多数可以用SMIT查看。以下是关于群集的日志:

/usr/adm/cluster.log主要是群集事件和错误的高层视图,可以很容易看出事件的发生顺序。此文件须定期清理。

/tmp/hacmp.out[1-7]记录事件脚本的详细输出,只保留七天的信息。此文件中也有可能包含应用程序的输出信息。

/usr/sbin/cluster/history/cluster.mmdd是群集的长期历史视图。

错误日志(error log):

记录Cluster Manager状态变化的信息,包括启动和停止。

2.4. 故障切换实验

HACMP将侦测并响应三种类型的故障:1 网卡故障,2 网络故障,3 节点故障。HACMP还支持应用级别的故障恢复,HACMP提供了用户对指定的应用进程的监控、恢复和故障切换功能。下面我们就对这几种故障进行测试,具体测试情况和结果如下:

2.4.1. 模拟应用故障

测试实例 1:停止双机服务

测试说明 测试步骤 停止时间 预期结果 实际结果 停止两台服务器的hacmp服务 1、两台服务器正常启动,hacmp服务和 oracle 应用正常启动,oracle,oracle运行在机器p505_a上; 2、使用smit clstop命令停止两台机的hacmp服务。 21s oracle 应用被停止。 成功

测试实例 2:启动双机服务

测试说明 测试步骤 启动两台服务器的hacmp服务 1、两台服务器正常启动,hacmp服务没有启动 2、使用smit clstart命令启动两台机的hacmp服务。 第 6 页 共 9 页

停止时间 预期结果 实际结果 76s Hacmp服务启动后,oracle 应用也启动。 成功

测试实例 3:重启服务器

测试说明 测试步骤 停止时间 预期结果 实际结果 重启运行oracle应用的服务器 1、两台服务器和oracle应用正常启动,oracle运行在p505_a服务器上 2、使用shutdown -Fr命令重启p505_a服务器 17s oracle 应用切换到 p505_b服务器 成功

测试实例 4:模拟服务器关机

测试说明 测试步骤 停止时间 预期结果 实际结果 关闭运行oracle应用的服务器 1、两台服务器和oracle应用正常启动,oracle运行在p505_a服务器上 2、使用shutdown –F 关闭p505_a服务器 15s oracle 应用切换到 p505_b服务器 成功

测试实例 5:oracle应用故障切换()

测试说明 测试步骤 停止时间 预期结果 实际结果 杀死oracle主进程ora_pmon(在hacmp配制时设置了对ora_pmon进程的监控) 1、两台服务器正常启动,hacmp服务和oracle应用正常启动,oracle应用在p505_a服务器上 2、使用kill –9 ora_pmon命令杀死oracle进程 30s oracle 应用切换到 p505_b 服务器 成功

测试实例 6:oracle应用回切

测试说明 测试步骤 停止时间 预期结果 实际结果 oracle应用回切到优先级别高的服务器 1、两台服务器正常启动,hacmp服务和oracle应用在p05_b服务器上启动,hacmp服务在 p505_a服务器上没有启动,oracle的优先节点为p505_a 2、使用clstart命令启动p505_a服务器上的hacmp服务 105s oracle 应用回切到 p505_a服务器 成功

第 7 页 共 9 页

2.4.2. 模拟网络故障

测试实例 7:网络故障(使用磁盘心跳)

测试说明 测试步骤 停止时间 预期结果 实际结果 断开机器两个网卡的网线 1、两台服务器正常启动,hacmp服务和oracle应用正常启动,oracle应用在p505_a服务器上 2、拔掉p505_a上两个网卡的网线 2m11s oracle 应用切到 p505_b服务器 成功

测试实例 8:网络故障(使用网络心跳)

测试说明 断开机器网卡的网线 1、把两台服务器的boot2网络设置为心跳网络 2、两台服务器正常启动,hacmp服务和oracle应用正常启动,oracle应用在p505_a服务器上 3、拔掉p505_a上boot1网卡的网线 停止时间 预期结果 实际结果 41s oracle 应用切到 p505_b服务器 成功 测试步骤

3. 结果验证

通过上面的测试我们可以发现在各种故障的发生后HACMP都能够比较快速的切换应用,保证了应 用的可用性。 测试步骤 故障实例1 故障实例2 故障实例3 故障实例4 故障实例5 故障实例6 故障实例7 故障实例8 成功 成功 成功 成功 成功 成功 成功 成功 结果 21s 76s 17s 15s 30s 105s 2m11s 41s 切换时间

第 8 页 共 9 页

4. 结论

AIX作为一个成熟的操作系统,具有很多先进的特征,在系统的稳定性和可靠性有很大的优点,能够承担关键的任务。HACMP与AIX的许多功能紧密结合,为用户提供更高的可用性。本次测试以IMB的p5服务器为平台来测试HACMP对应用高可靠性的保护。从测试结果中可以看到,对于各种常见的故障如应用故障、网络故障和存储故障HACMP都能够起到对应用的有效的保护,从而提高了关键应用的可靠性和安全性。

在本次测试中由于环境的限制心跳只采用了磁盘心跳的方式,应用的切换速率可能会相对于网络和串口心跳会慢好多(从测试实例7和测试实例8可以刊出)。所以在实际的生产环境中一般要求有两种心跳方式并且至少有一种为非IP网络的心跳来保证心跳的有效。

对于存储的故障可以通过编写events来监控切换,但一般建议在主机上采用两块以上的光纤存储连接卡,分别来连到不同的光纤连接线和不同的磁盘控制阵列控制器来实现对应用的保护。这样无论是硬盘还是光纤连接线的坏掉,所有好的数据还是可以被主机访问。

5. 测试人签名

? 测试时间: ? 测试地点: ? 测试人:

甲:

签名:

乙:

第 9 页 共 9 页

本文来源:https://www.bwwdw.com/article/njb6.html

Top