RoseHA 8.8 for Linux快速安装说明 - 图文

更新时间:2023-12-18 22:30:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

目录

一 安装前准备工作 ................................................................................................... 2

1 RoseHA集群的拓扑结构 .............................................................................. 2 2 安装前的注意事项 ........................................................................................ 3 二 软件的安装 ........................................................................................................ 6 三 卸载RoseHA软件.............................................................................................. 6 四 软件的配置 ........................................................................................................ 7

1 启动RoseHA的服务 .................................................................................... 7 2 设置RoseHA GUI的用户名和口令 .............................................................. 7 3 获取License ................................................................................................. 7 4 启动管理工具 ............................................................................................... 8 5 连接HA服务 ............................................................................................... 9 6 设置License ............................................................................................... 10 7 创建心跳 .................................................................................................... 12 8 获取网卡信息 ............................................................................................. 14 9 配置应用服务 ............................................................................................. 16 10 手动测试 .................................................................................................... 22 五 验证RoseHA的配置 ........................................................................................ 24

1 手工切换测试 ............................................................................................. 25 2 关机测试 .................................................................................................... 25 3 拔线测试(公网) ...................................................................................... 25 4 杀进程测试 ................................................................................................. 26

1

一 安装前准备工作

1 RoseHA集群的拓扑结构

RoseHA集群环境的拓扑结构,如下图所示。

如上图所示,硬件服务器A和B,1台磁盘阵列;在2台服务器上分别部署操作系统和应用服务,操作系统和应用服务按照相同的方式部署,并且应用服务的数据存放至磁盘整列(共享存储)。确认两台服务器上应用服务分别能够正常启动、停止、运行之后,再在两台服务器上部署RoseHA集群软件,以实现RoseHA保护应用服务连续工作。

每台服务器至少配置2片以上物理网卡,服务器之间推荐配置2条以上的直连心跳,具体的接入方式说明如下。

? 如每台服务器有3片以上的物理网卡:两台服务器之间,建议使用2条网线直连做冗余的心跳。如果物理网卡条件允许还可以再添加1条直连的RS232串

2

口心跳线,以上实现不同类型的心跳通信,提高心跳通信的可靠性。

? 如每台服务器仅有2片物理网卡:每台服务器之间,使用1条网线直连作为1条心跳;并且,需在添加1条直连的RS232串口心跳线,以实现冗余的直连心跳。

每台服务器的公网网线接入局域网中的网络交换机(如果物理条件允许,每台服务器公网接入不同的网络交换机,以防止单个网络交换机故障导致整个集群不可用)。

服务器1:网卡一地址设置:10.0.0.1 255.0.0.0(心跳线网卡)

网卡二地址设置:192.168.3.243 255.0.0.0(数据网卡,地址为外网地址)

主机名为:suse1

服务器2:网卡一地址设置:10.0.0.2 255.0.0.0(心跳线网卡)

网卡二地址设置:192.168.3.189 255.0.0.0(数据网卡,地址为外网地址)

主机名为:suse2 Active IP地址设置为:192.168.3.199

2 安装前注意事项

A. 在实施前,请先备份数据;以免出现异常情况,引起数据安全风险。 B. 确任两台主机、磁盘阵列的型号,操作系统的版本,应用程序的类型和版

本等信息,如果有卷管理软件,确认卷管理软件的类型和版本信息。确认两台主机网卡(网口)的数量、类型,RS232串口的数量。

C. 建议配置至少两条心跳线(Socket类型或是RS232类型,也可以混合使

用)。推荐配置是:两片网卡、一条RS232串口线。其中一片网卡用于配置公网,另外一片网卡和RS232串口线用于配置心跳线。每片网卡的IP地址需手工配置(不能是DHCP方式动态获取的IP),同一台主机上每片网卡的IP设置在不同网段。【RS232串口说明】关于RS232串口线的做法是:如果两端都是9pin的接头,则pin2(RD),pin3(TD)交叉反接,pin5(GND)直连,其它pin不连接:

3

DB9 2 RD 3 TD

---------DB9 ---------3 TD ---------2 RD

5 GND ---------5 GND

D. 在实际应用环境中,如果服务器所在的内网,没有要求服务器必须设置防

火墙等网络安全类软件,可以将防火墙关闭,并且设置其永不启动。如果启动操作系统自带的防火墙,请开放如下端口和网络通信权限: TCP:9000和10000 UDP:私有网心跳端口

ICMP:开放所有网络接口的ICMP(ping)数据包

E. 确保主机与磁盘阵列,网卡,RS232串行口的物理连接正确无误,且通信

正常。

F. 确保两台主机均能访问到相同的共享磁盘设备,注意有一些卷管理软件要

求同一个共享磁盘设备在两台主机上必须使用相同的设备名称。 G. 确认需要有RoseHA来监控管理的应用服务已经安装配置完成,并能够分

别在两台主机上独立正常启动和停止,客户端能够正常访问。RoseHA集群的默认模式下,应用服务不能配置为操作系统启动时自动启动。 H. 在配置的过程中,确保同时只能是一台主机挂载共享磁盘;切忌两台主机

同时挂载共享磁盘。

RoseHA集群软件,在切换资源时自动卸载、挂载共享磁盘;所以,不能将共享磁盘设置为自动挂载(不能存在“操作系统启动时自动挂载共享磁盘、其它应用程序自动挂载共享磁盘”等情况)。

在SUSE11操作系统平台上,操作系统默认配置为自动挂载共享磁盘设备;取消自动挂载共享磁盘的配置方式如下。

①在终端执行命令gconf-editor,将弹出如下窗口。点击菜单“编辑”-“查找”,在查找窗口中,勾选“在键名中搜索”和“在键值中搜索”,然后输入关键字“automount”,点击“查找”按钮。如下图所示。

4

②在查找结果中,选中“/apps/nautilus/preferences/media_automount”,

然后在该窗口右侧上方的位置,将“media_automount”和“media_automount_open”的键值勾选状态去掉。如下如图所示。

5

二 软件安装

A、RoseHA可以在Linux的各个发行版本上安装。本文档以SUSE11为例。将RoseHA安装介质CDROM放入主机光驱,然后使用Mount命令挂载CDROM,如:#mount /dev/cdrom/mnt然后进入到安装目录:#cd /mnt执行命令./install.sh进行RoseHA的安装(使用uninstall.sh进行反安装)。

B、RoseHA的所有文件均自动安装在目录:/opt/roseha下。RoseHA安装完成后的目录结构如下:

/opt/roseha/bin

在此目录

/opt/roseha/etc

目录

/opt/roseha/gui /opt/roseha/tmp

RoseHA的GUI管理工具文件存放在此目录 RoseHA的临时文件存放在此目录

RoseHA的配置文件和所有的日志文件均存放在此

RoseHA的所有可执行文件和启动、停止脚本均存放

C、设置RoseHA的HAHOME变量。正常情况下RoseHA安装完成后,会自动在/etc/bashrc的最后添加HAHOME环境变量,SUSE平台是在/etc/bashrc.local中加入HAHOME环境变量(若没有则需在目录/etc下的文件bashrc或profile中添加如下内容: HAHOME=/opt/roseha

export HAHOME 并使之生效)

三 卸载RoseHA软件

进入RoseHA的安装目录,运行uninstall.sh即可卸载RoseHA软件包。#./uninstall.sh

6

四 软件的配置

1 启动RoseHA的服务

RoseHA的后台核心进程一共有四个,第一个是监控进程:hamond,第二个是服务进程:hasvrd,第三个是共享盘监控进程:hachkd,第四个是系统盘监控进程:hasysd。在系统开机启动的时候,RoseHA的四个核心进程会自动启动。在安装完RoseHA软件包后,RoseHA的四个进程会自动启动,如果没有自动启动,可以通过如下命令启动:

#cd /opt/roseha/bin #./roseha start

这个脚本会自动将hamond、hasvrd、hachkd、hasysd启动起来。通过命令#ps –ef | grep ha确认hamond、hasvrd、hachkd、hasysd均已在运行中。

2 设置RoseHA GUI的用户名和口令

#cd /opt/roseha/bin #./NewPass

按照提示输入用户名和口令,这里输入的用户名和口令在启动RoseHA管理工具时候会被要求输入。以后可以再运行此命令来修改这里输入的口令。当忘掉用户口令时也可以通过SetPass更改现有用户的登录口令。只有系统的root用户才能执行这两个命令。

注:此用户名和密码与系统本身的账号密码无关。

3 获取License

#cd /opt/roseha/bin #./hostid

得到一个16位的HostID。将两台主机的HostID发给软件供应商,软件供应商将据此为用户提供RoseHA软件的License。

7

4 启动管理工具

A、GUI图形化管理工具,就可以通过以下步骤启动该管理工具:

#cd /opt/roseha/bin 或者 #cd /opt/roseha/gui #./gui.sh #./gui.sh

注:RoseHA的GUI管理工具是基于JAVA开发的,Shell文件gui.sh实际上是调用Java的JRE包来执行RoseHA的GUI管理配置工具,所以必须确保系统安装了JRE包,并且JRE的版本不能低于1.2。

B、RoseHA同时也提供了文本模式的管理工具,根据实际情况,用户可以选择使用。可以通过以下步骤启动该文本模式管理工具: #cd /opt/roseha/bin #./hacon

8

注意:对于同一台主机,只允许有一个管理工具(GUI模式或文本模式)连接到RoseHA的服务进程进行管理工作,本文档的配置和管理过程均以GUI管理工具示例。

5 连接HA服务

点击工具栏中的“Connect”的按钮,在弹出的窗口中输入之前创建的HA用户和密码:

9

点击“OK”登陆成功后,用户可以进行下一步配置操作。

6 设置License

点击“Tools”在弹出菜单中选择“License”,在弹出的窗口中输入正确的License和远程主机名。

10

export HAHOME SERVICENAME=$1 CHECKTIME=$2

while test \do

RETURN=0

mdax=`ps -ef | grep mDAXSave | grep -v grep | wc -l` if test $mdax -eq 1 then RETURN=0 else

RETURN=1

$HAHOME/bin/APIERROR.x $SERVICENAME CheckError fi

# Report the result to HA daemon

if test $CHECKTIME -eq 0 then

if test $RETURN -eq 0 then

exit 0 else

exit 1 fi fi

26

if test $RETURN -eq 0 then

$HAHOME/bin/APIOK.x $SERVICENAME fi

sleep $CHECKTIME continue done echo $0 exit

红色部分需要根据实际情况改写为自定义服务开启时的进程名(例如自定服务mDAXSave开启时的进程名为mDAXSave,自此处填写mDAXSave)。其余代码无需改动。

注意:启动 监控 停止脚本名不能与自定义服务的进程名相同(也就是ha_ag_**.sh、**_start.sh、**_stop.sh中的**处的填写不能与自定义服务的进程名相同)。

10 手动测试

服务配置完成后,在ROSEHA中带入服务之前,需要手动测试配置在RoseHA中的启动、停止及监控脚本。

10.1 修改启动/停止脚本文件

因为RoseHA使用启动脚/停止脚本去启动/停止HA中配置的服务,因此,启动/停止脚本必须编写正确。RoseHA提供缺省的启动/停止脚本文件,在使用之前,必须根据本地的实际情况分别修改两台主机的这些脚本文件。

例如:

#cd /opt/roseha/bin #vi tmp_start.sh #vi tmp_stop.sh

注意:确保脚本中使用到的设备名称、挂载点、应用的用户账号和启动命令

27

正确无误。

10.2 手动挂载活动IP和卷

? 确保另外一台主机没有试用活动IP地址和挂载共享卷后,在本机的公网网卡上手动挂在活动IP地址:

#ifconfig eth0:1 192.168.3.199 up

? 如果需要,手动挂载共享卷到指定的挂载点

如果RoseHA的管理工具中配置了共享卷资源,并且它不是裸设备,手动挂载共享卷到指定的挂载点上(若使用启动/停止脚本去处理共享卷资源,请跳过此步)。

10.3 测试启动/停止脚本文件

? 进入到目录/opt/roseha/bin,手工执行tmp_start.sh来启动应用服务:

#./<脚本文件名><参数一﹕test><参数二﹕该脚本文件对应的服务(在RoseHA中的JOB)名称>

如:

#cd /opt/roseha/bin #./tmp_start.sh test job

其中tmp_start.sh是启动脚本名称,第一个参数是“test”,第二个参数“job”是RoseHA中应用服务的名称,此处为job。

判断tmp_start.sh的执行是否正常,应用服务是否正常启动。如果发现脚本文件错误,请将它修改正确。

? 进入到目录/opt/roseha/bin,手动执行监控脚本,检查监控脚本是否工作正常,在执行监控脚本之前,请确保应用服务已经正常启动,然后执行监控脚本,格式如下:

#HAHOME=`cat/etc/init.d/HAHOME` #export HAHOME #./ha_ag_tmp.sh job 0 #echo $?

查看echo $?的输出值,如果应用服务启动时,执行监控脚本,输出值应该为

28

0;如果应用服务停止时,执行监控脚本,输出值应该为1。

如果应用服务启动时测试结果不等于“0”,那么就表明启动脚本或者监控脚本有问题,此时我们可以用一个调试参数来查看命令在哪个地方出错,从而找到出问题的地方,在执行启动脚本或监控脚本时,在脚本命令最前面加上“sh –x”,就表明执行脚本时,脚本会打印出每一步的执行结果,这样我们就可以找出脚本执行异常的地方。例如:

#sh –x tmp_start.sh test job #sh –x ha_ag_tmp.sh job 0

? 进入到目录/opt/roseha/bin,手工执行tmp_stop.sh来停止应用服务。命令格式同上:

#./tmp_stop.sh test job

判断tmp_stop.sh的执行是否正常,应用服务是否停止。如果发现问题,修改正确。

? 手工释放Active IP地址,执行:

#ifconfig eth0:1 192.168.3.199 down

? 手工卸载共享卷资源(若使用启动/停止脚本去处理共享卷资源,请跳过此步)。

在另外一台主机上重复10.1~10.3步骤。

注:在上述的手工测试中,对于发现脚本中的错误,比较有帮助。在实际操作中一定要特别小心仔细。两台主机分别都测试成功之后,在进行下一步操作。

五 验证RoseHA的配置

【重要说明】上述四节说明的RoseHA应用服务资源配置完成之后,仅代表应用服务资源的完成;在资源配置完成之后,还需要测试RoseHA的集群功能,待测试结果无误之后,RoseHA集群功能才能正式上线应用。

1 手工切换测试

? 选择应用Job,点击工具栏中“Bringin”按钮将服务带入,然后通过客户

29

端访问应用服务,验证应用服务能否正常使用。

? 选择应用Job,点击工具栏,选择“Failover”将应用服务切换至备机,然后再通过客户端访问应用服务,检验应用服务是否可以继续使用。

2 关机测试

? 关闭主机

当应用服务处于带入状态时,关闭活动主机,备机检测到主机关机,开始接管主机的应用服务资源,接管完成以后,通过客户端访问应用服务,验证应用服务能否正常使用。

? 关闭备机

当应用服务处于带入状态时,关闭备机,当备机关闭后,主机检查到备机故障,但应用服务不会切换。

3 拔线测试(公网)

在进行拔线测试时,该测试主要针对公网进行 ? 拨活动主机公网

当应用服务在活动主机运行时,拔掉活动主机的公网网线,RoseHA检测到公网故障,会主动将应用服务切换到备机。然后通过客户端访问应用服务,验证应用服务能否正常使用。

? 拔备机公网

当应用服务在活动主机上运行时,拔掉备机的公网网线,RoseHA检测到备机公网网卡故障,应用服务不会切换。

4 杀进程测试

当应用服务在活动主机上运行时,通过任务管理器查询到应用服务进程信息,然后结束应用服务的进程,此时RoseHA检测到应用服务异常,RoseHA主动将应用服务资源切换到备机或在当前主机上重启应用服务,通过客户端访问应用服务,验证应用服务能否正常使用。

30

本文来源:https://www.bwwdw.com/article/pl55.html

Top