aix系统管理指南

更新时间:2024-07-03 14:45:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

系统管理指南:操作系统与设备

比较不同机器上的文件系统

如果万一存在于不同机器上的文件系统是相同的,但您怀疑有一个系统已破坏,则可以比较文件系统。以下过程描述如何将驻留在您当前主机(在该方案中,称为 orig_host)上的文件系统的属性与远程主机上的相同文件系统的属性比较。 1. 以 root 用户身份登录到远程主机。例如: 2. tn juniper.mycompany.com 3. 4.

5. AIX V5

6. (C) Copyrights by IBM and by others 1982, 2002. 7. 登录:root 用户

root 用户的密码:

8. 使用您最喜欢的编辑器,编辑主机的 .rhosts 文件以添加允许 root 用户执行安全远程命令的节。对于新节,请使用以下格式:

orig_host root

产生的 .rhosts 文件可能看起来类似如下: NIM.mycompany.com root nim.mycompany.com root

host.othernetwork.com root orig_host.mycompany.com root

9. 保存更改并退出远程连接。

10.使用 orig_host 上的超级权限,用您最喜欢的编辑器创建另一个文件。对于该方案,新文件命名为 compareFS。例如: vi compareFS

11.在该文件中插入以下正文,其中 FSname 是您想要比较的文件系统的名称,remote_host 是比较文件系统所驻留的主机的名称: 12. FSname -> remote_host install -v ;

注:

在该文件的 install 命令行中,-v 参数与分号(;)之间必须有一个空格。 例如:

/home/jane/* -> juniper.mycompany.com install -v ;

13.保存文件并退出编辑器。对于以下步骤中的 rdist 命令,将 compareFS 文件用作 distfile。

14.在命令提示符处输入以下内容: /usr/bin/rdist -f compareFS

或者,如果期望从比较中获取大量的输出,则将输出发送到文件名。例如: /usr/bin/rdist -f compareFS > compareFS_output 输出列出了文件系统之间的任何差别。

配置工作负载管理器(WLM)以巩固工作负载

工作负载管理器(WLM)让您控制系统上的作业使用的资源。缺省 WLM 配置模板存在于每个安装的 AIX 操作系统上。以下过程更新 WLM 配置模板以在共享的服务器上实现资源管理策略。结果配置可以用作测试的开始点。您如何正确地配置 WLM 将取决于您所在环境的工作负载和策略的需求。 注:

1. WLM 的有效使用要求具有对现有系统进程和性能的广泛知识。您可以发展对工作负载运行良好的配置前,可能需要重复的测试和调整。如果用极值或错误的值配置 WLM,则会大大地降低系统性能。 2. 当已经知道进程的一个或多个分类属性(例如,用户、组或应用程序名称)时,配置 WLM 的进程更简单。如果不熟悉资源的当前使用,则使用诸如 topas 的工具来标识主资源用户的进程并将结果信息用作定义类和规则的开始点。

3. 以下情况假定您熟悉 《AIX 5L V5.3 系统管理概念:操作系统和设备》 中描述的基本“工作负载管理器”概念 。 WLM 配置文件存在于 /etc/wlm/ConfigurationName 目录中。每个超类的每个子类在名为 /etc/wlm/ConfigurationName/SuperClassName 的配置文件中定义。有关这些文件的更多信息,请参阅 AIX 5L Version 5.3 Files Reference。

在以下过程中,可以将工作负载从两个独立部门服务器合并到一个更大的服务器上。此示例编辑配置文件,但是您也可以使用 SMIT(使用 smit wlmconfig_create 快速路径)或“基于 Web 的系统管理器”(选择工作负载管理器容器,选择配置/类容器,然后从工作负载菜单选择新的配置)来创建配置。简单地说,您在此过程要执行以下操作:

1. 标识您想巩固的应用程序的资源需求。这将帮助您确定可以将多少应用程序移动到更大的服务器。

2. 定义等级以及资源共享和限制,以开始测试巩固的工作负载。 3. 微调配置,直至达到想要的结果。

已使用 AIX 5.2 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 步骤 1. 标识应用程序需求

在此情况下,工作负载是您可能在数据库服务器上看到的典型的内容。假定作业可分为以下几大类:

侦听器

这些是大多数时间睡眠并周期性唤醒以响应请求的进程。虽然这些进程不消耗许多资源,但是对响应时间的要求很高。 工作程序

这些是执行代表请求的工作的进程,无论该请求是本地还是远程的。这些进程可能使用许多 CPU 时间和内存。 报告者

这些是执行自动执行任务的进程。它们可能要求许多 CPU 时间或内存,但是可以容忍稍慢的响应时间。 监视器

这些是通常定期运行以验证系统或应用程序状态的进程。这些进程可能使用大量的资源,但只占用很短的时间。 命令

这些是系统用户可能在任何时间运行的命令或其它应用程序。它们的资源需求是不可预测的。 除了此工作之外,调度作业还属于以下类别之一:

SysTools

这些是执行自动执行任务的进程。这些作业对系统操作不是关键的,但是需要定期并在特定时间约束内运行。 SysBatch

这些是很少运行的进程,对系统操作不关键,并且不需要以及时的方式完成。

创建配置的第一步是定义类和规则。在以下步骤中,将使用以上列出的常规的作业类别来定义类。请使用以下过程:

1. 使用以下命令在名为 MyConfig 的 /etc/wlm 目录中建立一个新的配置: mkdir /etc/wlm/MyConfig

2. 使用以下命令将模板文件复制到 /etc/wlm/MyConfig 目录中: cp -pr /etc/wlm/template/* /etc/wlm/MyConfig

3. 要创建超类,请使用您喜欢的编辑器修改 /etc/wlm/MyConfig/classes 文件以包含以下内容: 4. System: 5.

6. Default: 7.

8. DeptA: 9.

10. DeptB: 11.

12. SysTools: 13.

14. SysBatch:

作为开始点,为每个部门定义一个超类(因为两个部门将共享服务器)。SysTool 和 SysBatch 超类将处理上述常规类别中描述的调度作业。System 和 Default 超类始终是已定义的。

15.在 MyConfig 目录中,为每个 DeptA 和 DeptB 超类创建一个目录。(创建配置时,必须为每个有子类的超类创建一个目录。)在以下步骤中,为每个部门的超类定义了五个子类(每个类别的工作一个)。 16.要为作业的每个常规类别创建子类,请编辑 /etc/wlm/MyConfig/DeptA/classes 和

/etc/wlm/MyConfig/DeptB/classes 文件以包含以下内容: 17. Listen: 18. 19. Work: 20. 21. Monitor: 22. 23. Report: 24. 25. Command:

注:

每个超类的 classes 文件内容可能不同。

确定了类以后,在以下步骤中创建用于对超类和子类级别的进程进行分类的分类规则。为了简单起见,假定所有应用程序从已知位置运行,来自一个部门的所有进程在 deptA UNIX 组下运行,并且来自其它部门的进程在 deptB UNIX 组下运行。

26.要创建超类分配规则,请修改 /etc/wlm/MyConfig/rules 文件以包含以下内容:

27. DeptA - - deptA - - 28. DeptB - - deptB - -

29. SysTools - root,bin - /usr/sbin/tools/* - 30. SysBatch - root,bin - /usr/sbin/batch/* - 31. System - root - - - Default - - - - - 注:

如果多于一个相同应用程序的实例可以运行并且所有分类属性(除了标签)是相同的,则使用 wlmassign 命令或 wlm_set_tag 子例程,通过将它们指定为不同的类在它们之间进行区分。

32.要创建更多特定子类规则,则通过以下内容创建

/etc/wlm/MyConfig/DeptA/rules 和 /etc/wlm/MyConfig/DeptB/rules 文件:

33. Listen - - - /opt/myapp/bin/listen* - 34. Work - - - /opt/myapp/bin/work* -

35. Monitor - - - /opt/bin/myapp/bin/monitor - 36. Report - - - /opt/bin/myapp/report* - Command - - - /opt/commands/* - 37.要确定每个类的资源消耗行为,则使用以下命令在被动方式中启动 WLM: wlmcntrl -p -d MyConfig

在被动方式中启动 WLM 后,首先可以单独运行每个应用程序以获取其资源需求的更好的透视图。然后可以同时运行所有应用程序以更好地确定所有类之间的交互作用。

标识应用程序资源需求的备用方法可能是首先在独立的服务器(您固定应用程序所在的服务器)上以被动方式运行 WLM。此步骤的缺点是您必须在更大的系统上重新创建配置,并且所需要的资源百分比可能与更大的系统上的不同。

步骤 2. 定义等级、共享和限制

WLM 配置是资源管理策略的实现。以被动方式运行 WLM 提供有助于您确定资源管理策略是否对给定的工作负载合理的信息。现在可以定义等级、共享和限制以基于资源管理策略调整您的工作负载。 对于此情况,假定您有以下需求:

System 类必须有最高的优先级并且要保证它始终能访问一部分系统资源。

? SysTools 类必须可以在所有时间访问特定百分比的资源,但是它对 DeptA 和 DeptB 中运行的应用程序并没有很多显著影响。 ? SysBatch 类不能干涉系统上的任何其它工作。

? DeptA 将接收可用资源(指类可用的共享资源)的 60%,而 DeptB 将接收 40%。在 DeptA 和 DeptB 中:

o Listen 类中的进程必须以很少的等待时间响应请求,但是不必消

耗许多资源。

o 必须允许 Work 类消耗大多数资源。Monitor 和 Command 类必须

消耗一些资源,但是比 Work 类少。 o Report 类不能干涉其它任何工作。

?

在以下过程中,定义等级、共享和限制:

1. 要创建超类等级,请使用您喜欢的编辑器修改

/etc/wlm/MyConfig/classes 文件以包含以下内容: 2. System: 3.

4. Default: 5.

6. DeptA:

7. localshm = yes adminuser = adminA 8. authuser = adminA 9. inheritance = yes 10.

11. DeptB:

12. localshm = yes adminuser = adminB 13. authuser = adminB 14. inheritance = yes 15.

16. SysTools:

17. localshm = yes 18. SysBatch:

19. tier = 1

localshm = yes

SysBatch 超类放在等级 1 中,因为此类包含非常低优先级的作业,您不想这些作业干涉系统上的其它工作。(未指定等级时,类缺省值为等级 0。)每个部门的超类的管理由 adminuser 和 authuser 属性定义。为 DeptA 和 DeptB 启用了继承属性。带继承的类中启动的所有新进程将在该类中保持分类。

20.要为每组作业创建子类等级,请修改 /etc/wlm/MyConfig/DeptA/classes 和

/etc/wlm/MyConfig/DeptB/classes 文件以包含以下内容: 21. Listen: 22. 23. Work: 24. 25. Monitor: 26. 27. Report:

28. tier = 1 29. Command:

30.要为超类指定初始的共享,请编辑 /etc/wlm/MyConfig/shares 文件以包含以下内容: 31. DeptA:

32. CPU = 3 33. memory = 3 34.

35. DeptB:

36. CPU = 2 memory = 2 因为指定了一个总共 5 个共享的 CPU,所以 DeptA 进程将访问总的 CPU 资源的五个共享中的三个(或 60%),而 DeptB 进程将访问五个中的两个(或 40%)。因为您没有对 SysTools、System 和 Default 类指定共享,所以它们的消耗目标将保持独立于活动的共享数量,这给了它们对于比 DeptA 和 DeptB 更高优先权的资源的访问权(直至到达其限制)。不对 SysBatch 类指定任何共享,因为它仅仅是等级 1 中的超类,因此任何共享指定都是不相关的。SysBatch 类中的作业仅仅可以消耗未被等级 0 中的所有类使用的资源。

37.要为子类指定初始的共享,请编辑 /etc/wlm/MyConfig/DeptA/shares 和 /etc/wlm/MyConfig/DeptB/shares 文件以包含以下内容: 38. Work:

39. CPU = 5 40. memory = 5 41.

42. Monitor:

43. CPU = 4 44. memory = 1 45. Command:

46. CPU = 1 memory = 1

因为没有对 Listen 类指定共享,则当它要求资源时,它对资源有最高优先权的访问权(在超类中)。对 Work 类指定了最大数量的共享,因为它有最大的资源需求。因此,基于其遵守的行为和相关的重要性,对 Monitor 和 Command 类指定了共享。不对 Report 类指定共享,因为它仅仅是等级 1 中的子类,因此任何共享指定都是不相关的。Report 类中的作业仅仅可以消耗未被等级 0 中的子类使用的资源。

在此示例的以下步骤中,对没有指定共享的类指定限制。(也可以对共享的类指定限制。有关更多信息,请参阅 《AIX 5L V5.3 系统管理概念:操作系统和设备》 中的 Managing Resources with WLM。)

47.要对超类指定限制,请编辑 /etc/wlm/MyConfig/limits 文件以包含以下内容: 48. Default:

49. CPU = 0%-10%;100% 50. memory = 0%-10%;100% 51.

52. SysTools:

53. CPU = 0%-10%;100% 54. memory = 0%-5%;100% 55.

56. System:

57. CPU = 5%-50%;100% memory = 5%-50%;100% 对 System、SysTools 和 Default 类指定了软件最大限制以阻止它们严重妨碍系统上的其它工作。对 System 类指定了对 CPU 和内存的最小限制,因为此类包含对系统操作的基本进程,并且它必须能够消耗保证的资源量。

58.要对子类指定限制,请编辑 /etc/wlm/MyConfig/DeptA/limits 和 /etc/wlm/MyConfig/DeptB/limits 文件以包含以下内容: 59. Listen:

60. CPU = 10%-30%;100% 61. memory = 10%-20%;100% 62.

63. Monitor:

64. CPU = 0%-30%;100%

memory = 0%-30%;100% 注:

每个子类文件的限制可以不同。

对 Listen 和 Monitor 类指定了软件最大限制以阻止它们严重妨碍同一超类中的其它子类。特别是如果 Work 类没有对处理请求的资源的访问权,则您不希望系统继续接受 Work 类中的作业请求。也对 Listen 类指定了最小限制以确保快速响应时间。内存的最小限制确保此类使用的页面将不被页面替换盗取,产生更快的执行时间。对 CPU 的最小限制确保当可以运行这些进程时,它们对 CPU 资源有最高优先权的访问权(在超类中)。

步骤 3. 微调配置

现在您已经完全定义了配置,将以活动方式运行 WLM 以开始调节工作负载并分析您的资源管理策略实施得如何。基于您的分析,可能需要微调配置以达到期望的结果。对于维护,如果工作负载随时间更改,则可能需要改进配置。 1. 要在活动的方式中启动 WLM,请使用以下命令: wlmcntrl -a

2. 使用诸如 wlmstat 的命令分析资源消耗。

3. 如果不符合对特殊类或应用程序的期望的消耗或性能目标,则可能需要调整 WLM 配置以更正该问题。有关准则,请参阅《AIX 5L V5.3 系统管理指南:操作系统与设备》中的『WLM 故障诊断准则』。

4. 如果更改了配置,则使用以下命令更新 WLM 的活动的配置: wlmcntrl -u

5. 分析资源消耗(步骤 2),并且如果有必要的话,再次微调配置。

将 JFS 复制到另一个物理卷

以下情况描述了在保持文件系统完整性的同时将 JFS 文件系统复制到不同的物理卷。

表 1. 考虑事项 要在并行的卷组环境中成功完成以下情况,必须在所有并行的节点上安装 AIX 4.3.2 或更新版本。 已使用 AIX 5.2 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 要在保持文件系统完整性的同时将 JFS 复制到另一个物理卷,请执行以下操作: 1. 停止想要复制的文件系统的活动。除非正在使用文件系统的应用程序是静

止的或者文件系统处于您已知的状态,否则您无法知道备份的数据中有什么内容。

2. 通过在命令行中输入以下 SMIT 快速路径来制作逻辑卷镜像: smit mklvcopy

3. 使用以下命令来复制文件系统:

chfs -a splitcopy=/backup -a copy=2 /testfs

-a 标志的 splitcopy 参数导致命令分割文件系统的镜像副本并将其以只读方式安装在新的安装点上。该操作提供了一份可用作备份的文件系统副本,且该文件系统的日志中记录的是一致的元数据。

4. 如果想将镜像的副本移到不同的安装点,请使用以下 SMIT 快速路径: smit cplv

此时,文件系统复制是可用的。

定义应用程序的原始逻辑卷

原始逻辑卷是物理和逻辑磁盘空间的区域,它在应用程序(例如数据库或分区)的直接控制下,而不是在操作系统或文件系统的直接控制下。绕过文件系统可以从控制应用程序,特别是从数据库应用程序产生更好的性能。然而,改进的程度取决于诸如数据库或应用程序的驱动程序的大小的因素。

注:

适当的时候,您将需要对新的原始逻辑卷提供带字符或块特殊设备文件的应用程序。应用程序试图进行打开、读、写等操作时,它将链接到此设备文件。

注意: 每个逻辑卷在第一个 512 字节中的都有一个逻辑卷控制块(LVCB)。数据从第二个 512 字节块开始。在原始逻辑卷中,LVCB 未受保护。如果应用程序覆盖 LVCB,则通常更新 LVCB 的命令将失败并生成一条消息。虽然逻辑卷可能继续正确操作并且覆盖可以是允许的事件,但是建议不要覆盖 LVCB。

以下说明使用 SMIT 和命令行界面定义原始逻辑卷。也可以使用“基于 Web 的系统管理器”中的创建新的逻辑卷向导(选择卷 → 概述和任务 → 创建新的逻辑卷)。要在向导中定义原始逻辑卷,请从其第一个选择屏幕中接受缺省使用,应用程序和数据。如果需要的话,联机帮助可用。

已使用 AIX 5.2 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 1. 使用 root 用户权限,通过输入以下 SMIT 快速路径以查找可以创建原始逻辑卷的可用物理分区: smit lspv

2. 选择磁盘。

3. 接受第二个对话框(状态)中的缺省值并单击“确定”。

4. 用 PP SIZE 字段中的值乘以 FREE PPs 字段中的值以获取可用于所选择的磁盘上的原始逻辑卷的兆字节总数。如果可用空间的数量不够,请选择不同的磁盘,直至您找到一个有足够可用空间的磁盘。 5. 退出 SMIT。

6. 使用 mklv 命令来创建原始逻辑卷。以下命令在使用 38 个 4 MB 物理分区的 db2vg 卷组中创建名为 lvdb2003 的原始逻辑卷: mklv -y lvdb2003 db2vg 38

使用 -y 标志为逻辑卷提供一个名称,则不再使用系统生成的名称。 此时,创建原始逻辑卷。如果列出卷组的内容,则显示原始逻辑卷的缺省类型,为 jfs。逻辑卷的类型项仅仅是个标号。它不指示为原始逻辑卷安装的文件系统。 有关如何打开 /dev/rawLVname 和如何使用此原始空间,请查阅应用程序的说明。

修正文件系统超块中毁坏的幻数

如果毁坏了文件系统的超块,则不能访问该文件系统。对超块的大多数毁坏都不能修复。以下过程描述了当问题由毁坏的幻数引起时,如何修复 JFS 文件系统

中的超块。如果毁坏了 JFS2 文件系统中的主超块,则使用 fsck 命令自动复制副超块并修复主超块。

在以下情况中,假定 /home/myfs 是物理卷 /dev/lv02 上的 JFS 文件系统。 已使用 AIX 5.2 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 1. 使用以下命令卸下您猜测可能遭到毁坏的 /home/myfs 文件系统: umount /home/myfs

2. 要确认对文件系统的毁坏,请对文件系统运行 fsck 命令。例如: fsck -p /dev/lv02

如果问题是对超块产生了毁坏,则 fsck 命令返回以下消息之一: fsck:不是 AIXV5 文件系统 或

不是识别的文件系统类型

3. 通过 root 用户权限,使用 od 命令显示文件系统的超块,如下例中所示: od -x -N 64 /dev/lv02 +0x1000

此处 -x 标志显示十六进制格式的输出而 -N 标志指示系统格式化偏移参数(+)中不多于 64 个的输入字节,这指定了文件中开始文件输出的点。以下是输出的示例:

0001000 1234 0234 0000 0000 0000 4000 0000 000a 0001010 0001 8000 1000 0000 2f6c 7633 0000 6c76 0001020 3300 0000 000a 0003 0100 0000 2f28 0383 0001030 0000 0001 0000 0200 0000 2000 0000 0000 0001040

在上述输出中,请注意 0x1000(1234 0234)处毁坏的幻值。如果创建文件系统时接受了所有缺省值,则幻数应该为 0x43218765。如果覆盖了任何缺省值,则幻数应该为 0x65872143。

4. 使用 od 命令来检查第二个超块的 magic number 是否正确。以下是示例命令及其输出:

5. $ od -x -N 64 /dev/lv02 +0x1f000

6. 7. 8. 9.

001f000 6587 2143 0000 0000 0000 4000 0000 000a 001f010 0001 8000 1000 0000 2f6c 7633 0000 6c76 001f020 3300 0000 000a 0003 0100 0000 2f28 0383 001f030 0000 0001 0000 0200 0000 2000 0000 0000 001f040

请注意 0x1f000 处的正确幻值。

10.将第二个超块复制到主超块。以下是示例命令和输出:

11. $ dd count=1 bs=4k skip=31 seek=1 if=/dev/lv02 of=/dev/lv02 12. dd: 1+0 records in. dd: 1+0 records out. 13.使用 fsck 命令来清除由使用第二个超块引起的不一致文件。例如: fsck /dev/lv02 2>&1 | tee /tmp/fsck.errs

制作安装的 JFS 或 JFS2 的联机备份

制作安装的日志文件系统(JFS)或增强的日志文件系统(JFS2)的联机备份创建包含该文件系统的逻辑卷的静态映象。以下过程描述了如何制作联机备份。您选择哪个过程取决于该文件系统是 JFS 还是 JFS2。

制作 JFS 的联机备份

要制作安装的 JFS 的联机备份,则必须制作文件系统驻留的逻辑卷及其日志驻留的逻辑卷的镜像。

注:

因为文件是异步写入的,所以分割的副本可能不包含分割前才写入的所有数据。备份副本中可能不提供分割开始后才开始的任何修改。因此,当分割发生时,推荐将文件系统的活动减少到最小。 已使用 AIX 5.2 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 要将 /home/xyz 文件系统的镜像的副本分割到名为 /jfsstaticcopy 的新安装点,请输入以下内容:

chfs -a splitcopy=/jfsstaticcopy /home/xyz

可以通过使用 copy 属性来控制将哪个镜像的副本用作备份。如果用户没有指定副本,则第二个镜像的副本是缺省值。例如:

chfs -a splitcopy=/jfsstaticcopy -a copy=1 /home/xyz

此时,/jfsstaticcopy 中提供文件系统的只读副本。分割副本后对原文件系统所做的任何更改都不反映在备份副本中。

要在 /testcopy 安装点上将 JFS 分割映象重新结合为镜像的副本,请使用以下命令:

rmfs /testcopy

rmfs 命令从其分割状态除去文件系统副本并允许它重新结合为镜像的副本。

制作和备份 JFS2 的快照

从 AIX 5.2 开始,可以制作安装的 JFS2 的快照,该 JFS2 在一个时间点建立文件系统的一致的块级别映象。即使用于创建快照(名为 snappedFS)的文件系统继续更改,快照映象也保持稳定。快照保持与制作快照时 snappedFS 所拥有的相同的安全性许可权。

在以下情况中,可以创建快照并将该快照备份到可移动介质而无需卸下或停顿文件系统,所有这些只需通过一个命令来执行:backsnap。也可以为了其它目的使用快照,例如访问制作快照时文件或目录存在状态下的文件或目录。可以使用“基于 Web 的系统管理器”、SMIT 或 backsnap 和 snapshot 命令来执行不同的快照过程。

要创建 /home/abc/test 文件系统的快照并将其备份(按名称)到磁带设备 /dev/rmt0,请使用以下命令:

backsnap -m /tmp/snapshot -s size=16M -i f/dev/rmt0 /home/abc/test 此命令创建 JFS2 文件系统(/home/abc/test)快照的 16 兆字节的逻辑卷。快照安装在 /tmp/snapshot 上,然后将按名称的快照备份制作到磁带设备上。备份完成后,快照仍是加载的。当备份完成时如果想除去快照,则将 -R 标志与 backsnap 命令一起使用。

当物理卷缺失时通知管理员

虽然物理卷变为不可访问时 AIX 会记录错误,但仍然有检测不到错误而让其继续存在的情况。例如,当物理卷是镜像卷组的一部分时,由于数据的完好副本仍然可访问,所以用户不会注意到由问题出现。在这种情况下,自动通知可以在用户注意到任何对其工作的破坏之前提醒管理员问题的出现。

以下过程描述当声明缺失物理卷时如何设置自动通知。通过修改以下过程,可以跟踪对您来说很重要的其它错误。

已使用 AIX 5.3 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 1. 使用超级权限,制作 /etc/objrepos/errnotify ODM 文件的备份副本。可以将备份副本命名为您选择的任何名称。在以下事例中,备份副本将 errnotify 文件名附加有当前日期: 2. cd /etc/objrepos

cp errnotify errnotifycurrent_date 3. 使用您最喜欢的编辑器创建名为 /tmp/pvmiss.add 的文件,该文件包含以下节: 4. 错误通告: 5. en_pid = 0 6. en_name = \7. en_persistenceflg = 1 8. en_label = \9. en_crcid = 0 10. en_type = \11. en_alertflg = \12. en_resource = \13. en_rtype = \14. en_rclass = \

en_method = \$9\在完成该文件中的所有步骤后,错误通知守护程序将使用来自通知消息中错误日志条目的详细信息自动扩展该脚本中的 $1 到 $9。

15.使用您最喜欢的编辑器创建名为 /usr/lib/ras/pvmiss.notify 的文件,该文件包含以下内容: 16. #!/bin/ksh

17. exec 3>/dev/console 18. print -u3 \

19. print -u3 - \20. print -u3 \21. print -u3 \

22. print -u3 \23. print -u3 \

24. print -u3 \25. print -u3 \26. print -u3 \27. print -u3 \28. print -u3 \29. print -u3 \

30. print -u3 \31. print -u3 \

32. print -u3 - \33. print -u3 \

34. mail - \35. ---------------------------------------------- 36. ALERT! ALERT! ALERT! ALERT! ALERT! ALERT! 37. Desc: PHYSICAL VOLUME IS MISSING. SEE ERRPT. 38. Error label: $9 39. Sequence number: $1 40. Error ID: $2 41. Error class: $3 42. Error type: $4 43. Resource name: $6 44. Resource type: $7 45. Resource class: $8

46. ---------------------------------------------- EOF 47.保存文件并退出编辑器。

48.在刚创建的文件上设置相应的权限。例如: chmod 755 /usr/lib/ras/pvmiss.notify

49.输入以下命令以将您在步骤 2 中创建的 LVM_SA_PVMISS 定义添加到 ODM: odmadd /tmp/pvmiss.add

在这一点上,只要出现 LVM_SA_PVMISS 错误,该系统就会运行

/usr/lib/ras/pvmiss.notify 脚本。这些脚本将消息发送到控制台,还会向 root 用户发送邮件。

重新创建毁坏的引导映象

以下过程描述了如何标识毁坏的引导映象并重新创建它。如果机器当前正在运行并且您知道引导映象已经毁坏或删除,则通过用 root 用户权限运行 bosboot 命令来重新创建引导映象。

注意: 在您怀疑引导映象已损坏时千万不要重新引导系统。

以下过程假定系统当前因为毁坏的引导映象而不正确重新引导。可能的话,将停机时间安排在对工作负载影响最小时,以保护系统免受可能的数据丢失或功能丧失。

已使用 AIX 5.2 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 1. 将产品介质插入合适的驱动器。

2. 按照随系统提供的说明进行操作开机。 3. 从“系统管理服务”菜单选择多引导。 4. 从下一个屏幕选择从...安装。

5. 选择装有产品介质的设备,然后选择安装。 6. 选择 AIX 版本图标。

7. 按联机说明进行操作,直至可以选择所使用的安装方式。此时,请选择启动系统恢复的维护方式。 8. 选择访问引导卷组。

9. 按联机说明进行操作,直至可以选择访问此卷组并启动 shell。 10.使用 bosboot 命令重新创建引导映象。例如: bosboot -a -d /dev/hdisk0

如果命令失败,您将收到下面的消息:

0301-165 bosboot:警告!bosboot 失败 ― 不要试图引导设备。 请尝试使用以下选项之一解决该问题然后再次运行 bosboot 命令,直至成功创建引导映象:

o

删除缺省引导逻辑卷(hd5),然后创建新的 hd5。

或者

o

在硬盘上运行诊断。必要的话,进行维修或更换。

如果 bosboot 命令继续失败,请联系您的客户支持代表。

注意: 如果创建引导映象时 bosboot 命令失败,则不要重新引导机器。 11.当 bosboot 命令成功时,请使用 reboot 命令来重新引导系统。

减少 Root 卷组中的文件系统大小

将所有文件系统的大小减少到最小的最简单方式是:从备份恢复基本操作系统时,将 SHRINK 选项设置为是。不能同时使用 SHRINK 选项和以下情况。如果在执行以下过程后将 SHRINK 选项设置为是,则安装将覆盖对 /image.data 文件的更改。

此情况引导您完成减少所选择的 rootvg 文件系统大小的整个手工过程。您将标识未使用分配的所有磁盘空间的文件系统,然后基于文件系统实际使用的空间量重新分配,因此释放了更多空间供 root 卷组使用。作为此过程的一部分,您将使用修正的分配备份卷组并重新安装操作系统。

注意: 此过程要求关闭并重新安装基本操作系统。无论何时重新安装任何操作系统,请计划停机时间,使其对您的工作负载影响最小,从而保护您避免可能丢失数据或功能。重新安装操作系统前,请确保有数据和任何定制的应用程序或卷组的可靠备份。 已使用 AIX 5.2 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 1. 创建不包含在 rootvg 中的所有文件系统的独立备份。独立备份帮助确保所有文件系统的完整性。 2. 使用 root 用户权限,通过输入以下命令检查 root 卷组中的哪些文件系统没有使用分配给它们的磁盘空间: df -k

-k 标志以千字节显示文件系统大小。结果看起来类似如下:

文件系统 1024 块 可用 已使用百分比 I 节点使用 I 节点使用百分比 安装位置

/dev/hd4 196608 4976 98% 1944 2% /

/dev/hd2 1769472 623988 65% 36984 9% /usr

/dev/hd9var 163840 65116 61% 676 2% /var

/dev/hd3 65536 63024 4% 115 1% /tmp

/dev/hd1 49152 8536 83% 832 7% /home

/proc - - - - - /proc

/dev/hd10opt 32768 26340 20% 293 4% /opt

查看这些结果,您会注意到有大量可用块并且与安装在 /usr 上的文件系统相关的使用的百分比相当低。您认为可以通过减少分配给 /usr 文件系统的分区数量释放大量的块。

3. 检查 /etc/filesystems 文件的内容以确保安装了 rootvg 中的所有文件系统。如果没有,它们将不包含在重新安装的系统中。

4. 通过输入以下命令创建 /image.data 文件,该文件列出包括在安装过程中的 rootvg 中的所有活动的文件系统: mkszfile

5. 在喜欢的编辑器中打开 /image.data 文件。

6. 搜索 usr 文本字符串以找到属于 /usr 文件系统的 lv_data 节。使用此节的数量作为基础来确定可以减少多少 /usr 文件系统的逻辑分区数量。在 /image.data 文件的 PP_SIZE 项中定义每个附加逻辑分区的缺省大小。/image.data 文件将看起来类似如下: 7. lv_data: 8. VOLUME_GROUP= rootvg 9. LV_SOURCE_DISK_LIST= hdisk0 10. LV_IDENTIFIER= 00042345d300bf15.5 11. LOGICAL_VOLUME= hd2 12. VG_STAT= active/complete 13. TYPE= jfs 14. MAX_LPS= 32512 15. COPIES= 1 16. LPs= 108 17. STALE_PPs= 0 18. INTER_POLICY= minimum 19. INTRA_POLICY= center 20. MOUNT_POINT= /usr 21. MIRROR_WRITE_CONSISTENCY= on/ACTIVE 22. LV_SEPARATE_PV= yes 23. PERMISSION= read/write 24. LV_STATE= opened/syncd 25. WRITE_VERIFY= off 26. PP_SIZE= 16 27. SCHED_POLICY= parallel 28. PP= 108 29. BB_POLICY= relocatable 30. RELOCATABLE= yes 31. UPPER_BOUND= 32 32. LABEL= /usr 33. MAPFILE= 34. LV_MIN_LPS= 70 35. STRIPE_WIDTH= STRIPE_SIZE= 分配给此逻辑卷的逻辑分区的数量是 108(LPs=108)。

36.通过使用来自步骤 2 的结果来确定 /usr 文件系统中的现有数据需要的逻辑分区的数量。可以通过使用以下命令显示特定于 /usr 文件系统的现有文件大小: df -k /usr

该结果重复了步骤 2 中接收到的 /usr 文件系统的数量(以千字节计)。例如:

文件系统 1024 块 可用 已使用百分比 I 节点使用 I 节点使用百分比 安装位置

/dev/hd2 1769472 623988 65% 36984 9% /usr

a. 从分配的 1024 块总数减去可用空间的数量:

1769472 - 623988 = 1145484

b. 添加预算空间,您可能需要这些空间以供预期此文件系统将来的任

何增长。对于此示例,将结果再加上 200000。

1145484 + 200000 = 1345484

c. 用以字节计(16*1024)的逻辑分区大小去除结果以确定所需的逻

辑分区的最少个数。

1345484 / 16384 = 82.121826171875

使用此向上舍入的结果来重新定义需要的逻辑分区的数量(LPs=83)。

37.在 image.data 文件中,将 LPs 字段从 108 更改为 83。

38.查找属于 /usr 文件系统的 fs_data 节。fs_data 节看起来类似如下: 39. fs_data: 40. FS_NAME= /usr 41. FS_SIZE= 3538944 42. FS_MIN_SIZE= 2290968 43. FS_LV= /dev/hd2 44. FS_FS= 4096 45. FS_NBPI= 4096 46. FS_COMPRESS= no 47. FS_BF= false 48. FS_AGSIZE= 8

49.通过将物理分区大小(PP_SIZE)乘以 2(物理分区使用的 512 字节块的数量)乘以逻辑分区数(LPs)来计算文件系统大小(FS_SIZE)。给出此示例中使用的值,计算结果为:

50. PP_SIZE * 512 块 * LPs = FS_SIZE 16384 * 2 * 83 = 2719744 51.在 image.data 文件中,将 FS_SIZE 字段从 3538944 更改为 2719744。 52.基于 /usr 文件系统使用的当前数据的实际大小计算最小文件系统大小(FS_MIN_SIZE),如下所述:

a. 计算需要的分区的最少数量。给出此示例中使用的值,计算结果为:

size_in_use(请参阅步骤 7a) / PP_SIZE = 分区数

1145484 / 16384 = 69.914794921875

b. 计算这些分区要求的最小大小。将先前的计算结果向上舍入为 70,

计算为: c. PP_SIZE * 512 块 * 分区数 = FS_MIN_SIZE

16384 * 2 * 70 = 2293760

53.在 image.data 文件中,将 FS_MIN_SIZE 字段从 2290968 更改为 2293760。

54.保存编辑并退出编辑器。

55.卸下不在 rootvg 卷组中的所有文件系统。

56.如果有任何用户定义的卷组,则输入以下命令断开并导出它们: 57. varyoffvg VGName exportvg VGName 58.在磁带机中有磁带时,输入以下命令以初始化完整的系统备份: mksysb /dev/rmt0

此类型的备份包含您在 /image.data 文件中指定的文件系统大小信息,以后用于以新文件系统大小重新安装系统。 注:

要开始此备份,必须从命令行运行 mksysb 命令。如果使用系统管理工具(例如 SMIT),则备份创建新的 image.data 文件,覆盖您所做的更改。 59.使用与当前系统设置一起安装选项,用此备份重新安装操作系统。在安装期间,检查是否适当设置了以下选项:

o 使用映射必须设置为否 o 缩小文件系统必须设置为否

如果需要有关安装过程的更多信息,请参阅 AIX 5L Version 5.2 Installation Guide。

60.安装操作系统后,请在“常规”方式中重新引导系统。此时,调整了 /usr 文件系统的大小,但是用户定义的文件系统不可用。 61.通过输入以下命令安装所有文件系统: mount all

如果接收到有关已经安装的文件系统的设备忙消息,则可以忽略这些消息。

此时,调整了 /usr 文件系统的大小,root 卷组有更多可用空间并且文件系统可用。

换镜像的卷组中有故障的物理卷

以下情况更换镜像的卷组中与物理卷相关的已有故障或正在发生故障的磁盘。在说明中,使用“配置管理器”来配置新磁盘(命名为 hdisk10),然后使用 replacepv 命令来替换镜像的卷组中的物理卷而不丢失物理卷的内容,这些物理卷至少有部分驻留在有故障的磁盘驱动器(命名为 hdisk02)上。不必重新引导或调度停机时间就可完成以下过程。

已使用 AIX 5.2 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 1. 选择一个新磁盘驱动器,该驱动器磁盘的容量至少与有故障的磁盘一样大。

2. 通过 root 用户权限,运行配置管理器以配置新磁盘。在命令行中输入以下内容: cfgmgr -l hdisk10

请使用 -l 标志来仅仅配置指定的设备和任何“子”设备。没有此标志的话,cfgmgr 命令对整个系统运行“配置管理器”。 3. 使用以下命令更换物理卷,从而可以开始使用新磁盘: 注:

如果逻辑卷的镜像是旧文件,则 replacepv 命令不正常工作。 replacepv hdisk02 hdisk10

4. 当相关的镜像的卷组是 rootvg 时,也必须运行以下命令以将有故障的磁盘从引导映象清除并将新磁盘添加到引导映象: 5. chpv -c hdisk02 6. bootlist hdisk10 bosboot -a chpv -c 命令从引导映象清除 hdisk02。bootlist 命令将 hdisk10 添加到可能的引导设备列表,系统可以从这些设备引导。bosboot -a 命令在缺省引导逻辑卷上创建完整的引导映象。

此时,物理卷 hdisk02 现在映射到最新配置的 hdisk10。

重新设置未知 Root 用户密码

以下过程描述当系统的 root 用户密码不可用或未知时如何恢复对 root 用户特权访问。以下过程要求一些系统停机时间。如果可能,将停机时间安排在对工作负载影响最小时,从而保护您避免可能的数据或功能丢失。

已使用 AIX 5.2 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 1. 将与当前安装相同的版本和级别的产品和介质插入到相应的驱动器中。 2. 打开机器电源。

3. 当出现图标的屏幕或听到两声蜂鸣声时,请不停地按 F1 键直到出现系统管理服务菜单。 4. 选择多个引导。 5. 选择安装自.

6. 选择装有产品介质的设备,然后选择安装。 7. 选择 AIX 版本图标。

8. 通过按下 F1 键然后按下 Enter 键将当前系统定义为系统控制台。 9. 选择首选语言的数字并按下 Enter 键。

10.通过输入 3 并按下 Enter 键选择用于系统恢复的启动维护方式。 11.选择访问引导卷组。显示一条消息,解释如果在该点更改根卷组而不重新引导,则您将不能返回到“安装” 菜单。 12.输入 0 并按下 Enter 键。

13.输入列表中相应卷组的数字,并按下 Enter 键。

14.通过输入 1 并按下 Enter 键选择访问该卷组并启动 shell。

15.在 #(数字符号)提示符处,在命令行提示符处输入 passwd 命令以重新设置 root 用户密码。例如: 16. # passwd

17. 为“root 用户”更改密码 18. root 用户 的新密码: 再次输入新密码:

19.要将所有内容从缓冲区写入硬盘并重新引导系统,请输入以下内容: sync;sync;sync;reboot

当出现登录屏幕时,则您在步骤 15 中设置的密码此时应该允许访问 root 用户特权。

恢复对取消链接获删除的系统库的访问

当现有的 libc.a 库不可用时,则大多数操作系统命令没有识别。出现该类型问题的最可能的原因如下:

/usr/lib 中的链接不再存在。 ? /usr/ccs/lib 中的文件已删除。

?

以下过程描述了如何恢复对 libc.a 库的访问。该过程要求系统停机时间。如果可能,将停机时间安排在对工作负载影响最小时,从而保护您避免可能的数据或功能丢失。

已使用 AIX 5.3 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 恢复删除的符号链接

使用以下过程恢复从 /usr/lib/libc.a 库到 /usr/ccs/lib/libc.a 路径的符号链接:

1. 使用超级权限,通过输入以下命令设置 LIBPATH 环境变量以指向 /usr/ccs/lib 目录:

2. # LIBPATH=/usr/ccs/lib:/usr/lib # 导出 LIBPATH 在这一点上,您应该能够执行系统命令。

3. 要恢复从 /usr/lib/libc.a 库和 /lib 目录到 /usr/lib 目录的链接,请输入以下命令:

4. ln -s /usr/ccs/lib/libc.a /usr/lib/libc.a ln -s /usr/lib /lib 此时,命令的运行方式与前面相同。如果仍然不具有对 shell 的访问权,请跳过该程序的其余部分并继续下一部分恢复删除的系统库文件。 5. 输入以下命令以取消设置 LIBPATH 环境变量。

取消设置 LIBPATH

恢复删除的系统库文件

以下用于恢复删除的系统库的过程要求系统停机时间。引导系统,然后从最新的 mksysb 磁带恢复库。

1. 在重新引导前,请确保 bosinst.data 文件中的 PROMPT 字段设置为是。 2. 将最新的 mksysb 磁带插入到磁带机中。 mksysb 必须包含与已安装的系统相同的 OS 和维护级别。如果从与已安装系统上的级别冲突的 mksysb 恢复 libc.a 库,则您将不能发出命令。 3. 重新引导机器。

4. 当出现图标的屏幕或听到两声蜂鸣声时,请不停地按 F1 键直到出现系统管理服务菜单。 5. 选择多个引导。 6. 选择安装自.

7. 选择装有 mksysb 的磁带设备,然后选择安装。可能要花费几分钟才会出现下一个提示符。

8. 通过按下 F1 键来将您的当前系统定义为系统控制台并按下 Enter 键。 9. 选择首选语言的数字并按下 Enter 键。

10.通过输入 3 并按下 Enter 键选择用于系统恢复的启动维护方式。 11.选择访问引导卷组。显示一条消息,解释如果在该点更改根卷组而不重新引导,则您将不能返回到“安装” 菜单。 12.输入 0 并按下 Enter 键。

13.输入列表中相应卷组的数字,并按下 Enter 键。 14.通过输入 2 选择访问该卷组,然后按下 Enter 键。

15.通过输入以下命令加载 /(root 用户)和 /usr 文件系统: 16. mount /dev/hd4 /mnt

17. mount /dev/hd2 /mnt/usr cd /mnt 18.要为 libc.a 库恢复符号链接,则如果需要,请输入以下命令: ln -s /usr/ccs/lib/libc.a /mnt/usr/lib/libc.a 在命令运行后,请执行以下操作步骤之一:

如果该命令成功,请跳至步骤20。

o 如果有消息显示该链接已经存在,请继续步骤17。

19.通过发出以下命令设置磁带机的块大小,其中,X 是相应的磁带机的数字。 20. tctl -f /dev/rmtX rewind 21. tctl -f /dev/rmtX.1 fsf 1

22. restbyname -xvqf /dev/rmtX.1 ./tapeblksz cat tapeblksz

o

如果 cat tapeblksz 命令的值不等于 512,请输入以下命令,将 Y 替换为 cat tapeblksz 命令的值:

ln -sf /mnt/usr/lib/methods /etc/methods

/etc/methods/chgdevn -l rmtX -a block_size=Y 应该收到 rmtX 已更改的消息。

23.通过输入以下命令(其中,X 是相应的磁带机的数字)确保磁带在可用于恢复库的正确位置:

24. tctl -f /dev/rmtX rewind tctl -f /dev/rmtX.1 fsf 3 25.使用以下命令(其中 X 是相应的磁带机的号码)之一以恢复缺失的库:

o 要只恢复 libc.a 库,请输入以下命令:library only,

restbyname -xvqf /dev/rmtX.1 ./usr/ccs/lib/libc.a

o

要恢复 /usr/ccs/lib 目录,请输入以下命令: restbyname -xvqf /dev/rmtX.1 ./usr/ccs/lib

o

要恢复 /usr/ccs/bin 目录,请输入以下命令: restbyname -xvqf /dev/rmtX.1 ./usr/ccs/bin

26.通过输入以下命令,将数据清空到磁盘: 27. cd /mnt/usr/sbin ./sync;./sync;./sync

28.通过输入以下命令卸下 /usr 和 /(root 用户)文件系统: 29. cd /

30. umount /dev/hd2 umount /dev/hd4

如果任何一个 umount 命令失败,请循环加电该机器并再次开始该过程。 31.通过输入以下命令重新引导该系统: reboot

重新引导该系统后,操作雄鹰该市可用的。

从卷组分割镜像的磁盘

从 AIX 5.2 开始,快照支持帮助您保护镜像的卷组的一致性,以避免因可能的磁盘故障导致的损害。使用快照功能,可以分割镜像的一个或多个磁盘以将其用作可靠的(从 LVM 元数据的立场)卷组的即时备份,并且需要的话,可靠地将分割磁盘重新结合到卷组中。在以下过程中,首先从卷组分割镜像的磁盘,然后将分割的磁盘合并到原卷组中。要进一步确保快照的可靠性,必须将文件系统卸下而且必须让使用原始逻辑卷的应用程序处于已知状态(如果需要使用备份,应用程序可从该状态恢复)。

如果满足了以下任何一个条件,则不能分割卷组:

磁盘已经丢失。

? 最新的非文件旧分区将在分割卷组上。

? 任何旧文件分区存在于卷组中,除非您将强制标志(-f)与 splitvg 命令一起使用。

?

此外,快照功能(特别是 splitvg 命令)不能用于增强的或经典的并行方式。分割的卷组不能成为并行或增强的并行,并且对分割的和原卷组允许的更改有一些限制。有关详细信息,请阅读《AIX 5L V5.3 命令参考大全》中的 chvg 命令描述。

已使用 AIX 5.2 测试了本入门书的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 1. 确保已经完全制作卷组镜像并且镜像存在于仅包含此镜像集的单个磁盘或一套磁盘中。

2. 要启用快照支持,请使用以下命令将原卷组(origVG)分割到另一个磁盘或另一套磁盘中: splitvg origVG

此时,您现在有原卷组的可靠的即时备份。然而,要明白,您不能更改分割的卷组上的分配。

3. 使用以下命令重新激活分割的磁盘并将其合并到原卷组中: joinvg origVG

此时,分割的卷组现在与原卷组重新结合。

更改缺省浏览器

要考虑的事情

已使用 AIX 5.3 测试了本入门书中的该信息。如果您正在使用不同版本或级别的 AIX,您获得的结果可能就会发生显著的改变。 此过程更改应用程序(这些应用程序使用 defaultbrowser 命令来打开浏览器窗口)使用的缺省浏览器。缺省浏览器是在用户使用 infocenter 命令时启动的浏览器。本方案描述了如何使用 SMIT 更改缺省浏览器。您也可以使用基于 Web 的系统管理器更改缺省浏览器。 1. 更改为 root 用户。 2. 在命令行中输入:

smit change_documentation_services

3. 在 DEFAULT_BROWSER 字段内,输入该命令启动新的 Web 浏览器。当命令中包含 URL 时,则包含所需要的任何标志。例如,如果输入: anybrowser -u http://www.ibm.com

在任何浏览器内打开 www.ibm.com web 地址,您就要在该字段内输入 anybrowser -u。许多浏览器(例如 Mozilla Web 浏览器)不需要标志。浏览器的更改在您下次登录计算机时生效。

启动和停止系统

本章论及系统启动活动,如引导、创建引导映象或文件以启动系统以及设置系统运行级别。还包括使用 reboot 和 shutdown 命令。 本章中包括以下主题:

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

引导未安装的系统 重新引导运行中的系统

远程重新引导未响应的系统 从硬盘引导以进行维护 引导崩溃的系统 访问不能引导的系统

使用平面图形重新引导系统 诊断引导问题 创建引导映象 确定系统运行级别 更改系统运行级别 运行级别脚本执行

更改 /etc/inittab 文件 停止系统

不必重新引导而关闭系统 将系统关闭为单用户方式

在紧急情况下关闭系统 ? 重新激活不活动的系统 ? 系统挂起管理

?

引导未安装的系统

引导新的或未安装的系统的过程是安装过程的一部分。 有关如何引导未安装的系统的信息,请参阅《AIX 5L V5.3 安装指南与参考大全》中的『启动系统』。

重新引导运行中的系统

有两种方法关闭和重新引导系统,shutdown 和 reboot。当多个用户登录到系统上时,请始终使用 shutdown 方法。因为多个进程可能正在运行,应该采用比 reboot 更合理的方式终止它们,shutdown 对于所有系统而言都是首选的方法。 重新引导运行中的系统任务 基于 Web 的系统管理器 - 或 - wsm,然后选择系统 任务 重新引导多用户系统 重新引导单用户系统 SMIT 快速路径 smit shutdown smit shutdown 命令或文件 shutdown -r shutdown -r 或 reboot 远程重新引导未响应的系统

远程重新引导设备允许系统通过本地(集成)串口重新引导。当在端口接收reboot_string时,系统重新引导。当系统不作出另外的响应但能够为串口中断提供服务时,此设备有用。远程重新引导只能同时在一个本地串口上启用。希望用户为端口提供自己的外部安全性。此设备以最高的设备中断级别运行,并且,如果快速清除发送缓冲区的 UART(通用异步接收/发送)失败,则可能导致在此期间缓冲区溢出的其它设备丢失数据。建议此设备只用于重新引导因其它原因而挂起且不能远程登录到的机器。文件系统将不同步,并且未经刷新的数据可能存在某种程度的丢失。当启用远程重新引导时,强烈建议不要将端口作任何其它用途(尤其是文件传送)以防止不经意的重新引导。 两个本地串口属性控制远程重新引导的操作。

reboot_enable

表示是否启用此端口以在接收远程 reboot_string 时重新引导机器,如果是这样,是否在重新引导之前进行系统转储。

no ― 表示禁用了远程重新引导 reboot ― 表示启用了远程重新引导

dump ― 表示启用了远程重新引导,并且将在重新引导之前, 在主转储设备上进行系统转储

reboot_string

指定当启用远程重新引导功能时,串口将扫描的远程 reboot_string。当启用远程重新引导功能并在端口上接收到 reboot_string 时,则传送“>”字符,并且系统准备重新引导。如果接收到“1”字符,则系统重新引导;任何“1”以外的字符都会使重新引导过程异常终止。reboot_string 的最大长度是 16 个字符,并且绝不能包含空格、冒号、等号、空、换行或 Ctrl-\\ 字符。

远程重新引导可以通过 SMIT 或命令行启用。对于 SMIT,路径系统环境 -> 管理远程重新引导设备可能用于配置的 TTY。另外,当配置新的 TTY 时,可以从添加 TTY 或更改/显示 TTY 的特征菜单启用远程重新引导。通过路径设备 -> TTY 访问这些菜单。

在命令行中,mkdev 或 chdev 命令用于启用远程重新引导。例如,以下命令启用远程重新引导(使用 dump 选项)并在 tty1 上将重新引导字符串设置为 ReBoOtMe。

chdev -l tty1 -a remreboot=dump -a reboot_string=ReBoOtMe

此示例只使用数据库中的当前 reboot_string 在 tty0 上启用远程重新引导(将在下一次重新引导时生效)。 chdev -P -l tty0 -a remreboot=reboot

如果 tty 正用作正常端口,则在启用远程重新引导之前,将必须使用 pdisable 命令。然后可以使用 penable 来重新启用端口。

从硬盘引导以进行维护

先决条件

驱动器中不能有可引导的移动式介质(磁带或 CD-ROM)。也请参考硬件文档获取特定说明以在特殊机型上启用维护方式引导。

过程

要从硬盘引导处于维护方式中的机器:

1. 要重新引导,请关闭机器然后再打开电源,或者按下复位按钮。

2. 按下以维护方式进行重启的键序列,这个序列是在硬件文档中指定的。 3. 机器将引导到配置控制台设备的位置。如果有需要检索的系统转储,则控制台上将显示系统转储菜单。 注:

a. 如果检索转储时控制台配置失败,则系统将挂起。必须从可移动介

质引导系统以检索转储。

b. 从 AIX 5.3 中开始,当按复位按钮时,系统将会自动转储至指定

的转储设备。有关系统如何转储的更多信息,请参阅 AIX 5L Version 5.3 Kernel Extensions and Device Support Programming Concepts 中的『开始系统转储』。要在运行的系统中更改主转储设备或辅助转储设备的指定,请参阅 sysdumpdev《AIX 5L V5.3 命令参考大全,卷 5》。

4. 如果没有系统转储,或者已经将其复制,将显示诊断操作说明。按下 Enter 键以继续“功能选择”菜单。

5. 可以从“功能选择”菜单选择诊断或单用户方式:

单用户方式:要在单用户环境中执行维护,请选择此选项(选项 5)。系统继续引导并进入单用户方式。可以在此方式中进行要求系统处于单机方式中的维护,如果需要,可以运行 bosboot 命令。

引导崩溃的系统

在一些实例中,可能必须引导没有正确关闭而停止的(崩溃的)系统。此过程包括了如果在崩溃后系统无法恢复时该如何引导的基础知识。

先决条件

1. 系统由于不正常情况崩溃并且不正确关闭。 2. 系统关闭。

过程

1. 确保正确连接了所有硬件和外围设备。 2. 打开所有外围设备。

3. 观看屏幕获取有关自动硬件诊断的信息。

o 如果任何硬件诊断测试不成功,请参考硬件文档。 o 如果所有硬件诊断测试都成功,请打开系统部件。

访问不能引导的系统

如果系统不能从硬盘引导,则参阅《AIX 5L V5.3 安装指南与参考大全》的『故障诊断』中有关如何访问不能引导的系统的过程。

此过程使您能够获取系统提示,因此您可以尝试从系统恢复数据或执行矫正操作使系统能够从硬盘引导。 注:

1. 此过程仅打算供有经验的系统管理员使用,这些系统管理员知道如

何从不能从硬盘引导的系统引导或恢复数据。大多数用户不应该尝试此过程,但是应该联系他们的服务代表。

2. 此过程不打算供刚完成一次新安装的系统管理员使用,因为在此情

况下系统不包含需要恢复的数据。如果完成新的安装后不能从硬盘引导,则联系您的服务代表。

使用平面图形重新引导系统

如果已经只使用平面图形子系统安装了机器,并且稍后将其它的图形适配器添加到系统,则发生以下情况:

1. 新的图形适配器添加到系统,并且安装了其关联的设备驱动程序软件。 2. 重新引导了系统,发生以下情况之一:

a. 如果系统控制台定义为 /dev/lft0(lscons 显示此信息),则请

求用户选择在重新引导时哪一个显示器是系统控制台。如果用户选择图形适配器(非 TTY 设备),则它也可成为新的缺省显示器。如果用户选择 TTY 设备(而非 LFT 设备),则不出现系统登录。再次重新引导,显示 TTY 登录屏幕。假定如果用户将其它的图形适配器添加到系统,并且系统控制台是 LFT 设备,则用户将不选择 TTY 设备作为系统控制台。 b. 如果系统控制台定义为 TTY,则重新引导时新添加的显示适配器变

为缺省显示器。

注:由于 TTY 是系统控制台,所以它依旧是系统控制台。

3. 如果系统控制台是 /def/lft0,则重新引导后,为了在屏幕上一直显示系统控制台选项文本,会禁用 DPMS。要重新启用 DPMS,请再次重新引导系统。

诊断引导问题

多种因素可以导致系统不能引导:

? ? ? ? ?

硬件问题

有缺陷的引导磁带或 CD-ROM 不正确配置的网络引导服务器 已毁坏的文件系统

脚本(例如 /sbin/rc.boot)中的错误

有关访问不能从磁盘驱动器引导的系统的信息,请参阅访问不能引导的系统。

创建引导映象

要安装基本操作系统或访问将不从系统硬盘驱动器引导的系统,需要一个引导映象。此过程描述了如何创建引导映象。引导映象根据每种类型的设备而不同。相关的 RAM 磁盘文件系统包含以下设备的设备配置例程: 磁盘 ? 磁带 ? CD-ROM

? 网络令牌环、以太网或 FDDI 设备

?

先决条件

必须有 root 用户权限以使用 bosboot 命令。 ? /tmp 文件系统必须至少有 20 MB 可用空间。 ? 物理磁盘必须包含引导逻辑卷。要确定指定哪个磁盘设备,请在命令提示符下输入以下内容:

?

lsvg -l rootvg

lsvg -l 命令列出了 root 卷组(rootvg)上的逻辑卷。您可以从此列表上查找引导逻辑卷的名称。然后在命令提示符下输入以下内容: lsvg -M rootvg

lsvg -M 命令列出了包含不同逻辑卷的物理磁盘。

在引导逻辑卷上创建引导映象

如果正在安装基本操作系统(新的安装或更新),则调用 bosboot 命令将引导映象放置在引导逻辑卷上。引导逻辑卷是在磁盘上物理相邻的区域,在安装期间通过“逻辑卷管理器”(LVM)来创建它。 bosboot 命令执行以下操作:

1. 检查文件系统以查看是否有足够空间创建引导映象。 2. 使用 mkfs 命令和原型文件创建 RAM 文件系统。

3. 调用 mkboot 命令,该命令将内核和 RAM 文件系统合并到引导映象。 4. 将引导映象写到引导逻辑卷。

要在固定磁盘的缺省引导逻辑卷上创建引导映象,请在命令提示符下输入以下内容: bosboot -a 或者:

bosboot -ad /dev/ipldevice

注:如果创建引导映象时 bosboot 命令失败,则不要重新引导机器。解决该问题并运行 bosboot 命令以成功完成。

为了让新的引导映象可用,必须重新引导系统。

创建网络设备的引导映象

要创建以太网引导的引导映象,请在命令提示符下输入以下内容: bosboot -ad /dev/ent 对于令牌环引导: bosboot -ad /dev/tok

确定系统运行级别

在操作系统上执行维护或更改系统运行级别前,可能需要检查不同的运行级别。此过程描述了如何确定系统正在运行的运行级别和如何显示先前运行级别的历史记录。init 命令确定系统运行级别。

标识当前运行级别

在命令行中输入 cat /etc/.init.state。系统显示一个数字;它是当前运行级别。有关运行级别的更多信息,请参阅 init 命令或 /etc/inittab 文件。

显示先前运行级别的历史记录

可以使用 fwtmp 命令显示先前运行级别的历史记录。

注:必须在系统上安装 bosext2.acct.obj 代码以使用此命令。 1. 作为 root 用户登录。

2. 在命令提示符下输入以下内容:

/usr/lib/acct/fwtmp

run-level 2 0 1 0062 0123 697081013 Sun Feb 2 19:36:53 CST 1992 run-level 2 0 1 0062 0123 697092441 Sun Feb 2 22:47:21 CST 1992 run-level 4 0 1 0062 0123 698180044 Sat Feb 15 12:54:04 CST 1992 run-level 2 0 1 0062 0123 698959131 Sun Feb 16 10:52:11 CST 1992 run-level 5 0 1 0062 0123 698967773 Mon Feb 24 15:42:53 CST 1992

更改系统运行级别

此过程描述了更改多用户或单用户系统的系统运行级别的两种方法。

第一次启动系统时,它进入缺省运行级别,该缺省运行级别通过 /etc/inittab 文件中的 initdefault 项来定义。系统在该运行级别操作,直至其接收到更改它的信号。

以下是当前定义的运行级别: 0-9 0-1 2 3-9

当 init 命令更改为运行级别 0-9 时,它杀死当前运行级别的所有进程,然后重新启动与新运行级别相关的任何进程。 为操作系统保留以供将来使用。 缺省运行级别。

可以根据用户的首选项来定义。

a、b、c 当 init 命令请求更改为运行级别 a、b 或 c 时,它不杀死当前运行

级别的进程;它仅仅启动用新的运行级别分配的任何进程。 Q、q

告知 init 命令重新检查 /etc/inittab 文件。

更改多用户系统上的运行级别

1. 检查 /etc/inittab 文件以确认修改成的运行级别支持正在运行的进程。getty 进程特别重要,因为它控制系统控制台和其它登录的终端线访问。请确保在所有运行级别中启用了 getty 进程。

2. 使用 wall 命令来通知所有用户您打算更改运行级别并请求用户注销。 3. 使用 smit telinit 快速路径来访问“设置系统运行级别”菜单。 4. 在“系统运行级别”字段中输入新的运行级别。 5. 按下 Enter 键以实现此过程中的所有设置。

系统通过告知您哪些进程按照运行级别的更改结果终止或启动,并通过显示消息来反馈: INIT:新的运行级别:n 此处 n 是新的运行级别号。

更改单用户系统上的运行级别

1. 检查 /etc/inittab 文件以确认修改成的运行级别支持正在运行的进程。getty 进程特别重要,因为它控制系统控制台和其它登录的终端线访问。请确保在所有运行级别启用了 getty 进程。

2. 使用 smit telinit 快速路径来访问“设置系统运行级别”菜单。 3. 在“系统运行级别”字段中输入新的系统运行级别。 4. 按下 Enter 键以实现此过程中的所有设置。

系统通过告知您哪些进程按照运行级别的更改结果终止或启动,并通过显示消息来反馈: INIT:新的运行级别:n 此处 n 是新的运行级别号。

运行级别脚本执行

运行级别脚本允许用户在更改运行级别时启动或停止选定的应用程序。 将运行级别脚本放置到特定于运行级别的 /etc/rc.d 的子目录中:

? ? ? ? ? ?

/etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc/rc.d/rc6.d /etc/rc.d/rc7.d

/etc/rc.d/rc8.d ? /etc/rc.d/rc9.d

?

/etc/rc.d/rc 将运行它在特定的目录中发现的启动脚本,并在运行级别更改时执行该脚本。该脚本会先停止应用程序脚本,然后启动应用程序脚本。 注:

以 K 开头的脚本是停止脚本,而以 S 开头的脚本是启动脚本。

更改 /etc/inittab 文件

本节包含了使用四个命令(chitab、lsitab、mkitab 和 rmitab)的过程,这四个命令修改 etc/inittab 文件中的记录。

添加记录 ― mkitab 命令

要将记录添加到 /etc/inittab 文件,请在命令提示符下输入以下内容: mkitab Identifier:Run Level:Action:Command

例如,要添加 tty2 的记录,请在命令提示符下输入以下内容: mkitab tty002:2:respawn:/usr/sbin/getty /dev/tty2 在上述示例中: tty002 2 respawn

/usr/sbin/getty /dev/tty2

标识您定义其运行级别的对象。 指定此进程运行的运行级别。

指定对于此进程,init 命令应当执行的操作。 指定要执行的 shell 命令。

更改记录 ― chitab 命令

要更改 /etc/inittab 文件中的记录,请在命令提示符下输入以下内容: chitab Identifier:Run Level:Action:Command

例如,要更改 tty2 的记录,从而使此进程在运行级别 2 和 3 上运行,请输入: chitab tty002:23:respawn:/usr/sbin/getty /dev/tty2

在上述示例中: tty002 23 respawn

/usr/sbin/getty /dev/tty2

标识您定义其运行级别的对象。 指定此进程运行的运行级别。

指定对于此进程,init 命令应当执行的操作。 指定要执行的 shell 命令。

列出记录 ― lsitab 命令

要列出 /etc/inittab 文件中的所有记录,请在命令提示符下输入以下内容: lsitab -a

要列出 /etc/inittab 文件中的特定记录,请输入: lsitab Identifier

例如,要列出 tty2 的记录,请输入:lsitab tty2。

除去记录

要从 /etc/inittab 文件除去记录,请在命令提示符下输入以下内容: rmitab Identifier

例如,要除去 tty2 的记录,请输入:rmitab tty2。

停止系统

shutdown 命令是停止操作系统的最安全和最彻底的方法。当指定适当的标志时,

此命令通知用户系统将当机、杀死所有现有的进程、卸下文件系统并停止系统。本节中包含以下关闭系统的方法: 不必重新引导而关闭系统 ? 将系统关闭为单用户方式 ? 在紧急情况下关闭系统

?

不必重新引导而关闭系统

可以使用两种不必重新引导而关闭系统的方法:SMIT 快速路径或 shutdown 命令。

先决条件

必须具有 root 用户权限以关闭系统。

过程

要使用 SMIT 关闭系统: 1. 作为 root 用户登录。 2. 在命令提示符处输入: smit shutdown

要使用 shutdown 命令关闭系统: 1. 作为 root 用户登录。 2. 在命令提示符处输入: shutdown

将系统关闭为单用户方式

在一些情况下,可能需要关闭系统并进入单用户方式以执行软件维护和诊断。 1. 输入 cd / 更改到根目录。必须在根目录中关闭系统到单用户方式以确保该文件系统完全卸下的。 2. 输入 shutdown -m。系统关闭为单用户方式。显示系统提示符,您可以执行维护活动。

在紧急情况下关闭系统

也可以使用 shutdown 命令在紧急情况下关闭系统。请使用此过程快速停止系统而无需通知其他用户。

输入 shutdown -F。-F 标志通知 shutdown 命令忽略对其他用户发送消息并尽快关闭系统。

重新激活不活动的系统

系统可以因为硬件问题、软件问题或两者的结合而变得不活动。此过程指导您完成更正问题和重新启动系统的步骤。如果完成此过程后系统仍然不活动,请参考硬件文档中的问题确定信息。

请使用以下过程重新激活不活动的系统: 检查硬件 ? 检查进程 ? 重新启动系统

?

检查硬件

通过执行以下操作检查硬件:

检查电源

? 检查操作员面板显示如果可用的话 ? 激活显示器或终端

?

检查电源

如果系统上的电源指示灯处于活动状态,则转至检查操作员面板显示

如果系统上的电源指示灯不活动,则检查电源是否已打开并且系统是否已接通电源。

检查操作员面板显示

如果系统有操作员面板显示,则检查它以了解任何消息。 如果系统上的操作员面板显示为空白,则转至激活显示器或终端。

如果系统上的操作员面板显示不是空白,则转至部件的服务指南以查找有关“操作员面板显示”中的数字的信息。

激活显示器或终端

检查显示器或终端的几个部件,具体如下:

确保显示器电缆安全地连接到显示器和系统部件。 ? 确保键盘电缆安全连接。 ? 确保鼠标电缆安全连接。

? 确保显示器打开并且其电源指示灯亮。

?

本文来源:https://www.bwwdw.com/article/lkk.html

Top