数据库一体机(Exadata)日常运维手册

更新时间:2024-04-10 06:38:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

Exadata日常运维

Exadata日常运维

Page 1 of 71

Exadata日常运维

目录

一、 日常操作 ........................................................................................................................... 4

配置查看 ................................................................................................................................... 4 详细查看硬件配置和状态 ....................................................................................................... 5 检查当前电源功耗 ................................................................................................................... 6 检查功耗的历史记录 ............................................................................................................... 7 告警设置 ................................................................................................................................... 9 二、 健康检查 ......................................................................................................................... 11

系统状态查看 ......................................................................................................................... 11 各传感器工作状态 ................................................................................................................. 11 设置组件的指示灯亮和快闪 ................................................................................................. 13 检查系统硬件日志 ................................................................................................................. 14 三、 Infiniband交换机 .......................................................................................................... 16

查看IB硬件信息 ................................................................................................................... 16 查看IB硬件配置和状态 ....................................................................................................... 18 查看ILOM的网络会话超时的设置 ....................................................................................... 19 查看ILOM的网络设置 ........................................................................................................... 20 查看系统SNMP管理的设置 ................................................................................................... 21 检查IB链路状态 ................................................................................................................... 22 查看IB网络拓扑状态 ........................................................................................................... 23 诊断IB链路没有错误 ........................................................................................................... 26 查看IB网络连线 ................................................................................................................... 34 查看IB健康状态 ................................................................................................................... 35 四、 PDU ................................................................................................................................ 35

监控PDU状态 ......................................................................................................................... 35

使用Metering Unit’s LCD Screen监控PDU ................................................................ 35 使用Web界面监控PDU............................................................................................... 36 PDU故障处理 .......................................................................................................................... 38 五、 Cisco交换机 .................................................................................................................. 38

监控Cisco交换机状态 ......................................................................................................... 38 Cisco故障处理 ...................................................................................................................... 38 六、 日常运维及故障处理 ..................................................................................................... 39

Powering Off Oracle Exadata Rack ................................................................................... 39 启停Exadata Database Server .......................................................................................... 39 启停Exadata Storage Server ............................................................................................. 40 监控服务器周边温度 ............................................................................................................. 41 DB节点磁盘状态检查 .......................................................................................................... 42 CELL节点磁盘故障 .............................................................................................................. 43 CELL节点Flash卡故障 ....................................................................................................... 55 七、 常用诊断工具 ................................................................................................................. 58

Exachk or HealthCheck .......................................................................................................... 58 Diagnostics Collection Tool: sundiag.sh .............................................................................. 59

Page 2 of 71

Exadata日常运维

RDA(Remote Diagnostic Agent) ....................................................................................... 60 ADRCI .................................................................................................................................... 61 八、 Exadata最佳实践 ......................................................................................................... 61

Optimize ASM Diskgroup Balance ..................................................................................... 61 Optimize Scan Rates ........................................................................................................... 62 Ensure auto extend size will allocate space on all disks in the diskgroup 63 备份 (Tape-Based) ............................................................................................................... 63 备份 (Disk-Based) ............................................................................................................... 66 恢复......................................................................................................................................... 68 Verify DW/BI Instance Database Initialization Parameters ................................. 69 Check for ASM notification of corruption ................................................................. 70 Choose the ASM redundancy type based on your desired protection level and capacity demands ................................................................................................................................. 71

Page 3 of 71

Exadata日常运维

一、 日常操作

由于 Database Server 与 Storage Cell 为同平台产品,ILOM 版本相同,所以 ILOM 管理操作基本相同,下述内容及图例将以 Storage Cell 为例。ILOM 可远程查看 DB

server/Storage Cell 硬件信息和开关机状态,采用 Web 方式,通过 Web 浏览器访问监控,例如:https://10.182.28.146。

配置查看

用IE访问ILOM.

输入用户名(root)和口令(welcome1),完成登录。 选择,可查看DB Server/Storage Cell系统硬件概览信息:

概览信息包括产品名称、序列号、BIOS版本、SP主机名称和IP地址、和ILOM

Page 4 of 71

Exadata日常运维

版本等,特别的还显示有加电状态(例如On),系统运行时间等。

详细查看硬件配置和状态

采用Web方式,选择标签,可查看DB Server/Storage Cell系统各个硬件组件和状态:

部件类型说明: 部件号 /SYS /SYS/CONNBD 名称 全系统 连接板组件 注释 存储节点或数据库服务器节点 ConnectorBoard Assembly /SYS/DBP 硬盘背板 /SYS/DBP/HDD0 硬盘 /SYS/FB 前风扇板 /SYS/FB/F0 风扇模块 /SYS/MB 主板 /SYS/MB/BIOS BIOS模块 /SYS/MB/CPLD NVRAM模块 /SYS/MB/NET0 千兆网口 /SYS/MB/P0 CPU /SYS/MB/P0/D2 内存条 /SYS/MB/RISER0 PCIE插槽组件 /SYS/MB/RISER0/PCIE0 PCIE插槽模块 /SYS/MB/RISER2/PCIE2/F20CARD F20闪存卡 /SYS/PD 分电板

0号插槽 0号插槽 存储节点 0号端口 0号插槽 2号插槽 用于插PCIE板 Page 5 of 71

Exadata日常运维

/SYS/SAS_EXP /SYS/SP /SYS/SP/NET0 SAS硬盘扩展板 插SAS硬盘的背板 SP控制器 管理服务器的控制器 SP控制器网口 选定部件,可观察更为详细的信息,例如选择CPU部件,会看到CPU的详细信息,包括型号和状态等:

注:标明为FRU(Field Replace Unit)的组件,为现场可更换组件。

检查当前电源功耗

采用Web方式,选择标签,可监控电源功耗状态:

Page 6 of 71

Exadata日常运维

实际功耗(Actual Power)显示当前系统的实际功耗。

检查功耗的历史记录

采用Web方式,可选择标签

Page 7 of 71

Exadata日常运维

可显示最近一小时内的每分钟内平均电源功耗:

即可查看实时功耗和历史功耗,若有单价,有利于帮助数据中心电费的统计。

Page 8 of 71

Exadata日常运维

告警设置

可定义报警规则,总共可定义15条。

Web方式,选择

选中任意一个规则,点击。可选择三种报警方式:IPMI PET、Email或SNMP Trap,可选择5种报警级别:Down、Critical(临界值)、Major(重要)、Minor(次要)和Disable:

Page 9 of 71

Exadata日常运维

点击保存定义的规则,点击可测试所定义的报警规则。

Page 10 of 71

本文来源:https://www.bwwdw.com/article/nm3r.html

Top