跳转到主内容

如何对集群中的所有 ONTAP 节点执行平稳关机和开机

Views:
2,238
Visibility:
Public
Votes:
3
Category:
ontap-9
Specialty:
hw
Last Updated:

适用于

  • ONTAP 9
  • AFF 系统
  • FAS 系统
  • 排除 MetroCluster 配置

说明

一些事件可能需要优雅地关闭 ONTAP 设备,例如:

  • 计划的现场停电。
  • 数据中心范围的维护。
  • 物理系统移动。
  • 为将来重新利用设备做准备。
要求
关机前
(推荐做法)
识别硬件组件

ONTAP 系统由以下一个或多个组件组成。使用以下链接获取有用的详细信息和图片,以帮助现场人员定位和识别设备。

操作步骤

警告

此过程将关闭集群内的所有节点,并且在系统重新通电之前,无法访问集群上的数据。

ONTAP 关机过程
  1. 通过 SSH登录集群。否则,请使用本地控制台电缆从集群中的任何节点登录。
  2. 生成关机事件预期持续时间的病例抑制 AutoSupport 消息以及任何描述性文本:

cluster1::>system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"

  1. 识别所有节点的 SP/BMC IP 地址:

cluster1::>system service-processor show -node * -fields address

node           address
-------------- ------------
cluster1-01    10.10.10.10
cluster1-02    10.10.10.20
cluster1-03    10.10.10.30
cluster1-04    10.10.10.40

  1. 退出 clustershell:

cluster1::>exit

  1. 使用步骤 3 中任何节点的 IP 地址通过 SSH 连接到 SP/BMC。否则,将本地控制台电缆连接到节点。使用相同的集群管理员凭据登录。 

如果通过 SP/BMC 提示访问,请切换到system console 并提供集群管理员凭据:

login as: admin
admin@10.10.10.10's password: <password>
SP cluster1-01>system console
Type Ctrl-D to exit.
SP-login: admin
Password: <password>
cluster1::>​​​​

注意: 为每个 SP/BMC 打开一个 SSH 会话窗口进行监控,如本步骤所述。

  1. 停止集群中的所有节点:

对于大多数集群配置:

cluster1::>system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true

对于在 StrictSync 模式下运行 SnapMirror Synchronous 的集群

cluster1::>system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true

  1. 响应每个节点的提示:

Warning: Are you sure you want to halt node "cluster1-01"?
{y|n}: y

Warning: Are you sure you want to halt node "cluster1-02"?
{y|n}: y

Warning: Are you sure you want to halt node "cluster1-03"?
{y|n}: y

Warning: Are you sure you want to halt node "cluster1-04"?
{y|n}: y

4 entries were acted on.

  1. 等待每个节点通过到达 LOADER 提示符完全停止:

LOADER-A>

  1. 通过 SP/BMC(如果尚未连接)或使用本地控制台电缆连接到集群中的每个节点,并确认每个节点都在 LOADER 提示处(如步骤 8 所示)。
关机活动

警告

在完成完整的 ONTAP 关机过程之前,请勿继续。

 

本地关闭电源(首选)

此处的物理活动确保在系统断电时不会发生设备损坏,并确保遵循正确的设备启动顺序,以便 ONTAP 系统准备好在事件完成后提供数据。

  1. 将每个设备上的每个 PSU 摇杆开关切换到OFF位置。

注意:某些 PSU 没有摇杆开关。

  1. 拔下将每个 PSU 连接到 PDU 的电源线。
  2. 目视确认每个组件已成功关闭电源。
  3. 确保与集群关联的所有控制器、磁盘架和交换机都已关闭电源。
远程关闭电源
  1. 通过 SSH 连接到 SP/BMC
  2. 通过切换到,确认节点已达到LOADER提示 system console:

login as: admin
admin@10.10.10.10's password: <password>
SP cluster1-01>system console
Type Ctrl-D to exit.
LOADER-A> 

  1. 可选:  要防止开机后意外启动,请禁用 AUTOBOOT:

LOADER-A>printenv AUTOBOOT
AUTOBOOT        true

LOADER-A>setenv AUTOBOOT false

LOADER-A>saveenv

  1. 返回 SP/BMC 提示并远程关闭节点电源。

SP/BMC>system power off

  1. 确认关机。  只有在干净关机且节点处于 LOADER 提示时,才能忽略警告"这将导致设备的脏关机。",任何其他用途都可能导致数据丢失

This will cause a dirty shutdown of your appliance. Continue? [y/n] y

  1. 确认电源显示为关闭:

SP/BMC>system power status

Chassis Power is off

运行命令"system power status"时,某些型号可能会返回"Host Power is off",而不是"Chassis Power is off"

  1. 对其他正在关闭的节点重复上述步骤。
启动活动

当系统准备好重新通电时,请按照 How to power up all ONTAP nodes in a cluster following a graceful shutdown中的步骤进行操作

视频参考

 

追加信息

NetApp provides no representations or warranties regarding the accuracy or reliability or serviceability of any information or recommendations provided in this publication or with respect to any results that may be obtained by the use of the information or observance of any recommendations provided herein. The information in this document is distributed AS IS and the use of this information or the implementation of any recommendations or techniques herein is a customer's responsibility and depends on the customer's ability to evaluate and integrate them into the customer's operational environment. This document and the information contained herein may be used solely in connection with the NetApp products discussed in this document.