如何对集群中的所有 ONTAP 节点执行平稳关机和开机
适用于
- ONTAP 9
- AFF 系统
- FAS 系统
- 排除 MetroCluster 配置
说明
一些事件可能需要优雅地关闭 ONTAP 设备,例如:
- 计划的现场停电。
- 数据中心范围的维护。
- 物理系统移动。
- 为将来重新利用设备做准备。
要求 |
|
关机前
|
|
识别硬件组件 |
ONTAP 系统由以下一个或多个组件组成。使用以下链接获取有用的详细信息和图片,以帮助现场人员定位和识别设备。 |
操作步骤
|
警告 此过程将关闭集群内的所有节点,并且在系统重新通电之前,无法访问集群上的数据。 |
ONTAP 关机过程
- 通过 SSH登录集群。否则,请使用本地控制台电缆从集群中的任何节点登录。
- 生成关机事件预期持续时间的病例抑制 AutoSupport 消息以及任何描述性文本:
cluster1::>system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"
- 识别所有节点的 SP/BMC IP 地址:
cluster1::>system service-processor show -node * -fields address
node address
-------------- ------------
cluster1-01 10.10.10.10
cluster1-02 10.10.10.20
cluster1-03 10.10.10.30
cluster1-04 10.10.10.40
- 退出 clustershell:
cluster1::>exit
如果通过 SP/BMC 提示访问,请切换到system console 并提供集群管理员凭据:
login as: admin
admin@10.10.10.10's password: <password>
SP cluster1-01>system console
Type Ctrl-D to exit.
SP-login: admin
Password: <password>
cluster1::>
注意: 为每个 SP/BMC 打开一个 SSH 会话窗口进行监控,如本步骤所述。
- 停止集群中的所有节点:
对于大多数集群配置:
cluster1::>system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true
对于在 StrictSync 模式下运行 SnapMirror Synchronous 的集群:
cluster1::>system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
- 响应每个节点的提示:
Warning: Are you sure you want to halt node "cluster1-01"?
{y|n}: y
Warning: Are you sure you want to halt node "cluster1-02"?
{y|n}: y
Warning: Are you sure you want to halt node "cluster1-03"?
{y|n}: y
Warning: Are you sure you want to halt node "cluster1-04"?
{y|n}: y
4 entries were acted on.
- 等待每个节点通过到达 LOADER 提示符完全停止:
LOADER-A>
关机活动
|
警告 在完成完整的 ONTAP 关机过程之前,请勿继续。 |
本地关闭电源(首选)
此处的物理活动确保在系统断电时不会发生设备损坏,并确保遵循正确的设备启动顺序,以便 ONTAP 系统准备好在事件完成后提供数据。
- 将每个设备上的每个 PSU 摇杆开关切换到OFF位置。
注意:某些 PSU 没有摇杆开关。
- 拔下将每个 PSU 连接到 PDU 的电源线。
- 目视确认每个组件已成功关闭电源。
- 确保与集群关联的所有控制器、磁盘架和交换机都已关闭电源。
远程关闭电源
- 通过 SSH 连接到 SP/BMC。
- 通过切换到,确认节点已达到LOADER提示
system console:
login as: admin
admin@10.10.10.10's password: <password>
SP cluster1-01>system console
Type Ctrl-D to exit.
LOADER-A>
- 可选: 要防止开机后意外启动,请禁用 AUTOBOOT:
LOADER-A>printenv AUTOBOOT
AUTOBOOT true
LOADER-A>setenv AUTOBOOT false
LOADER-A>saveenv
- 返回 SP/BMC 提示并远程关闭节点电源。
SP/BMC>system power off
- 确认关机。 只有在干净关机且节点处于 LOADER 提示时,才能忽略警告"这将导致设备的脏关机。",任何其他用途都可能导致数据丢失。
This will cause a dirty shutdown of your appliance. Continue? [y/n] y
- 确认电源显示为关闭:
SP/BMC>system power status
Chassis Power is off
运行命令"system power status"时,某些型号可能会返回"Host Power is off",而不是"Chassis Power is off"
- 对其他正在关闭的节点重复上述步骤。
启动活动
当系统准备好重新通电时,请按照 How to power up all ONTAP nodes in a cluster following a graceful shutdown中的步骤进行操作
视频参考
追加信息
- 在计划的停电期间,正常关闭和启动存储系统的程序是什么?
- 在我们无法控制客户端以停止 I/O 操作的情况下,客户可以选择以下方法之一。
- 执行
vserver stop以停止整个 vserver - 执行
vserver cifs stop对于 CIFS 环境(重新启动后执行vserver cifs start) - 为 NFS 环境执行
vserver nfs stop(重新启动后执行vserver nfs start)
- 执行