跳转到主内容

如何正常关闭和启动集群中的所有 ONTAP 节点

Views:
600
Visibility:
Public
Votes:
1
Category:
ontap-9
Specialty:
hw
Last Updated:

适用场景

  • ONTAP 9
  • AFF 系统
  • FAS 系统
  • 不包括MetroCluster 配置

问题描述

以下几个事件可能需要正常关闭 ONTAP 设备:

  • 计划内站点断电
  • 数据中心范围内的维护
  • 物理系统移动
  • 准备将来重新利用设备
前提条件
关闭前
(最佳实践)
确定硬件组件

ONTAP 系统由以下一个或多个组件组成。使用以下链接可查看有用的详细信息和图片,以帮助现场人员查找和识别设备。

操作步骤

重要信息:此操作步骤 将关闭集群中的所有节点、只有在系统重新启动后、才能访问集群上的数据。
  1. 通过SSH登录到集群。否则、请使用 本地控制台缆线从集群中的任何节点登录
  2. 如何在计划维护时段解决指南中禁止自动创建案例 关闭事件的预期持续时间生成案例禁止AutoSupport 消息以及任何描述性文本:

cluster1::>system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"

  1. 确定所有节点的SP/BMC IP地址:

cluster1::>system service-processor show -node * -fields address
node           address
-------------- ------------
cluster1-01    10.10.10.10
cluster1-02    10.10.10.20
cluster1-03    10.10.10.30
cluster1-04    10.10.10.40

  1. 退出 clustershell :

cluster1::>exit

  1. [1] 使用步骤3中任何节点的IP地址通过SSH连接到SP/BMC。否则,请将 本地控制台缆线连接 到节点。使用相同的集群管理员凭据登录。 

如果通过SP/BMC提示符访问、请切换到 system console并提供集群管理员凭据:

login as: admin
admin@10.10.10.10's password: <password>
SP cluster1-01>system console
Type Ctrl-D to exit.
SP-login: admin
Password: <password>
cluster1::>​​​​

注意: 打开每个 SP/BMC 的 SSH 会话窗口以进行监控,如本步骤所述。

  1. 暂停集群中的所有节点:

对于大多数集群配置 -

cluster1::>system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true

对于 SnapMirror同步在StrictSync模式下运行的集群:

cluster1::> system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true
  1. 响应每个节点的提示:

Warning: Are you sure you want to halt node "cluster1-01"?
{y|n}: y

Warning: Are you sure you want to halt node "cluster1-02"?
{y|n}: y

Warning: Are you sure you want to halt node "cluster1-03"?
{y|n}: y

Warning: Are you sure you want to halt node "cluster1-04"?
{y|n}: y

4 entries were acted on.

  1. 通过达到LOADER提示符、等待每个节点完全暂停:

LOADER-A>

  1. 通过SP/BMC (如果尚未连接)或 使用本地控制台缆线连接到集群中的每个节点 ,并确认每个节点均处于 LOADER 提示符处(如步骤 8 中所述)。
物理活动
此处的物理活动可确保在系统关闭时不会发生设备损坏,并确保按照正确的设备启动顺序执行操作,以便 ONTAP 系统能够在事件完成后提供数据。
  1. 每个PSU切换开关切换到每个设备上的OFF位置。

注意:某些 PSU 没有切换开关。

  1. 拔下将每个 PSU 连接到 PDU 的电源线。
  2. 目视确认每个组件已成功关闭。
  3. 确保与集群关联的所有控制器,磁盘架和交换机均已关闭。
启动

当系统准备好重新启动时,请按照How to power up all ONTAP nodes in a cluster following a normal shutdown 中的步骤进行操作

    追加信息

    提示

    要远程关闭控制器,请执行以下操作:

    SP/BMC> system power off This will cause a dirty shutdown of your appliance. Continue? [y/n] y SP/BMC> system power status Chassis Power is off

    只有在完全关闭且节点处于 LOADER 提示符处后,才能忽略此警告。任何其他用途都可能导致发生原因数据丢失。

    从同一机箱中的其他SP或BMC重复上述操作(如果适用)。

     

    Sign in to view the entire content of this KB article.

    New to NetApp?

    Learn more about our award-winning Support

    NetApp provides no representations or warranties regarding the accuracy or reliability or serviceability of any information or recommendations provided in this publication or with respect to any results that may be obtained by the use of the information or observance of any recommendations provided herein. The information in this document is distributed AS IS and the use of this information or the implementation of any recommendations or techniques herein is a customer's responsibility and depends on the customer's ability to evaluate and integrate them into the customer's operational environment. This document and the information contained herein may be used solely in connection with the NetApp products discussed in this document.
    Scan to view the article on your device