如果使用OTS双节点集群、则故障转移和故障恢复过程的工作流/时间延迟是多少?
适用场景
- ONTAP Select ( OTS )
- ONTAP Select Deploy
- SyncMirror
问题解答
默认情况下、在主动/主动HA对中、如果HA对中的一个节点发生故障、重新启动或停止、配对节点会自动接管、并在受影响节点重新启动时返回存储。
然后、HA对恢复正常运行状态。如果其中一个节点无响应、也可能会发生自动接管。
当节点接管其配对节点时,该节点会继续提供并更新配对节点聚合和卷中的数据。为此、它会接管配对节点聚合的所有权、并根据网络接口故障转移规则迁移配对节点的LUN。
平均时间延迟
在 使用OTS双节点集群的情况下、故障转移和故障恢复过程的平均延迟时间可能会因聚合数量和大小而异。要进一步细分此问题、 传输计算和协议大约需要1分钟、 然后传输网络连接不超过2分钟、传输存储最多不超过5分钟
(取决于聚合的数量和大小)。
NetApp使用ONTAP中已有的RAID SyncMirror (RSM)在集群节点之间复制数据锁、以实现HA功能。
- OTS中的SyncMirror使用专用集群网络(内部端口组)和NVRAM在OTS节点上的本地Pool0和远程Pool1之间复制磁盘写入。
- 磁盘读取无需同步、因为它们是直接从本地Pool0读取的
- HA RSM和镜像聚合的 其他详细信息。
可能影响到/GB的情形:
- 断电:
- 如果两个节点或ESXi主机都 关闭会导致"异常关闭"、并且发生原因会丢失写入并损坏WAFL文件系统。
- OTS是软件定义的存储、100%依赖于VMware/ESXi主机的运行状况。
- 网络中断对OTS的影响与对任何其他解决方案的影响没有任何不同。
- 除非在网络中配置了适当的冗余(冗余交换机、端口通道、端口中继)、否则NAS协议将超时并丢失访问权限。
- 如果网络中断仅影响一个ESX节点、则OTS可以利用LIF故障转移到配对节点。
- OTS中的SAN协议使用iSCSI。
- 对于NAS、同样的规则也适用于iSCSI。
- 故障恢复能力取决于网络硬件和ESX配置中内置的冗余级别。
- 请记住、ONTAP Select是软件定义的存储。从较高层面来看、差异在于您提供计算和存储硬件。
- 除非在网络中配置了适当的冗余(冗余交换机、端口通道、端口中继)、否则NAS协议将超时并丢失访问权限。
有关了解ONTAP Select架构和最佳实践的详细信息,请参阅 技术报告TR-4517,了解OTS的架构和最佳实践配置。
追加信息
附加信息 _text