维护中心常见问题解答
适用场景
- ONTAP 9
- Data ONTAP 8.2 (7-模式)
问题解答
什么是维护中心?
维护中心的目的是通过减少因瞬时错误而不必要地返回到NetApp的磁盘数量来提高存储可靠性。
维护中心提供了Data ONTAP中内置的新磁盘诊断功能。‘s中心通过系统的故障验证过程自动管理磁盘故障、而故障磁盘仍在客户系统中。当前运行状况管理系统会将某个磁盘标识为潜在故障。该磁盘不会出现故障、也不会生成AutoSupport退回货物授权(RMA)案例、而是会从当前聚合中删除并发送到维护中心。根据收到的错误类型、用户数据会通过重建或RAID快速恢复从磁盘迁移到备用磁盘。此过程无需用户干预、只会向报告操作的控制台发送少量消息。
进入维护中心后、该磁盘将在后台进行测试、而不会中断系统的其他操作。如果可以修复瞬时错误、磁盘将返回到备用磁盘池。否则、磁盘将出现故障。在许多情况下、提供的测试可以更正先前可能导致驱动器出现故障或导致系统中断的错误、例如WAFL挂起崩溃。
维护中心的主要客户优势是什么?
维护中心可显著减少不必要的磁盘退回次数、从而改善NetApp磁盘驱动器的客户体验。由于组件故障减少、系统可靠性提高、客户的生命周期管理成本将降低。
如何选择驱动器以进入维护中心?
Data ONTAP具有一组已定义的错误和阈值、用于选择要维护的磁盘。这组阈值和错误可能因版本而异、因为它们会根据新信息进行修改。接收错误的磁盘、 已知致命错误、不会进入维护测试、并且将失败。
目前、此列表包括:
- 在短时间内出现大量已恢复或未恢复的磁盘错误
- 几天内出现大量已恢复或未恢复的磁盘错误
- 在同一位置重复出现已恢复或未恢复的磁盘错误
- 在一个磁盘上重复执行磁盘命令超时
- 磁盘报告了非致命的硬件错误
- 运行状况触发器、这些触发器基于磁盘驱动器制造商的建议、用于警告潜在的问题
- 错误和错误阈值将随着新的磁盘技术以及从当前版本收集的信息而不断变化。
为什么维护中心默认设置为开?
维护中心是Data ONTAP的一项关键可支持性功能、可提高NetApp存储的可靠性。因此、默认情况下、此选项会设置为on。
客户如何知道磁盘何时进入维护中心?
当磁盘进入维护中心时、系统会发布事件管理系统(EMS)事件。如果磁盘成功完成测试、测试失败或测试中止、则会发生另一个EMS事件。所有维护中心EMS事件都有一条系统日志消息。CLI命令‘vol status -r‘和‘sysconfig -r‘显示维护中心中的磁盘。‘disk maine status‘命令可用于列出正在进行维护测试的驱动器并显示测试进度。
是否可以关闭维护中心功能?有何影响?
是、可以执行以下命令:
options disk.maint_center.enable off
有关详细信息、请参见《存储管理指南》的"磁盘性能和运行状况"一节。维护中心可提高整体磁盘可靠性。关闭维护中心后、有问题的磁盘将自动出现故障、而不是进行测试。
维护中心是否会影响NetApp设备的性能?
维护中心对NetApp设备的性能影响极小。维护中心的许多诊断测试都直接由驱动器执行、而无需NetApp设备提供CPU资源。
维护中心一次可以有多少个NetApp设备?
维护中心支持对多达84个磁盘进行并发诊断。您可以使用以下命令限制运行维护中心测试的磁盘数量:
options disk.maint_center.max_disks max_disks
其中max_disk可以是1到84。
为了获得最佳维护中心运行效果、NetApp是否建议备件池中的磁盘数量达到最低要求?
NetApp建议在备件池中至少配置2个磁盘。即使不满足此最低要求、维护中心的当前版本仍将继续运行并进行测试。如果不满足备件池的最低要求、维护中心的未来版本将阻止驱动器进入维护中心。
同一个驱动器多久可以进入维护中心?
一次。磁盘首次出现瞬时错误时会进入维护中心、并相应地进行标记。如果磁盘返回到备用磁盘池后出现瞬时错误、则该磁盘将出现故障、并会发送ASUP以更换磁盘。当前规则是、每个磁盘只需一次访问维护中心。
维护中心收集哪种类型的数据?
维护中心不会收集任何客户数据。维护中心仅收集NetApp磁盘专用信息、例如:
- 将磁盘发送到维护中心的原因
- 磁盘序列号
- 运行的测试及其结果
- 测试持续时间
- 测试输出以及是否检测到特定错误、例如介质错误
AutoSupport (ASUP)与维护中心之间有何关系?
AutoSupport是Data ONTAP中内置的通知工具、可用于设置向您自己和NetApp全球支持中心发送的特定通知。维护中心使用AutoSupport将其调查结果作为每周数据日志的一部分传输回NetApp。
从何处可以获得有关维护中心的更多信息?
有关维护中心的详细信息、请参见ONTAP发行说明和存储管理指南。
什么是维护磁盘池?
维护磁盘池是指维护中心正在测试的磁盘。Sysconfig -r
输出可能会显示维护磁盘以及正在测试的某些磁盘。
维护中心需要多长时间才能决定将磁盘恢复使用或 故障排除并生成磁盘更换支持案例?
维护中心将在第一个失败的测试中使驱动器失败。如果第一次测试失败、则驱动器将出现故障并生成ASUP。如果所有测试均成功运行、则驱动器将在周期结束时返回到备用池。此时间取决于磁盘的大小和类型。但是,该时间大约等于 磁盘的归零时间的21/2倍。
维护中心的磁盘是否会对 ONTAP的ANDU (自动无中断升级)产生任何影响?
操作系统不会将维护中心磁盘视为故障磁盘、 因此、 在ONTAP 9升级期间执行所需的存储故障转移交还过程期间、不会使用发生原因进行否决。
追加信息
其他信息文本