如何解决 FAS 和 AFF 系统上可修复的内存错误
适用场景
- ONTAP 9
- Data ONTAP 8
- AFF / FAS平台
- DIMM更换指南
问题解答
根据平台和ONTAP版本选择适当的指南。
平台 | 系统或NVRAM | ONTAP 版本 | 指南 |
---|---|---|---|
|
系统DIMM |
|
|
|
在具有静态阈值的ONTAP版本中报告可更正的内存错误 | ||
NVRAM DIMM |
9.1及更高版本 |
EOS (停止支持)
平台 | 系统或NVRAM | ONTAP 版本 | 指南 |
|
系统或NVRAM | 9.1及更高版本 | ONTAP中62XX、32XX、25xx和22XX系统上的可更正内存错误 |
|
系统或NVRAM |
Data ONTAP 8 7-模式 |
|
追加信息
ONTAP存储系统使用纠错码(ECC)内存模块(DIMM)来更正传输中的内存错误、对性能几乎没有影响。可更正的ECC (CECC)错误不是可中断的不可更正的ECC (UECC)错误的可靠预测指标、尤其是对于最新的内存控制器和DRAM。
- 以前、ONTAP会根据自上次重新启动以来的500个错误阈值发出CECC错误"过多"警报。
- 这些警报可能会被视为误报、并可能导致不必要的硬件维护、而不会带来显著优势。
NetApp 已更新为动态监控算法、阈值要高得多。
- CECC错误仍会记录下来、但仅记录一个错误并不表示需要更换DIMM。
- 当CECC内存错误达到严重状态时,ONTAP将 触发 运行状况监控器警报 “Critical CECCCountMemErrAlert” 和相应的“Health Monitor”AutoSupport消息。
我们建议将您的BIOS更新到最新版本、以改进内存管理并提高UECC错误的故障恢复能力。这也减少了在启动过程中可以映射DIMM的情况。在 系统固件和诊断下载 页面上查找适用于您的系统的最新BIOS/Loader版本。
注意: AFF A800、AFF A400、AFF A320、FAS4700和FAS9300平台使用了JEDEC标准NVDIMM模块。