用于内存可靠性和 PPR 功能的 BIOS 更新
适用于
- AFF 系统
- ASA 系统
- FAS 系统
- 包修复后 (PPR)
问题解答
哪些产品包含 PPR 功能?
- 支持 Post Package Repair (PPR)的 ONTAP 版本
BIOS 更新和后包修复 (PPR) 增强功能的用途是什么?
最近的 BIOS 更新在每个平台上解决了各种内存事件处理功能。NetApp 系统使用不同的英特尔 CPU 芯片组,因此,每个平台都有自己的 BIOS 更新内容。
NetApp 正在将 Post Package Repair (PPR) 引入其产品,以改善整体运营体验。PPR 是一种新的内存功能,可与添加到 ONTAP 的新创建功能结合使用。这些功能允许 NetApp 利用启用 PPR 的内存并主动解决内存问题,从而减少了在检测到内存错误时更换 DIMM 的需要。此外,NetApp 还采用了新的 BIOS 更新,以改进对内存相关错误(可纠正和不可纠正的 ECC 错误)的处理。
- NetApp 从 DDR4 开始使用较新的内存技术,包括 PPR 功能。
- 当与启用 PPR 的控制器和操作系统相结合时,系统可以映射出坏内存行,并利用 DIMM 上的备用行。
为什么这些更新很重要,为什么我应该升级?
NetApp 最新系统的内存容量和内存速度比旧型号大幅增加NetApp 较新的系统使用 DDR4 内存,内存是旧系统的 4 倍至 12 倍,但内存质量一直保持稳定状态由于系统中 DIMM 模块的数量增加,系统平均故障间隔时间 (MTBF) 降低,内存问题的系统维护水平可能更高
升级系统的 BIOS 将有助于逐步减少更换 DIMM 的需要,减少解决系统内存相关故障的需要。
- 当 Intel 更新其 BIOS 以添加额外的内存测试或内存错误处理修复时,NetApp测试这些修复,并在NetApp支持网站上提供。
- BIOS 更新是特定于平台的,每个版本都进行了增量改进、修复或新功能(如 PPR 功能)。NetApp提供定期更新,以改善整体系统体验。
- 初始 PPR 功能基于平台启用(请参阅平台特定功能)。未来的更新将增加额外的故障模式检测功能,并进一步减少更换 DIMM 的需求。
PPR 功能将如何改变我的系统行为?
- 遇到无法更正的内存错误时,系统将死机。
- 在 HA 配置中,合作伙伴将接管并继续提供服务。
- 当系统从 BIOS 重新启动时,它将开始进行 PPR 内存测试。
PPR 测试可能需要几分钟时间,系统才能测试内存并在系统控制台上显示结果。
PPR 测试完成后需要采取什么行动?
- 无需更换- 如果 PPR 可以检测到有问题的内存段,它将对其进行修复。
- 如果系统可以恢复,它将提供有关事件的消息。
PPR:Sequence PASS. - 无需采取进一步行动。
- 如果系统可以恢复,它将提供有关事件的消息。
- 需要更换- 如果内存出现故障或无法修复,系统将不会启动 ONTAP,并且需要更换 DIMM。
- 如果相同的DIMM遇到第二个UECC错误和死机,可以选择更换DIMM。联系NetApp订购DIMM更换件
在未来的 BIOS/PPR 更新中计划采取哪些措施?
未来的更新将增加额外的故障模式检测功能,以进一步减少更换内存 DIMM 的需要。
视频参考
追加信息
有关无法纠正的 ECC 内存错误的故障排除的一般信息,请参见: 如何对 AFF 和 FAS 系统上的无法纠正的内存错误进行故障排除