跳转到主内容

针对内存可靠性和 PPR 功能进行 BIOS 更新

Views:
137
Visibility:
Public
Votes:
0
Category:
aff-series
Specialty:
hw
Last Updated:

适用场景

  • AFF A800 , AFFA700s , AFF A700 , AFF A400
  • FAS9000 , FAS8700 , FAS8300
  • 软件包修复后( PPR )

问题解答

BIOS 更新和后包修复( PPR )增强功能有哪些?

近期的 BIOS 更新可按平台处理各种内存事件处理功能。  NetApp 系统使用不同的 Intel CPU 芯片组,因此每个平台都有自己的 BIOS 更新内容。

NetApp 正在其产品中引入后包修复( PPR ),以改善整体运营体验。  PPR 是一种新的内存功能,可与添加到 ONTAP 中的新创建功能结合使用。通过这些功能, NetApp 可以利用支持 PPR 的内存并主动解决内存问题,从而减少检测到内存错误时更换 DIMM 的需求。  此外, NetApp 还采用了新的 BIOS 更新,以改进对内存相关错误(可更正和不可更正的 ECC 错误)的处理。

  • NetApp 从 DDR4 开始采用了较新的内存技术,其中包括 PPR 功能。  
  • 如果与启用了 PPR 的控制器和操作系统结合使用,则系统可能会映射一个错误的内存行,并在 DIMM 上使用一个备用行。  
为什么这些更新很重要?为什么我应该升级?

与旧型号相比, NetApp 最新系统的内存容量和内存速度大幅提高。NetApp 较新的系统使用 DDR4 内存,其内存是旧系统的 4 到 12 倍,但内存质量始终保持稳定。由于系统中的 DIMM 模块数量较多,系统平均无故障时间( MTBF )会减少,并且可能会提高内存问题的系统维护级别。   

升级系统的 BIOS 将有助于逐步减少更换 DIMM 的需求,从而减少解决系统中与内存相关的故障的需求。

  • 在 Intel 更新 BIOS 以添加其他内存测试或内存错误处理修复程序时, NetApp 会测试这些修复程序并在 NetApp 支持站点上提供这些修复程序。
  • BIOS 更新是特定于平台的,每个修订版都包含增量改进,修复或新功能,例如 PPR 功能。  NetApp 会定期更新以改善整体系统体验。
  • 根据平台启用初始 PPR 功能(请参见平台专用功能)。未来的更新将增加额外的故障模式检测功能,并进一步减少更换 DIMM 的需求。
PPR 功能将如何改变我的系统行为?
  1. 遇到不可更正的内存错误时,系统将发生崩溃。
  2. 在 HA 配置中,配对节点将接管并继续提供服务。
  3. 当系统从 BIOS 重新启动时,它将开始 PPR 内存测试。

PPR 测试可能需要几分钟时间,系统才能测试内存并在系统控制台上显示结果。

PPR 测试完成后需要采取什么措施?
  • 无需更换 - 如果 PPR 可以检测到有问题的内存段,它将修复它。
    • 如果系统可以恢复,它将提供有关事件的消息。 PPR:Sequence PASS.
    • 无需执行其他操作。 
  • 需要更换 - 如果内存出现故障或无法修复,系统将无法启动 ONTAP ,需要更换 DIMM 。
    • 如果 同一 DIMM 发生第二次 UECC 错误和崩溃,请联系 NetApp 订购 DIMM 更换
在未来的 BIOS/PPR 更新中,计划做什么?

未来的更新将添加更多故障模式检测功能,以进一步减少更换内存 DIMM 的需求。

哪些产品包含新的 PPR 功能?
产品 BIOS 版本 与 ONTAP 捆绑在一起 错误报告
AFF A700 、 FAS9000 10.9 9.5P15 , 9.6P12 , 9.7P8 , 9.8 及更高版本 错误 1278330
AFF A700 12.8 9.5P15 , 9.6P12 , 9.7P9 , 9.8 及更高版本 错误 1354656
AFF A800 13.10 9.5P18 , 9.6P15 , 9.7P14 , 9.8P4 及更高版本 错误 1371369
AFF A400 , FAS8700 , FAS8300 16.3 9.7P12 , 9.8P2 及更高版本 错误 1373545

追加信息

有关对不可更正的 ECC 内存错误进行故障排除的一般信息,请参见 : How to troubleshoot correctable memory errors on FAS and AFF systems.