由于磁盘利用率较高、Flash Cache无法插入、并且用户速度较慢
适用场景
- ONTAP 9
- 所有采用基于NVMe的闪存的FAS系统
问题描述
- Flash Cache插入可能已在HA对中的一个或两个节点上停止
- 如果插件停止:
- 磁盘利用率达到100%或接近该水平
- 延迟已从正常的0-5毫秒增加到20毫秒以上
- 注意: 有时插页可能不会停止,但
Insertq_save
下面的错误将会被大量的次数所压缩
- 如果插件停止:
示例: node2
使用以下 stats show -p flexscale-access
高级命令时没有插入
Cluster::> set -privilege advanced Cluster::*> node run -node * stats show -p flexscale-access Node: node1 Usage Hit Meta Miss Hit Evict Inval Insert Chain Blocks Chain Blocks Replaced % /s /s /s % /s /s /s /s /s /s /s /s 88 873 91 427 67 194 0 1426 430 895 22 1432 430 88 711 254 480 59 0 884 0 418 732 0 0 418 88 534 106 404 56 0 0 0 247 542 0 0 247 88 640 100 528 54 88 0 766 279 657 12 793 279 ^c Node: node2 Cache Reads Writes Disk Reads Usage Hit Meta Miss Hit Evict Inval Insert Chain Blocks Chain Blocks Replaced % /s /s /s % /s /s /s /s /s /s /s /s 63 1653 7 6481 20 0 9 0 0 0 0 0 266 63 3902 23 7859 33 0 0 0 0 0 0 0 428 63 2331 12 6462 26 0 0 0 0 0 0 0 330 63 1130 6 7013 13 0 23 0 0 0 0 0 171 63 1684 5 8037 17 0 0 0 0 0 0 0 246
- 这些错误消息会显示在事件日志中、在10分钟的窗口内会被压缩几万到数百万次
- 如果在10分钟内超过数十万或数百万、则表示签名、否则属于 正常情况、可能会被忽略
Wed Aug 10 03:03:37 UTC [node2: wafl_exempt08: ems.engine.suppressed:debug]: Event 'extCache.io.writeError' suppressed 1638001 times in last 610 seconds. Wed Aug 10 03:03:37 UTC [node2: wafl_exempt06: extCache.io.writeError:notice]: WAFL external cache I/O write error: Insertq_save: unable to set up context chain, code 0.
- 卡状态显示为
ok
sysconfig -a
无故障
slot 1: Flash Cache NVMe Serial Number: ZEP00GPR Part Number: 119-00329 Hardware Revision: A0 Firmware Version: NA03 Model Name: X3311A Capacity: 1024 GB State: ok
- 系统可能会发生崩溃、例如以下崩溃字符串:
Panic_Message: received completion for unknown cmd in process irq287: nvme1 on release 9.8P14 (C)
- 此后、闪存最终可能会显示为故障
slot 3: Flash Cache NVMe Serial Number: 1234567890 Part Number: 119-00329 Hardware Revision: A0 Firmware Version: NA03 Firmware File: X3311_S000PM963NVM Model Name: X3311A Capacity: 1024 GB State: failed