AFF A800 の T6 ネットワークカード e1a / e1b ( t6nex1 )で致命的なエラーが発生しました
環境
- AFF A800オンボードT6ポートe0aとe0b
- X1146A デュアル 40 / 100G イーサネット T62100-CR ネットワークインターフェイスカード( NIC )
問題
- watchdog NMI でノードのパニックが発生し、パニック状態になる直前の e1a / e1b で致命的なパリティエラーが発生しています。
e1a/e1b (t6nex1): ! PL_PERR_CAUSE 0x19404 = 0x00000010, E 0x1fffe3ff, F 0xffffffff
e1a/e1b (t6nex1): ! [0x00000010] MPS
PANIC: watchdog nmi on cpu 45, hang cpu is 3 in process idle: cpu45 on release 9.7P5 (C)
- ノードをブートできるか、稼働したままになると、 EMS メッセージが表示されることがあります。
[node01: intr: netif.fatal.err:alert]: The network device in slot 1 encountered fatal error e1a/e1b
[node01: intr: netif.fatal.err:alert]: The network device in slot 0 encountered fatal error e0a/e0b
- ノードがパニック状態にならない可能性はありますが、HAインターコネクト停止のコールホームEMSメッセージが表示されます。
[callhome.hainterconnect.down:alert]: Call home for HA INTERCONNECT DOWN due to link1 down.