StorageGRID节点利用率较低、并报告"InteralError 500"无法与其他网格节点通信
适用场景
StorageGRID 11.7.0
问题描述
- StorageGRID节点在网格中的利用率较低、并且
InternalError 500
由于问题描述 与ADC节点的联系而报告。
Jul 2 00:32:17 <Nodename> ADE: |12038591 0716178440 S3RQ ^RDY 2024-07-02T00:32:17.354063| NOTICE 0138 3fd527aa22bee2b8 S3RQ: S3 error response: RequestId=1719880277344899, TraceId=3fd527aa22bee2b8, Resource=/<Object_path>, HTTP Method=HEAD, HTTP Status Code=500, X-Forwarded-For: '<>', ErrorMsg=InternalError, ErrorType=Internal, CustomErrorMessage={None}, Details={Failed to query any account server (3 candidates); last error: Failed to connect to Account Server at <ADC_NODE_IP>: Account Server at <ADC_NODE_IP> responded with 0 ().}
在其余节点尝试与受影响节点通信时、可以看到这些节点的网络隔离事件:
/var/local/log/dynip.log
[2024-07-04T03:26:47.152] Dummy-954194 - WARNING -- : heartbeat to <grid_node>/<Grid_IP> failed: <urlopen error timed out>
- 存储节点无法连接到任何网格端口上的任何网格节点,并且
grid_ips
中的元素缺少受影响节点的IPnft ruleset
。- 通过运行以下命令进行验证:
nft list ruleset
- 通过运行以下命令进行验证: