Element 集群由于出现故障而无法向 ActiveIQ 报告 mNode AIQ 收集器服务中的内存状况
适用于
- 运行 Element 软件并配置为的 HCI 或 AFA 集群 向 ActiveIQ 报告
- 运行管理服务的 Element Management Node ( mNode ) 11.3 或更高版本 2.15.28
- 混合云控制( HCC )版本 2.15
问题
不同存储集群(运行 Element 软件的 AFA 或 HCI 存储节点)和 HCI 计算节点的症状可能会有所不同。
对于存储集群:
- 存储集群不再向 ActiveIQ 报告
对于计算节点:
- 计算节点不再向 ActiveIQ 报告
- 计算节点可能不会显示在 Hybrid Cloud Control 中 ( HCC )
这两种环境的通用分母是 mNode 上 mnode-svc-aiq-collector 服务的容器日志中的内存不足错误。
在/var/log/syslog
中:
Memory cgroup out of memory
Task in /docker/af508468f78f4d8fd1811193b19eeecc5da3e3bcb1e64f3835b600976974f257 killed as a result of limit