如何解决 Active IQ Unified Manager 的内存问题
适用于
- Active IQ Unified Manager (AIQUM)
- OnCommand Unified Manager (OCUM)
问题解答
-
使用保留内存应为满或为零,因为部分保留可能会导致问题
检查 AIQUM 内存建议
| 软件版本 | 系统要求 |
|
Active IQ Unified Manager 9.6 及更高版本 |
VMware OVA - 虚拟基础架构或硬件系统要求 |
| Microsoft Windows - 虚拟基础架构或硬件系统要求 | |
| Red Hat 和 CentOS Linux - 虚拟基础架构或硬件系统要求 | |
| OnCommand Unified Manager 9.5 及早期版本 | 虚拟基础设施或硬件系统要求 |
- 请参阅第 10 页 - "Unified Manager 可扩展性"
- 如果您到下一层的距离超过一半,请将资源增加到下一层以允许增长。
即,如果您有 30 个节点,请将内存从 12 GB 增加到 60 GB - 或者,除了起始的 12 GB 内存之外,还为每个监视的节点添加 1 GB 的内存。
即,如果您有 30 个节点,请将内存从 12 GB 增加到 42 GB
根据需要进行内存调整
- VMware 文档 - 更改内存配置
- VMware 文档 - 将内存资源分配给 VMware 主机客户端中的虚拟机
确认没有在虚拟机上发生膨胀或交换。
仅限 Linux - Linux 可能会停止 Unified Manager 进程以释放内存
- 在 Linux 平台上,检查 OOM "内存不足" 结束进程以释放内存。
- 在极少数情况下,Red Hat 和 CentOS 平台会杀死 Unified Manager 服务/进程以释放内存。
Dec 8 22:00:18 um-hostname kernel: Out of memory: Kill process 45678 (java) score 228 or sacrifice child
Dec 8 22:00:18 um-hostname kernel: Killed process 45988 (sh) total-vm:122868kB, anon-rss:260kB, file-rss:0kB, shmem-rss:0kB
Dec 8 22:00:19 um-hostname systemd: mysqld.service: main process exited, code=killed, status=9/KILL
Dec 8 22:00:19 um-hostname systemd: Unit mysqld.service entered failed state.
Dec 8 22:00:19 um-hostname systemd: mysqld.service failed.
Dec 8 22:00:20 um-hostname systemd: mysqld.service holdoff time over, scheduling restart.
Dec 8 22:00:20 um-hostname systemd: Stopped MySQL Server.
Dec 8 22:00:20 um-hostname systemd: Starting MySQL Server...
追加信息
常见的内存问题包括
- Unified Manager 应用程序运行缓慢:
- 服务需要很长时间才能上线。
- WebGUI 很慢。
- 备份需要很长时间(可能失败)。
- Unified Manager 应用程序 CPU 和/或内存利用率极高;交换/页面文件正在使用中。
- Unified Manager 应用程序遇到不一致的行为:
- 服务挂起。
- 服务重新启动。
- 服务根本无法启动(尤其是在升级后)
- 偶尔出现警报通知问题。
- 清单/性能采集轮询可能无法在正常的 15 分钟/5 分钟周期内完成。
- 在虚拟环境中运行时出现其他异常(无法解释的)不一致行为。
- VMware ESXi 显示以下一个或多个选项:
- 内存膨胀
- 交换
- 透明页面共享
- 数据压缩
- 扩展监控消息
- "Unified Manager 服务器内存不足"
- "Unified Manager 服务器内存不足"
- 日志指示:
- MySQL "
error.log" 文件:2020-04-12T04:02:10.036849Z 205 [Note] Aborted connection XXX to db: 'unconnected' user: 'jboss' host: 'localhost' (Failed on my_net_write())2020-04-12T08:50:42.808598Z 450 [Note] Got timeout reading communication packets
- Unified Manager "
server_mega.log" 文件:2020-04-12 06:11:01,221 ERROR [default task-4] c.n.s.s.a.OriginatorUpdateServlet (OriginatorUpdateServlet.java:82) - Transaction rolled back: javax.ejb.EJBTransactionRolledbackException: Transaction rolled back
- Unified Manager "
ocumserver.log" 文件:- 2019-06-06 02:49:49,566 INFO [oncommand] [pool-22-thread-4] [c.n.d.e.p.e.b.UnifiedManagerMemoryEventTypeController]比例监视器:创建新内存事件:event id=128123,eventSeverity=low, thresholdValue=5.0, currentUsageValue=6.690000057220459, totalMemorySizeValue=1.365997568E10, jvm=AuJvm
2019-06-06 01:49:49,190 INFO [oncommand] [pool-22-thread-55] [c.n.d.e.p.e.b.UnifiedManagerMemoryEventTypeController] Scale Monitor: New Memory Event Created: event id=128094,eventSeverity=almostOut, thresholdValue=7.0, currentUsageValue=7.195000171661377, totalMemorySizeValue=1.365997568E10, jvm=AuJvm
- MySQL "
注:这并不是表明内存问题的日志的详尽列表。请注意,NetApp 支持人员会找到其他日志行,这些日志行也可能表明内存问题。