S3 在启用了 LATM (上次访问时间)的存储桶上可能会导致内存耗尽和存储器 ID 节点崩溃
适用于
- StorageGRID 11.2.0.3 或更低版本
- StorageGRID 11.1.1.9 或更早版本
说明
只有在启用了存储桶上的上次访问时间( LATM )时,本文才会有所帮助。
症状
- S3 客户端性能降低
- 存储节点内存耗尽
- 可能的存储节点崩溃(蓝色状态)
- 可能的存储节点 LDR 服务崩溃(蓝色状态)
- 存储节点上的 CPU 使用率较高
- 100 秒以上的“最坏情况阻止( MSBx )”
- GMI -> 存储节点 -> LDR -> 资源
原因
为桶启用 LATM 时
- 当 ODR 被销毁时、 S3 请求将尝试将所有对象段推入 ILM
- PushWithSegments 将数据段 UUID 元数据查找到将数据段纳入 ILM 队列中
- 由于 ade 内核认为 ODR 已失效、所以从不向其发送 C* 操作响应、 OBDR 也不会退出