如何对Fpolicy服务器导致的pBlk耗尽进行故障排除
适用场景
- Data ONTAP 7-模式
- Fpolicy
问题描述
- Fpolicy是一项功能、可通过原生 和第三方应用程序为Data ONTAP 提供有用的附加功能。它通常用于提供文件阻止(即、从我的服务器中保留MP3)、HSM (将不常用的文件移至较低分层存储)、配额和审核。大多数操作都由第三方应用程序执行。因此、外部Fpolicy服务器的响应时间直接影响存储控制器响应客户端请求的能力。
- 由于Fpolicy服务器是存储控制器的外部服务器、因此、当客户端发出的每个pBlk请求和第二个pBlk的Fpolicy服务器扫描请求时、pBlks的使用量会增加。Fpolicy服务器完成扫描请求的速度越快、Data ONTAP 响应原始客户端请求并释放pBlk的速度就越快。对基于Microsoft的Fpolicy服务器部署进行规模估算对于存储控制器以最高效率运行至关重要。
- 在查看pBlk耗尽和外部Fpolicy服务器时、需要考虑三个问题:
- Fpolicy服务器的数量
在任何给定时间、存储控制器可以向Fpolicy服务器发送的最大Fpolicy请求数为50。如果同时收到100个请求、则一个Fpolicy服务器必须先处理前50个请求、然后才能启动后50个请求。在这种情况 下、最大gOffloadQueue深度将变为50、因为存储控制器必须等待第一个块50完成、然后再发送第二个块50。在此示例中、可能未发生pBlk耗尽、但它强调、随着向存储控制器添加更多客户端、需要获得最佳的Fpolicy服务器性能。
- Fpolicy服务器的速度
外部Fpolicy服务器的速度至关重要;因此、建议在专用硬件上运行Fpolicy服务器、而不是将其作为虚拟机运行。如果外部Fpolicy服务器的性能下降、则响应存储控制器Fpolicy请求所需的时间将较长、从而导致pBlks被保留较长时间。如果Fpolicy服务器的速度如此下降、并且有足够的客户端在短时间内发送请求、则可能会发生pBlk耗尽。
- Fpolicy服务器的配置
Fpolicy供应商控制其应用程序的可调整选项。最好首先参考Fpolicy服务器供应商提供的安装和配置指南、以确保符合相应产品的最佳实践。不符合供应商最佳实践的配置可能会导致性能下降、从而使存储控制器面临pBlk耗尽的风险。
- 以下是您的Fpolicy服务器可能对pBlk耗尽造成影响的迹象:
Wed Sep 22 11:03:59 IST [cifs.server.infoMsg:info]: CIFS: Warning for server \filer1: Connection terminated.
Wed Sep 22 11:04:35 IST [fpolicy.fscreen.enable:info]: FPOLICY: File policy HSM1 (file screening) is enabled.
Wed Sep 22 11:05:06 IST [fpolicy.fscreen.server.droppedConn:warning]: FPOLICY: File policy server 192.168.1.100 for fscreen policy HSM1 has disconnected from the filer.
Wed Sep 22 11:06:10 IST [fpolicy.fscreen.server.pingRejected:error]: FPOLICY: Error trying to get status from file screening server \filer1 for policy HSM1 [0x6d].
Wed Sep 22 11:11:01 IST [ems.engine.inputSuppress:info]: Event 'cifs.stats.pBlkExhaust' suppressed 34 times since Tue Sep 21 17:48:01 IST 2010.
Wed Sep 22 11:11:01 IST [cifs.stats.pBlkExhaust:info]: CIFS: All CIFS control blocks for the STANDARD pool are in use. The request for a new control block can not be granted.