如何对机会锁延迟中断引起的CIFS客户端访问问题进行故障排除
执行
执行
适用场景
- Data ONTAP 8.2 7-模式
- Data ONTAP 8.1 7-模式
- Data ONTAP 7 及更早版本
问题描述
最终用户向Access Denied
存储系统报告错误或常规连接问题后、通常会在存储系统消息日志中注意到机会锁延迟中断。此错误本身并不表示存储系统存在问题描述。实际上、存储系统正在报告与客户端关联的问题描述。要了解机会锁延迟中断消息、请务必了解机会锁的工作原理。
卵块的总流量如下:
- 客户端1打开
\storage systemsharefile1
请求批处理或独占机会锁的 - 存储系统对文件 1 的批处理或排它的 Oplock 进行响应到 Client1
- 客户端 2 尝试打开
\storage systemsharefile1
,请求批处理或独占机会锁 - 存储系统暂停向客户端2发出的打开请求、并向客户端1发送Oplock中断请求、请求其刷新所有锁定
- 客户端1对Oplock中断请求进行响应、以刷新其缓存
- 存储系统将“ Open (打开)”权限授予客户端 2 、并带有相应的锁定
在上述示例中、在步骤4中、当存储系统向客户端1发送Oplock中断请求时、将启动35秒计时器。如果客户端1在35秒内未响应Oplock中断请求、则存储系统将执行以下三项操作:
- 在系统日志
示例中记录包含有问题客户端IP地址的Oplock延迟中断消息:
Sun Nov 1 09:51:29 CET [srv123@ntap1:cifs.oplock.break.timeout:warning]: CIFS: An oplock break request to station <IP>()
- 强制清除客户端1的文件上关联的所有锁定
- 向客户端2授予打开响应
由于机会锁延迟中断指示客户端出现问题、因此故障排除工作应集中在客户端上。客户机不响应 Oplock 中断请求的原因有三个:
- 客户端重新启动异常(例如蓝屏)、因此不再认为它锁定了文件。
- 客户端与存储系统的打开连接过多、因此无法响应Oplock中断请求。
- 客户端与存储系统之间存在网络连接问题、因此客户端无法接收Oplock中断请求。