跳转到主内容

NetApp_Insight_2020.png 

FCP 合作伙伴路径配置错误消息的含义是什么?

Views:
5
Visibility:
Public
Votes:
0
Category:
data-ontap-8
Specialty:
san
Last Updated:

可不使用  

适用于

  • SAN
  • Data ONTAP 8 7-模式
  • Data ONTAP 7 及更早版本

解答

AutoSupport 消息: FCP 合作伙伴路径配置错误

系统日志和 EMS 消息
[hostname: scsitarget.partnerPath.misconfigured:error]: FCP Partner Path Misconfigured.
[hostname: scsitarget.partnerPath.misconfigured:error]: FCP Partner Path Misconfigured - Host I/O access through a non-primary and non-optimal path was detected.


术语

  • 合作伙伴路径:使用伙伴节点访问由本地节点托管的 LUN 的任何路径。  LUN 位于主动 - 主动群集中。
  • 非主路径:与伙伴路径、代理路径和辅助路径同义。  所有这些都是非主路径的示例。
  • FCP 目标端口:向主机提供 FCP 服务的光纤通道接口。
  • 虚拟目标互连( Vtic ):启动程序组列表中显示的虚拟 FCP 目标接口。Vtic 用于指示启动程序有权访问辅助路径。


问题说明
NetApp 主动 - 主动集群存储控制器允许通过集群两个节点上的 FCP 端口访问逻辑单元( LUN )。在正常情况下,主机应仅通过托管 LUN 的集群节点上的端口访问 LUN 。利用托管 LUN 的集群节点端口的 I/O 路径称为主路径或优化路径。利用伙伴集群节点的 I/O 路径称为辅助路径、伙伴路径或非优化路径。仅当主端口不可用时,才应通过伙伴群集节点访问 LUN 。

使用辅助路径访问 LUN 表示以下一种或两种情况:主机和存储控制器之间的主路径出现故障、或者主机 MPIO 软件配置不正确。这些情况表明 SAN 的冗余性和性能已受到影响。应立即采取纠正措施以恢复到存储控制器的主路径。

在某些情况下,此错误也可能由非 I/O 活动(例如 MPIO 路径管理操作或主机集群软件)触发、该软件会对 LUN 执行状态检查。如果确定其中任何一种情况负责触发错误、则可以采取步骤来减少此活动或为触发条件指定自定义阈值。从 Data ONTAP 7.2.2 开始、非读取和非写入操作不会触发此错误消息。

在存储控制器启动、存储控制器集群接管和恢复操作或主机重新启动后、 FCP 合作伙伴路径配置错误可能会发生。这些错误实例是正常的,通常在主机的 MPIO 软件检测到更改的路径状态后进行更正。如果这些错误不是连续的、则可以忽略这些错误。Data ONTAP 7.2.2 和更高版本具有增强功能、可防止在存储控制器启动或集群接管或恢复操作之后出现此错误的假触发器。

NetApp 现在建议调整阈值、控制 FCP 合作伙伴路径配置错误消息的触发器、以避免出现虚假和不必要的情况。请在存储控制器集群的两个节点上执行以下命令。

options lun.use_partner.cc.warn_limit 300
options lun.use_partner.cc.bytes 2457600


第一个选项将时间间隔从 10 秒增加到 300 秒,第二个选项将传输的字节阈值从 512000 字节增加到 2457600 字节。  
如果在进行这些更改后仍显示警告消息,请按照本文档其余部分中概述的步骤操作。

下图说明了通过主路径和非主路径进行 I/O 访问的情况。

 

确定受影响的 LUN 和主机
以下步骤提供了一个过程、可用于识别负责触发错误的 I/O 访问。识别 I/O 访问的过程从通过伙伴节点的 FCP 目标端口识别接收 I/O 的 LUN 开始。识别 LUN 后、下一步是确定执行 I/O 的启动程序接下来,确定托管 LUN 的存储控制器上的 FCP 目标端口。主机应至少有权访问存储控制器集群的每个节点上的一个端口。一旦确定了主机启动程序和主 FCP 目标端口、就可以检查光纤网络的连接是否正确且正常运行、最后检查主机的多路径配置是否正常运行。 

  1. 识别通过伙伴节点的 FCP 目标端口访问的 LUN 。
    a.lun stats -o( LUN 统计信息)
  2. 确定通过合作伙伴路径执行 I/O 的主机启动程序
    1. lun config_check -A ( LUN 配置检查)—输出仅在 AutoSupport 中查看时有效
    2. lun show -v  ( LUN 配置)
    3. igroup show -v  (启动程序组)
  3. 确定可用于访问 LUN 的主存储控制器 FCP 目标端口:
    1. fcp show cfmode  ( FCP CFMode )
    2. fcp show adapters  ( FCP 目标适配器)
  4. 验证主机启动程序与主 FCP 目标端口的连接以及主机 MPIO 软件配置。
  5. 验证是否已从两个集群节点停止使用伙伴路径:
    sysstat -b 1

 过程和示例数据

  1. 确定通过伙伴节点的 FCP 目标端口访问的 LUN 以及操作类型。

    读取和写入的千字节数或执行的非读取和非写入操作数可能会触发错误阈值。非读和非写 SCSI 操作的示例包括 quiry 、 persistent reserve 、 report lun 和 test unit ready 。Data ONTAP 7.2.2 和更高版本不会在非读取和非写入操作中触发此警告。

    AutoSupport 的 LUN 统计部分将显示每个 LUN 的本地路径和合作伙伴路径的读写操作。也可以使用命令获取此输出lun stats -o。也可以使用命令来清零计数器lun stats -z、该命令有助于确定计数器的增加频率。的输出lun stats可能显示没有计数器超过阈值。  在这种情况下、合作伙伴路径访问的 LUN 可能位于伙伴节点上。确定受影响的 LUN 后、继续执行步骤 2 以找到负责的主机。

    lun stats -oAutoSupport 输出示例:

    ===== LUN STATISTICS =====
    /vol/esx_luns/guest001.lun  (32 minutes, 39 seconds)
        Read (kbytes)   Write (kbytes)  Read Ops  Write Ops  Other Ops  QFulls  Partner Ops Partner KBytes
        13510011357     12648494826     707504214 932701251  251651     0       263445977   2123914089


    在上面的示例中、合作伙伴运营和合作伙伴 KB 数已超过给定时间间隔内的阈值。应以这种方式识别访问 LUN 的主机并评估访问的理由。可能的解决方案是限制访问、或调整主机 MPIO 软件、使其不会尝试通过合作伙伴路径进行访问。
     
  2. 确定通过合作伙伴路径执行 I/O 的主机启动程序。
     
    使用步骤 1 中标识的 LUN 、通过使用启动程序组映射交叉引用 LUN 配置来定位可疑启动程序。可以在 AutoSupport 部分中找到此信息、标题为 LUN 配置并使用该命令lun show -v。一旦确定 LUN 的启动程序组、属于启动程序组成员的启动程序 WWPN 就可以在 AutoSupport 部分启动程序组和命令中找到igroup show -v

    示例 lun show -vigroup show -v AutoSupport 中的示例:

    ===== LUN CONFIGURATION =====
     /vol/esx_luns/guest001.lun          2.0t (2194459852800) (r/w, online, mapped)
      Comment:
      Serial#: XXXXXXXXX
      Share: none
      Space Reservation: enabled
      Multiprotocol Type: linux
      Maps: igroupA=0 igroupB=0

    ===== INITIATOR GROUPS =====
        igroupA (FCP) (ostype: vmware):
            21:00:00:e0:8b:92:da:ef (logged in on: 0a, vtic)
        igroupB (FCP) (ostype: vmware):
            21:00:00:e0:8b:82:d0:09 (logged in on: 0c, vtic)


    在此示例中、 LUN/vol/esx_LUNs/guest001.LUN 映射到两个启动程序组: igroupa 和 igroup b 。每个启动程序组包含一个 WWPN 。这些 WWPN 属于不同的端口、这些端口可能位于同一台主机上或位于不同的主机上、具体取决于部署情况。  启动程序组中标识的 WWPN 包含一个可疑启动程序列表、这些启动程序可以通过非主路径访问 LUN 。  需要在步骤 4 中检查此可疑启动程序列表。

    为了减少可疑列表、 Data ONTAP 7.2.2 和更高版本提供了使用合作伙伴路径执行 I/O 访问的启动程序列表。可以在 AutoSupport 的 LUN 配置检查部分中找到此信息以及该命令的输出lun config_check -A(注意: LUN Config_Check-A 的输出仅在 AutoSupport 中包含时有效)。lun config_check -v除了通过合作伙伴路径列出启动程序访问权限之外、还将检查并显示各种其他可能的错误配置。在继续操作之前,应先解决输出中出现的任何问题。

    lun config_check -AAutoSupport 示例:

    ===== LUN CONFIG CHECK =====

    The following FCP Initiators are sending Read/Write i/o over the
    FCP Partner Paths during the last 15 seconds
    WWPN                      Partner's Port       ops         bytes
    21:00:00:e0:8b:25:0c:10               0c        34         17408
    21:00:00:e0:8b:25:03:66               0c       186       1117696
    21:00:00:e0:8b:25:0c:18               0c      1618      10866688
    21:00:00:e0:8b:25:0b:b0               0c      1693      13290496


    在此示例中,四个启动程序通过伙伴路径访问 LUN 。对于 MPIO 路径管理而言,某些操作是可接受的、也是正常的。高操作计数和字节计数启动器是必须检查的、以解决 MPIO 配置问题的启动器。 
     
  3. 确定可用于访问 LUN 的主存储控制器 FC 目标端口。

    在主动 - 主动存储控制器配置中、主端口与辅助端口将取决于所使用的集群故障转移模式( CFMode )。例如、 single_image cfmode 允许每个 FC 目标端口用于对托管在本地节点上的 LUN 的主路径访问以及对托管在伙伴节点上的 LUN 的伙伴路径访问。有关 CFMode 和端口配置的信息,请参见[1] Data ONTAP 版本的 Data ONTAP 块访问管理指南。

    可以使用命令识别 cfmodefcp show cfmode 。  它也可以位于 AutoSupport 的 FCP CFMode 部分。 

    ===== FCP CFMODE =====
    fcp show cfmode: single_image

     
    可以使用命令和fcp show adapter AutoSupport 部分的 FCP 目标适配器显示 FCP 目标端口。

    本示例显示了使用时的目标适配器cfmode single_image。使用single_image cfmode时,可以使用任一端口访问本地节点和伙伴节点上托管的 LUN 。

    > fcp show adapters
    Slot:                    0c
    Description:             Fibre Channel Target Adapter 0c (Dual-channel, QLogic 2322 (2362) rev. 3)
    Adapter Type:        Local
    Status:                  ONLINE
    FC Nodename:             50:0a:09:80:86:17:c3:ac (500a09808617c3ac)
    FC Portname:             50:0a:09:81:96:17:c3:ac (500a09819617c3ac)

    Slot:                    0d
    Description:             Fibre Channel Target Adapter 0d (Dual-channel, QLogic 2322 (2362) rev. 3)
    Adapter Type:            Local
    Status:                  ONLINE
    FC Nodename:             50:0a:09:80:86:17:c3:ac (500a09808617c3ac)
    FC Portname:             50:0a:09:82:96:17:c3:ac (500a09829617c3ac)
  1. 验证两个集群节点是否已停止使用伙伴路径。

    sysstat -b 1该命令可用于监控 SAN 相关的摘要性能计数器。“合作伙伴”计数器监控使用合作伙伴路径的 I/O 操作和数据传输。监视这些计数器是一种有效的方法,可验证是否已更正合作伙伴路径通信的源。请确保检查两个集群节点是否具有伙伴路径访问权限、因为合作伙伴路径流量可能会从两个节点进入集群。

    CPU   FCP iSCSI Partner  Total    FCP   kB/s   iSCSI   kB/s Partner  kB/s   Disk  kB/s   CP   CP Disk
                                       in    out      in    out      in   out   read write  time  ty util
     0%     0     0       0      0      0      0       0      0       0     0      8    24    0%  -    2%
     0%     0     0       0      0      0      0       0      0       0     0     16     8    0%  -    1%
     0%     0     1       0      1      0      0       1      0       0     0      0     0    0%  -    0%

相关链接: