什么是性能存档以及它们是如何触发的?
适用于
ONTAP 9
问题解答
- 在每个系统上收集和存储(归档)性能内容:
- 记录节点和卷性能统计等指标。
- 默认情况下,数据在根卷上保留 28 天。
- 数据会不断记录,因此不会启动或停止高级日志记录。
- 为了降低延迟,开销最小。
- 使用 AutoSupport(tm) 基础设施,可以创建性能存档并将其上传到 NetApp。
- 性能存档不会取代性能监控或帮助调整大小,因为它们旨在解决 ONTAP 性能问题。
如何上传性能存档?
- 确认 AutoSupport 传输是 HTTP 或 HTTPS:
Cluster::> autosupport show -fields transport
node transport
--------------- ---------
node1 https- 性能存档通常为 50 MB 或更大,因此如果传输为 SMTP,ONTAP 将被硬编码为不传输。
- 要从 SMTP 切换到允许传输较大文件大小的 HTTPS,请使用以下命令:
system node autosupport modify -node * -transport https
- 如果传输是 SMTP,并且其他方法不工作或在环境中不被允许,请使用手动方法和 7zip 文件或OneCollect来收集数据。
- 运行
system node autosupport invoke-performance-archive
命令:Cluster::> system node autosupport invoke-performance-archive -start-date "11/31/2022 06:00:00" -duration 4h -case-number <case_number> -node *
- 以下是该命令的选项:
-start-date <"MM/DD/YYYY HH:MM:SS">
- 时区将是文件管理员的时间,如
event log show
输出或 EMS 日志所示。
- 时区将是文件管理员的时间,如
-duration <[ h][ m][ s]> (or -end-date)
-node *
-case-number
注:
- 请注意,每次采集的最长持续时间为 6 小时,建议的采样时间为 4 小时。
- 如果时间少于 2 小时,则会错过一些小时计数器。
- 在
-start-date
中输入的时间应反映 filer 所在时区的时间。 -start-date
必须至少为过去的指定-duration
小时数,否则不会收集完整的时间范围。- 不会显示指示未收集完整
-duration
的错误消息。
- 最好从整点开始,到整点结束,以捕获每小时的计数器。
- 必须触发整个集群,因为工作负载统计数据是跨集群测量的。
- 理想情况下,建议获取性能事件前后一小时的数据。
- 建议日期格式使用引号。
- 使用以下命令查看性能存档上传进度:
::> autosupport history show-upload-details -node <node name> -seq-num <seq-num>
如果性能存档不起作用怎么办?
- 使用 ONTAP AutoSupport 解决方案指南对自动支持进行故障排除。
- 验证是否已启用性能存档,以及您请求的存档日期是否小于保留期(28 天默认):
::> set diagnostic
::*> statistics archive config show
验证字段:
Is the Performance Archive Enabled?: true
如果为 false,通过运行以下命令启用它:
::*> statistics archive config modify -is-enabled true
注意: EMS 事件也将报告以下消息:
::*> event log show -event perf*
Time Node Severity Event
------------------- ---------------- ------------- ---------------------------
INFORMATIONAL perf.ccma.off: Performance archiver is not enable
- 请确保已启用 AutoSupport 的
state
和support
参数。如果没有,请使用autosupport modify
命令进行允许。
aff200-2n-dal-1::> autosupport show -node * -fields state,support
node state support
------------- ------ -------
aff200-dal-1a enable disable
aff200-dal-1b enable disable
2 entries were displayed.
失败示例:
aff200-2n-dal-1::> autosupport show -instance
Node: aff200-dal-1a
State: enable
SMTP Mail Hosts: mailhost
From Address: Postmaster
List of To Addresses: -
(DEPRECATED) List of Noteto Addresses: -
List of Partner Addresses: -
Send AutoSupport Messages to Vendor Support: disable
Protocol to Contact Support: https
Support URL for HTTP/HTTPS: support.netapp.com/asupprod/post/1.0/postAsup
Support URL for HTTP/S PUT: support.netapp.com/put/AsupPut
Support Proxy URL:
Support Address: autosupport@netapp.com
Hostname Subject: false
(DEPRECATED) NHT Enable: true
Performance Data Enable: true
aff200-2n-dal-1::> system node autosupport invoke-performance-archive -start-date "10/15/2024 15:00:00" -duration 1h -node aff200-dal-1a -uri "file:///mroot/etc/log/autosupport/perfachivefile1"
The AutoSupport was successfully invoked on node "aff200-dal-1a" (sequence number: 134).
AutoSupport will be saved to mroot/etc/log/autosupport/perfachivefile1.7z.
aff200-2n-dal-1::> autosupport history show -node aff200-dal-1a -seq-num 134
Seq Attempt Percent Last
Node Num Destination Status Count Complete Update
------------ ----- ----------- -------------------- -------- -------- --------
aff200-dal-1a
134
retransmit ignore - - 10/15/2024 16:17:52
为什么需要perfstat?
- 支持人员将要求提供 perfstat。
- 在 ONTAP 9.5 之前的版本上,可能缺少一些数据,支持人员将要求提供 perfstat。
- 仅在支持人员要求时收集。
- 有时,销售团队可能会要求收集性能数据以进行规模调整。
存储管理员如何查看性能存档中的内容?
- Active IQ Unified Manager 利用 存储在性能存档中的基础数据集。
- 其他工具(如 Harvest 和 Cloud Insights)也可提取相同的数据并可以使用
- 数据是无法手动查看的二进制文件,必须使用上述工具之一
性能测试应运行多长时间?
- 为了获得最佳结果,建议确保性能测试运行 至少 10-15 分钟。
- 但是,在更长的时间内运行测试会更好,因为它允许更全面的数据收集和测量。
- 这种延长的持续时间有助于捕获在持续工作负载条件下更准确的系统性能表现。
追加信息
additionalInformation_text