向现有聚合添加磁盘的最佳实践是什么?
不可不使用
适用场景
- ONTAP 9
- FAS 系统
问题解答
警告:
|
- 即使在执行磁盘固件更新并将效率尽力服务更改为后台后、聚合上的磁盘利用率也会导致高延迟、因此需要向聚合中添加更多磁盘。
- 为了获得最佳性能、建议向现有RAID组添加大小相等的新RAID组。
- 如果无法添加新的RAID组、则至少应同时向现有RAID组添加三个或更多磁盘。
- 这样、存储系统就可以跨多个磁盘写入新数据。
- 必须 执行强制重新分配、以便在 RAID组之间均匀分布数据、否则 大多数 新写入操作都会写入新磁盘、从而导致工作负载不平衡。
- 如果未完成重新分配、性能将会下降、并且 状态 将如下所示。
- WAFL最终会自行修复、但这可能需要数月的时间。
::> set advanced ::*> node run -node node_1 statit -b /* wait 60s */ ::*> node run -node node_1 statit -e ... disk ut% xfers ureads--chain-usecs writes--chain-usecs cpreads-chain-usecs greads--chain-usecs gwrites-chain-usecs /aggr_data/plex0/rg0: 0a.10.6 32 84.50 0.16 3.65 5014 40.70 58.65 357 43.63 55.17 217 0.00 .... . 0.00 .... . 0a.10.8 32 83.93 0.17 3.55 4777 40.51 58.94 356 43.25 55.71 216 0.00 .... . 0.00 .... . 0a.10.10 51 111.80 29.66 10.65 1862 26.92 29.12 772 55.22 14.13 677 0.00 .... . 0.00 .... . 0a.10.12 52 112.22 30.35 10.71 1825 26.91 29.93 735 54.96 14.16 689 0.00 .... . 0.00 .... . 0a.10.14 53 112.81 30.63 10.34 1956 27.08 29.59 777 55.10 14.31 697 0.00 .... . 0.00 .... . 0a.10.16 54 114.66 31.85 10.76 1902 27.46 30.05 783 55.34 14.45 680 0.00 .... . 0.00 .... . 0a.10.18 53 114.26 30.45 11.23 1781 27.84 30.42 784 55.97 14.68 675 0.00 .... . 0.00 .... . 0a.10.20 52 113.79 29.10 8.11 2510 27.69 30.14 744 56.99 14.33 673 0.00 .... . 0.00 .... . 0a.10.24 53 116.80 29.56 8.08 2443 28.82 30.73 754 58.41 14.49 657 0.00 .... . 0.00 .... . 0a.10.26 54 117.57 31.09 8.67 2353 28.63 30.12 752 57.85 14.49 661 0.00 .... . 0.00 .... . 0a.10.28 55 118.71 30.31 9.07 2323 29.45 30.87 752 58.95 14.71 661 0.00 .... . 0.00 .... . 0a.10.30 50 106.95 28.86 8.86 2197 24.60 29.18 704 53.49 14.21 668 0.00 .... . 0.00 .... . 0a.10.36 78 154.61 48.59 11.54 2426 45.44 39.71 863 50.57 20.24 479 0.00 .... . 0.00 .... . 0a.10.38 75 158.05 61.35 8.91 2969 39.69 29.13 914 47.01 15.24 666 0.00 .... . 0.00 .... . 0a.10.40 75 156.63 60.31 9.21 2918 39.65 29.75 903 46.67 15.51 680 0.00 .... . 0.00 .... . 0a.10.42 75 158.28 60.53 9.48 2803 40.21 29.83 896 47.54 15.47 666 0.00 .... . 0.00 .... . 0a.10.44 76 159.14 67.07 7.15 3959 38.21 39.97 682 43.86 19.47 572 0.00 .... . 0.00 .... .
应如何进行重新分配?
FlexVol
- 强制重新分配会忽略优化阈值、并将数据完全重新写入磁盘、这一点与正常的重新分配过程不同。
- 尽管这样可以改进布局、但
[-force|-f [true]]
由于聚合负载过重、常规使用重新分配并不是最佳做法 - 此外,由于所有数据均已优化,因此不能对具有现有Snapshot副本的卷运行强制重新分配,除非
[ -space-optimized|-p [true] ]
同时使用物理重新分配方法()。cluster::> reallocate start -vserver svm0 -path /vol/vol1 -f true -p true
- 一次可以运行一个作业、如果存在性能开销、则可以添加另一个作业。
FlexGroup
- 重新分配可以在 聚合级别完成,但通常磁盘周期成本高昂,需要几天或几周的时间。
- 由于无法重新分配卷、因此需要重新分配聚合:
cluster::> storage aggregate reallocation start -once true -aggregate <aggr_name>
卷移动
- 如果有可用空间、则卷移动将在可用RAID条带之间均匀地调整数据结构。
- 理想情况下、如果可以清空聚合并对其进行再融合、则最佳布局将是该聚合。
- 需要考虑的一个小问题是 ,如果使用此方法,则会进行永无止境的deswzzler扫描。
需要考虑的要点
- 最好先查看聚合下的Active IQ Unified Manager、然后查看性能、再查看节点性能、以确定最安静的时间、例如下午5点之后或周末。
- 重新分配会发生原因产生额外开销、因此必须考虑这一点。
- 发生原因估计每个作业的性能开销为10%到30%、但这只是一个估计值、很容易花费更多或更少的时间。
- 在磁盘利用率较高的情况下、一种更具衡量性的方法是先处理最繁忙的卷、在聚合中以最安静的状态工作。