Dell EMC PowerStore 监视系统 版本 2.x 6 月 2021 年 Rev.
注意、小心和警告 注: “注意”表示帮助您更好地使用该产品的重要信息。 小心: “小心”表示可能会损坏硬件或导致数据丢失,并告诉您如何避免此类问题。 警告: “警告”表示可能会导致财产损失、人身伤害甚至死亡。 © 2020 年 - 2021 年 Dell Inc. 或其子公司。保留所有权利。Dell、EMC 和其他商标是 Dell Inc.
目录 其他资源.........................................................................................................................................4 章 1: 监视系统概览........................................................................................................................... 5 概述......................................................................................................................................................................................... 5 章 2: 管理警报..............................
序言 为了不断改进,我们将定期发布软件和硬件产品的修订版。本文档中介绍的一些功能可能不被当前使用的软件或硬件的所有版本支 持。本产品发行说明提供了有关产品功能的新信息。如果某产品不能正常运行或其功能与本文档的描述不符,请与您的服务提供商 联系。 从何处获得帮助 可以按如下方式获取支持、产品和许可信息: ● 产品信息 有关产品和功能的文档或发行说明,请访问 PowerStore 文档页面,地址为 https://www.dell.com/powerstoredocs。 ● 故障排除 有关产品、软件更新、许可和服务的信息,请转到 https://www.dell.com/support,并找到相应的产品支持页面。 ● 技术支持 如需技术支持,如有服务请求,请转至 https://www.dell.
1 监视系统概览 本章包括: 主题: • 概述 概述 本文档介绍 PowerStore Manager 中提供的功能,用于监视和优化各种 PowerStore 一体机。 监视功能 PowerStore Manager 提供以下特性和功能来监视您的系统: ● ● ● ● 事件功能,用于通知系统中何时发生更改。 警报功能,用于通知您发生了需要您注意的事件。 容量图表显示 PowerStore 群集和资源的当前容量使用情况。 性能图表指明系统运行状况,以便可以在问题发生前预见到问题。 优化特性和功能 当您监视系统时,警报通知可提供一种机制来响应问题并缩短故障处理时间。 了解系统容量的使用方式之后可以: ● 提醒您哪些资源使用了最多的存储空间。 ● 帮助您在各种可用存储之间平衡负载。 ● 指明何时可能需要向群集中添加更多存储。 最后,如果发生需要进一步进行故障处理的事件,PowerStore 可以使用一种机制来收集支持材料,从而帮助分析和解决问题。 监视系统概览 5
2 管理警报 本章包括: 主题: 事件和警报 监视警报 配置电子邮件通知首选项 暂时禁用警报通知 配置 SNMP 关键信息横幅 系统检查 远程日志记录 • • • • • • • • 事件和警报 事件提供了有关系统更改的信息。警报是需要注意的事件。大部分警报都表明系统中存在问题。系统将在控制面板的 Alerts 卡中显 示继续存在的警报。您还可以从对象详细信息页面上的 Alerts 卡查看和监视群集中各个对象的警报,如设备、存储资源或虚拟机。 要查看未达到警报级别的事件,请转至 Monitoring > Events。 以下属性适用于事件和警报: 表.
表. 2: 其他警报属性 (续) 属性 应用对象 说明 通知 警报 警报是否触发了电子邮件通知。 服务与支持 警报 支持和故障处理资源的链接。 关联事件 警报 与警报相关的事件。 查看事件和警报时,您可以按出现的日期和时间、对象类型和描述进行筛选。您还可以将警报导出到 .csv 文件,并确认您已看到警 报。 已清除警报 当警报不再具有相关性或已解决时,系统将在无用户干预的情况下清除该警报。已清除的警报将从默认视图中隐藏,但可以通过选 择 Alerts 卡上的 Include cleared alerts 来查看。 已确认警报 用户确认警报后,该警报将从不可见警报或新警报计数中删除。确认警报不代表问题已得到解决。已确认的警报将从默认视图中隐 藏,但可通过选择 Alerts 卡上的 Include acknowledged alerts 来查看。 监视警报 PowerStore Manager 在多个级别(从整个群集到各个对象)提供警报视图。 关于此任务 警报页面每隔 30 秒自动刷新一次。 步骤 1.
2. 要访问 SMTP 服务器设置,请将状态更改为 Enabled。 3. 添加发送通知所用的 SMTP 服务器地址和电子邮件地址,然后单击 Apply。 (可选)发送测试电子邮件,验证 SMTP 服务器设置是否正确。 4. 选择 Settings 图标,然后选择 Users 部分中的 Email Notifications。 5. 要添加电子邮件收件人,请单击 Email Subscribers 区域中的 Add,然后键入要向其发送警报通知的电子邮件地址。 添加地址时,您可以选择发送到该地址的警报通知的严重性级别。 (可选)要验证电子邮件地址是否有效,请选择目标电子邮件地址,然后单击 Send Test Email。 暂时禁用警报通知 您可能希望在特定过程中禁用警报通知,例如在软件升级或支持过程中。 步骤 1. 在 Settings 页面上,选择 Support 部分中的 Disable Support Notifications。 2. 选择要为其暂停通知的设备,然后单击 Modify。 3.
注: 根据所选的安全级别,将显示其他字段。 ■ 对于级别“None”,仅显示 Username。 ■ 对于级别 Authentication only,Password 和 Authentication Protocol 将与 Username 一起显示。 对于级别 Authentication and privacy,Password、Authentication Protocol 和 Privacy Protocol 将与 Username 一起显示。 ○ Username 注: 选择安全级别 None 时,用户名必须为空。选择安全级别 Authentication only 或 Authentication and privacy 时,用户名是发送消息的 SNMPv3 用户的安全名称。SNMP 用户名最多可包含 32 个字符,可包括字母数字字符(大 写字母、小写字母和数字)的任意组合。 ○ Password ■ 注: 选择安全级别 Authentication only 或 Authentication and privacy 时,系统将确定密码。 ○ Authentication Proto
步骤 1. 选择系统检查选项卡。 2.
3 监视容量 本章包括: 主题: • • • • • • 关于监视系统容量 容量数据收集和保留期 容量预测和建议 PowerStore Manager 中的容量数据位置 开始监视容量使用情况 数据节省功能 关于监视系统容量 PowerStore 提供各种当前使用情况和历史指标。指标可以帮助您监视系统资源所使用的空间量,并确定未来的存储需求。 可以通过 PowerStore CLI、REST API 和 PowerStore Manager 查看容量数据。本文档介绍如何从 PowerStore Manager 查看此信息。 有关具体的容量指标定义和计算,请参阅 PowerStore 联机帮助。 监视当前使用容量 您可以使用 PowerStore Manager、REST API 或 CLI 来监视群集的当前容量使用情况,以及监视存储容器、卷、文件系统和设备等各 个存储资源。此外,通过 PowerStore X 型号实施,您可以查看虚拟机和虚拟卷的容量使用情况。 注: 当设备处于空间不足 (OOS) 模式时,会启用容量指标监视。通过这种方式,可以监视因删除未使用的快照和存储资源而释放 的空间量。 监视历
下表显示了每个时间周期的保留期以及各自适用的资源: 表. 5: 实时容量数据保留期 时间间隔 保留期 资源 5 分钟 1天 群集、设备、卷组、卷、VVols 和虚拟机 1 小时 30 天 群集、设备、卷组、卷、VVols 和虚拟机 1天 2年 群集、设备、卷组、卷、VVols 和虚拟机 历史容量数据收集和保留期 数据收集开始后,将会显示历史容量。图表中显示一年的容量使用数据,并且数据将保留最长 2 年。当有可用的新数据时,历史图 表会自动向左滚动。 容量预测和建议 PowerStore 使用历史容量指标来预测设备或群集何时可能会耗尽存储空间,并提供有关如何释放系统资源的建议。 容量预测 用于预测系统容量警报的阈值级别有三种。阈值为默认设置且不能更改。 表.
容量建议 PowerStore 还提供修复流程建议。修复流程提供了释放群集或设备空间的选项。Alerts 面板中提供了 Repair Flow 选项,其中包 括: 表. 7: 容量建议 选项 描述 辅助迁移 提供要从一个设备迁移到另一个的卷或卷组建议。迁移建议基于设备容量和运行状况等因素生成。您还可以选 择在群集或设备容量将满时根据自己的计算手动迁移卷或卷组。 虚拟卷 (VVols) 或文件系统不支持迁移。 具有多个设备的单个群集中支持迁移。 达到重大阈值后,PowerStore Manager 中将提供迁移建议。不过,您可以随时使用 PowerStore Management REST API 来查看迁移建议。 清理系统 删除不再使用的系统资源。 添加更多设备 为您的设备购买额外存储。 建议将在 24 小时后过期,以确保建议始终保持最新。 PowerStore Manager 中的容量数据位置 您可以从以下位置的 PowerStore ManagerCapacity 卡和视图查看 PowerStore 系统和系统资源的容量图表: 表.
历史容量使用情况和建议 您可以使用历史图表来评估群集的空间利用率趋势,并查看有关未来容量存储需求的建议。您可以查看过去 24 小时、月或年的历史 数据。此外,还可以使用您选择的工具打印图表进行演示,或将数据导出为 .
报告容量节省 系统将使用独特的数据指标报告从数据减少中获得的容量节省。这个独特的数据指标适用于卷及其关联克隆和快照。 精简资源调配 存储资源调配是分配可用驱动器容量以满足主机和应用程序的容量、性能和可用性要求的过程。在 PowerStore 中,卷和文件系统都 经过精简资源调配,以优化可用存储的使用。 精简资源调配的工作原理如下: ● 在创建卷或文件系统时,系统会为存储资源分配初始数量的存储。此调配大小代表存储资源可以增长到的最大容量(在不增加的 情况下)。系统仅保留所请求大小的一部分,称为初始分配。请求的存储资源大小称为订阅数量。 ● 系统将仅在写入数据时分配物理空间。当写入存储资源的数据量达到存储资源的调配大小时,存储资源将显示为已满。由于调配 的空间并未在物理上分配,因此多个存储资源可以订阅通用存储容量。 精简资源调配允许多个存储资源订阅通用存储容量。因此,它允许组织最初先购买较少的存储容量,并根据实际的存储使用情况按 需增加可用驱动器容量。当系统仅分配每个存储资源请求的一部分物理容量时,它会保留剩余的存储空间供其他存储资源使用。 系统将使用精简节约指标(适合于卷族和文件系统)报告通过精简资源调配节省
4 监视性能 本章包括: 主题: 关于监视系统性能 性能数据收集和保留期 PowerStore Manager 中的性能数据位置 性能策略 使用性能图表 • • • • • 关于监视系统性能 PowerStore 为您提供了多种指标,可以帮助您监视系统的运行状况,在问题发生前预见到问题,并缩短故障排除时间。 您可以使用 PowerStore Manager、REST API 或 CLI 来监视群集以及各个存储资源(例如卷、文件系统、卷组、设备和端口)的性 能。此外,通过 PowerStore X 型号 实施,您可以查看虚拟机的计算性能,以及虚拟机和虚拟卷的存储性能。 您可以打印性能图表并将指标数据下载为 PNG、PDF、JPEG 或 .
表.
使用性能图表 您可以使用性能图表来自定义显示内容。打印性能图表或导出要在备用应用程序中显示的性能数据。 当前时间段的性能摘要始终显示在“Performance”卡的顶部。 群集和群集资源的性能图表采用不同的方式显示。 使用群集的性能图表 选择“Performance”卡后,您可以执行以下操作: 图 2: 群集性能图表 1. 2. 3. 4. 5.
图 3: 设备/节点性能图表 1. 2. 3. 4. 5. 6. 7. 选择是查看群集的 Overall 还是 File 级别的性能。 从 Category 列表中选择要显示的指标类别。将为在 Show/Hide 列表中选择的设备和节点显示图表。 从 Show/Hide 列表中选择或清除要显示或隐藏的设备和节点。 从 Timeline 列表中选择要显示的历史性能数据量。 将图表下载为 .png、.jpg、.pdf 文件或将数据导出到 .csv 文件。 查看图表中的历史性能数据,或将鼠标悬停在折线图上的某个点以显示该时间点的指标值。 选择或清除要在图表中显示或隐藏的指标值类型。 注: 使用鼠标选择图表的某个部分,以放大图表。 以下选项可用于查看其他群集资源(如卷组)的性能指标: 图 4: 卷组性能图表 1. 选择要显示其性能指标的指标类别。将为所选的每个指标类别显示图表。 2. 从 Timeline 列表中选择要显示的历史性能数据量。 3. 将图表下载为 .png、.jpg、.pdf 文件或将数据导出到 .
4. 查看图表中的历史性能数据,或将鼠标悬停在折线图上的某个点以显示该时间点的指标值。 5. 查看当前指标值。 6.
5 收集系统数据 本章包括: 主题: • • 支持材料收集 收集支持材料 支持材料收集 您可以收集支持材料,以帮助对系统中的设备进行故障排除。 根据您选择的选项,支持材料可能包括系统日志、配置详细信息及其他诊断信息。使用此信息来分析性能问题,或将其发送给服务 提供商,以便它们可以诊断并帮助您解决问题。此过程不会收集用户数据。 您可以收集一个或多个设备的支持材料。启动收集时,始终在设备级别收集数据。例如,如果您请求收集某个卷,则系统会收集包 含该卷的设备的支持材料。如果您请求收集多个卷,则系统会收集包含这些卷的所有设备的支持材料。 您还可以在支持材料收集中包含高级收集选项中的附加信息。收集附加信息所需的时间会长于默认支持材料收集,并且数据收集的 大小会大很多。请根据服务提供商的要求选择此选项。默认情况下,支持材料收集使用 essentials 配置文件。请使用 svc_dc 服务脚 本收集其他配置文件的支持材料。有关 svc_dc 服务脚本和可用配置文件的详细信息,请参阅 PowerStore 服务脚本指南。 注: 系统一次只能运行一个收集作业。 您可以对收集的支持材料执行以下操作: ● ● ● ● 查