Users Guide

Table Of Contents
使用 Redfish 修改闲置服务器检测参数
https://<iDRAC IP>/redfish/v1/Managers/System.Embedded.1/Attributes
使用 WSMAN 修改闲置服务器检测参数
winrm e http://schemas.dmtf.org/wbem/wscim/1/cim-schema/2/root/dcim/DCIM_SystemAttribute -
u:root -p:calvin -r:https://<iDRAC IP>/wsman -SkipCNcheck -SkipCAcheck -encoding:utf-8 -
a:basic
: iDRAC GUI 不支持查看或修改属性。
Identifier GUID-859F5544-F66A-429F-9AA0-AEFE0B719714
Version 4
Status Translation Validated
GPU(加速器)管理
Dell PowerEdge 服务器配有图形处理单元 (GPU)GPU 管理使您可以查看连接到系统的各种 GPU,还可监测 GPU 的功率、温度和
散热信息。
: 这是一项需要许可的功能,此功能只能在拥有 iDRAC Datacenter 许可证时可用。以下属性需要 Datacenter 许可证,即使没
Datacenter 许可证,也会列出其他属性:
散热指标:
GPU 目标温度
GPU 硬件降速最低温度
GPU 关闭温度
内存最高运行温度
最大 GPU 操作温度
散热警报状态
动力制动状态
电源指标:
电源设备状况
主板电源设备的状态
遥测 所有 GPU 遥测报告数据
: 未针对嵌入的 GPU 卡列出 GPU 属性,并且状态被标记为未知
在命令提取数据之前,GPU 必须处于就绪状态。资源清册中的 GPUStatus 字段显示 GPU 的可用性及 GPU 设备是否响应。如果 GPU
状态为“就绪”,则 GPUStatus 显示“正常”,否则状态显示为“不可用”。
GPU 提供多个运行状况参数,可以通过 NVIDIA 控制器的 SMBPB 接口撤销。此功能仅限 NVIDIA 卡。以下是从 GPU 设备检索到的运
行状况参数:
功率
温度
散热
: 此功能仅限 NVIDIA 卡。此信息不适用于服务器可能支持的任何其他 GPU。在 PBI 上轮询 GPU 卡的时间间隔为 5 秒。
主机系统必须安装并运行 NVIDIA 驱动程序才能使用功耗、GPU 目标温度、GPU 降速最低温度、GPU 降低温度、内存最高运行温度
GPU 最高运行温度等功能。如果未安装 GPU 驱动程序,则这些值将显示为 N/A
Linux 中,未使用卡时,驱动程序将向下并卸载卡,以节省电力。在此类情况下,功耗、GPU 目标温度、GPU 降速最低温度、
GPU 关闭温度、内存最高运行温度和 GPU 最高运行温度等功能不可用。应为设备启用持续模式,以避免卸载。您可以使用命令
nvidia-smi -pm 1 来启用此工具。
您可以使用遥测生成 GPU 报告。有关遥测功能的更多信息,请参阅 Telemetry Streaming 页面上的 216
查看 iDRAC 和受管系统信息 123
DRAFT