Users Guide

Table Of Contents
: iDRAC GUI 不支持查看或修改属性。
GPU(加速器)管理
Dell PowerEdge 服务器配有图形处理单元 (GPU)GPU 管理使您可以查看连接到系统的各种 GPU,还可监测 GPU 的功率、温度和
散热信息。
: 这是一项需要许可的功能,仅在具有 iDRAC Datacenter Enterprise 时可用。以下是 Datacenter/Enterprise 许可证提供的属
性,还列出了即使没有这些许可证时的其他属性:
GPU 属性 Datacenter 许可证 Enterprise 许可证
散热指标
GPU 目标温度
GPU 硬件降速最低温度
GPU 关闭温度
内存最高运行温度
最大 GPU 操作温度
散热警报状态
动力制动状态
电源指标
电源设备状况
主板电源设备的状态
遥测
所有遥测报告数据
: 未针对嵌入的 GPU 卡列出 GPU 属性,并且状态被标记为未知
在命令提取数据之前,GPU 必须处于就绪状态。资源清册中的 GPUStatus 字段显示 GPU 的可用性及 GPU 设备是否响应。如果 GPU
状态为“就绪”,则 GPUStatus 显示“正常”,否则状态显示为“不可用”。
GPU 提供多个运行状况参数,可以通过 NVIDIA 控制器的 SMBPB 接口撤销。此功能仅限 NVIDIA 卡。以下是从 GPU 设备检索到的运
行状况参数:
功率
温度
散热
: 此功能仅限 NVIDIA 卡。此信息不适用于服务器可能支持的任何其他 GPU。在 PBI 上轮询 GPU 卡的时间间隔为 5 秒。
主机系统必须安装并运行 NVIDIA 驱动程序才能使用功耗、GPU 目标温度、GPU 降速最低温度、GPU 降低温度、内存最高运行温度
GPU 最高运行温度等功能。如果未安装 GPU 驱动程序,则这些值将显示为 N/A
Linux 中,未使用卡时,驱动程序将向下并卸载卡,以节省电力。在此类情况下,功耗、GPU 目标温度、GPU 降速最低温度、
GPU 关闭温度、内存最高运行温度和 GPU 最高运行温度等功能不可用。应为设备启用持续模式,以避免卸载。您可以使用命令
nvidia-smi -pm 1 来启用此工具。
您可以使用遥测生成 GPU 报告。有关遥测功能的更多信息,请参阅 Telemetry Streaming 页面上的 193
: Racadm 中,您可能会看到具有空值的虚拟 GPU 条目。如果在 iDRAC 查询 GPU 设备中的信息时设备因未准备好而无法响
应,则可能会发生这种情况。请执行 iDRAC racrest 操作以解决此问题。
查看 iDRAC 和受管系统信息 111