Users Guide

Table Of Contents
FPGA 监测
现场可编程门阵列 (FPGA) 设备需要实时温度传感器监视,因为这些设备在使用时会产生大量热量。执行以下步骤以获取 FPGA 资源
清册信息:
关闭服务器电源。
在提升卡上安装 FPGA 设备。
开启服务器。
等待开机自检完成。
登录 iDRAC GUI
导航至系统 > 概览 > 加速器。您可以看到 GPU FPGA 部分。
展开特定 FPGA 组件以查看以下传感器信息:
功耗
温度详细信息
: 您必须具有 iDRAC 登录权限才能访问 FPGA 信息。
: 功耗传感器仅适用于受支持的 FPGA 卡,并且仅在有 Datacenter 许可证时可用。
检查系统的新鲜空气符合性
新鲜空气冷却直接使用外部空气冷却数据中心中的系统。符合新鲜空气标准的系统可以在高于其正常环境工作范围的条件下运行
(温度高达 113°F [45° C ])。
: 某些服务器或服务器配置可能不符合新鲜空气标准。请参阅具体的服务器手册,了解与新鲜空气符合性相关的详细信息,或
者联系 Dell 以获得更多详细信息。
要检查系统的新鲜空气符合性:
1. iDRAC Web 界面中,转至 System(系统) > Overview(概览) > Cooling (散热) > Temperature overview(温度概
览)
此时会显示 Temperature overview(温度概览)页面。
2. 查看新鲜空气部分,该部分指示服务器是否具有新鲜空气符合性。
查看历史温度数据
您可以监测系统在超过正常支持的新鲜空气温度阈值的环境温度下运行的时间百分比。过一段时间即获取系统板温度传感器读数,
以监测温度。系统出厂后,首次打开电源时便开始收集数据。只要系统通电,就一直收集并显示数据。您可以跟踪和存储过去七年
监测的温度。
: 您甚至可以跟踪不具有新鲜空气符合性的系统的入口温度历史。但是,与阈值限制和新鲜空气相关的警告将基于新鲜空气支
持的限制生成。限制为 42ºC 进行警告,47ºC 为严重级。这些值与 40ºC 45ºC 新鲜空气限制对应,偏差 2ºC 以确保准确
性。
将跟踪两个与新鲜空气限制关联的固定温度范围:
警告带 包含系统在超过温度传感器警告阈值 (42ºC) 的情况下运行的持续时间。系统可以在 12 个月时间的 10% 的警告带内操
作。
严重带 包含系统在超过温度传感器严重阈值 (47ºC) 的情况下运行的持续时间。系统可以在 12 个月时间的 1% 的严重带内操
作,也可以在警告带内增长。
收集的数据以图形化形式跟踪以表示 10% 1% 级别。只能在从工厂发货之前清除所记录的温度数据。
如果系统继续在支持的正常温度阈值上运行指定的可运行时间,将生成事件。如果超过指定的运行时间的平均温度大于或等于警告
级别 (>= 8%) 或严重级别 (>= 0.8%),则会在生命周期日志中记录事件,并生成相应的 SNMP 陷阱。事件:
当在过去 12 个月内,温度大于警告阈值的持续时间大于或等于 8% 时,将生成警告事件。
当在过去 12 个月内,温度大于警告阈值的持续时间大于或等于 10% 时,将生成严重事件。
当在过去 12 个月内,温度大于严重阈值的持续时间大于或等于 0.8% 时,将生成警告事件。
当在过去 12 个月内,温度大于严重阈值的持续时间大于或等于 1% 时,将生成严重事件。
您还可以配置 iDRAC 以生成附加事件。有关更多信息,请参阅 设置警报复现事件 页面上的 162 部分。
112 查看 iDRAC 和受管系统信息