DELL服务器硬件报错及对应的解决方法(R720)
前言
由于我们的服务器的型号较多,前面板的报错的信息的格式也是多样的,下面是从网上整理的DELL R720的报错及对应的解决方法。
正文
代称含义
特定的系统组件 name
组件号 number
位置 bay
AMP0302
> The system board <name> current is greater than the upper warning threshold.
> 系统板 <name> 电流超出适宜范围
操作
审查系统电源策略。
检查系统日志确认电源相关故障。
审查系统配置更改。
AMP0303
System board <name> current is outside of range.
系统板 <name> 电流超出适宜范围
操作
审查系统电源策略。
检查系统日志确认电源相关故障。
审查系统配置更改。
ASR0000
The watchdog timer expired.
操作系统或应用程序在超时时段内通信失败
操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
ASR0001
The watchdog timer reset the system.
操作系统或应用程序在超时时段内通信失败,系统被重设
操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
ASR0002
The watchdog timer powered off the system.
操作系统或应用程序在超时时段内通信失败,系统被关闭
操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
ASR0003
The watchdog timer power cycled the system.
操作系统或应用程序在超时时段内通信失败,系统在关闭后再次开启。
操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。
BAT0002
The system board battery has failed. Check battery.
系统板电池失效。
操作
更换电池。
BAT0017
The <name> battery has failed. Check battery.
电池 <name> 可能出现缺失、故障因为温度问题导致无法充电。
操作
检查系统风扇。
如非风扇问题,更换电池。
CPU0000
CPU <number> has an internal error (IERR).
CPU <number> 出现内部错误.也许异常出现在处理器之外
操作
审查系统事件日志和操作系统日志。
CPU0001
CPU <number> has a thermal trip. Check CPU heat sink.
CPU <number> 出现热断路,检查 CPU 散热器
操作
检查风扇故障日志。
如果未检测到风扇故障,请检查进气孔温度(若适用)并重新安装处理器散热片
CPU0005
CPU <number> configuration is unsupported. Check CPU or BIOS revision.
CPU <number> 配置受支持,检查 CPU 或 BIOS 修订版本。系统无法引导,或正在降级运行。
操作
检查所支持的处理器类型的技术规格。
CPU0010
CPU <number> is throttled.
因为温度或电源情况导致 CPU<number>被节流。
操作
查阅系统日志排查电源或温度异常。
CPU0023
CPU <number> is absent. Check CPU.
CPU <number> 缺失,检查 CPU。
操作
验证处理器安装。
如果存在,则重新安装处理器。
CPU0204
CPU voltage is outside of range. Re-seat CPU.
CPU 电压超出范围,重新安装 CPU。电压超出容许范围可能损坏电气组件,或导致系统关闭。
操作
关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
CPU0700
CPU <number> initialization error detected. Power cycle system.
检测到 CPU <number> 初始化错误,系统电源关闭然后打开。
操作
关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
CPU0701
CPU protocol error detected. Power cycle system.
检测到 CPU 协议错误,系统电源关闭然后打开
操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
CPU0702
CPU bus parity error detected. Power cycle system.
检测到 CPU 总线奇偶校验错误,系统电源关闭然后打开。
操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
CPU0703
CPU bus initialization error detected. Power cycle system.
检测到 CPU 总线初始化错误,系统电源关闭然后打开。
操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
CPU0704
CPU <number> machine check error detected. Power cycle system.
检测到 CPU <number> 机器检查错误,系统电源关闭然后打开。
操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。
FAN0000
Fan <number> RPM is less than the lower warning threshold.
风扇<number>运行速度超出范围。
操作
卸下并重新安装风扇。
FAN0001
Fan <number> RPM is outside of range. Check fan.
风扇 <number> 运行速度超出范围。
操作
卸下并重新安装风扇。
FAN1201
Fan redundancy lost. Check fans.
风扇发生故障。
操作
卸下并重新安装故障的风扇或安装其它风扇。
HWC1001
The <name> is absent. Check hardware.
硬件<name> 缺失,检查硬件。可能导致系统功能降级。
操作
重新安装或重新连接硬件。
HWC2003
Storage <name> cable or interconnect failure. Check connection.
存储设备 <name> 电缆或互联故障,请检查连接。可能导致系统功能降级。
操作
检查电缆是否存在,重新安装或重新连接。
HWC2005
System board <name> cable connection failure. Check connection.
系统板 <name> 电缆连接故障,请检查连接。可能导致系统功能降级。
操作
检查电缆是否存在,然后重新安装或重新连接。
MEM0000
Persistent correctable memory errors detected on a memory device at location(s) <location>.
在内存设备的位置 <location> 处检测到永久可纠正的内存错误。
操作
重新安装内存。
MEM0001
Multi-bit memory error on <location>. Re-seat memory.
<location> 处的多位内存错误,重新安装内存。可能导致系统功能降级,操作系统和/或应用程序可能会发生故障。
操作
重新安装内存。
MEM0007
Unsupported memory configuration. Check memory <location>.
内存可能安装不正确,配置错误,或者发生故障,内存大小减少。
操作
检查内存配置。重新安装内存。
MEM0701
Correctable memory error rate exceeded for <location>.
内存可能无法操作。
操作
重新安装内存。
MEM0702
Correctable memory error rate exceeded for <location>. Re-seat memory.
<location> 的可纠正内存错误比率超限,重新安装内存。
操作
重新安装内存。
MEM1205
Memory mirror lost on <location>. Power cycle system.
内存可能安装不正确,配置错误,或者发生故障。
操作
检查内存配置。重新安装内存。
MEM1208
Memory spare lost on <location>. Power cycle system.(
内存备份不再可用。
操作
重新安装内存。
MEM8000
SBE log disabled on <location>. Re-seat memory.
<location> 上 SBE 日志已禁用,重新安装内存。
操作
检查系统日志排查内存异常。
重新安装位于 处的内存。
PCI1302
A bus time-out was detected on a component at bus <bus> device<device> function <func>.
总线 <bus> 设备 <device> 功能 <func> 的组件上检测到总线超时。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1304
I/O channel check error detected. Power cycle system.
检测到 I/O 通道检查错误,系统电源关闭然后打开。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1308
PCI parity error on bus <bus> device <device> function <func>. Power cycle system.
总线 <bus> 设备 <device> 功能 <func> 上的 PCI 奇偶校验错误,关闭并打开系统电源。可能导致系统功能降级,PCI 设备可能无法运行,或系统无法运行。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1320
Bus fatal error on bus <bus> device <device> function <func>. Power cycle system.
总线 <bus> 设备 <device> 功能 <func> 上的总线严重错误,关闭然后打开系统电源。可能导致系统功能降级,或系统可能无法运行。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1342
A bus time-out was detected on a component at slot <number>.
插槽 <number> 的组件上检测到总线超时。可能导致系统功能降级,或系统可能无法运行。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1348
PCI parity error on slot <number>. Re-seat PCI card.
插槽 <number> 上的 PCI 奇偶校验错误,重新安装 PCI 卡。可能导致系统功能降级,或系统可能无法运行。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PCI1360
Bus fatal error on slot <number>. Re-seat PCI card.
插槽 <number> 的严重总线错误,重新安装 PCI 卡。可能导致系统功能降级,或系统可能无法运行。
操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。
PDR0001
Fault detected on drive <number>. Check drive.
控制器在磁盘上检测到故障,并已使磁盘脱机。
操作
卸下然后重新安装有故障的磁盘。
Drive <number> removed from disk drive bay <bay>. Check drive.
控制器检测到驱动器已卸下。
操作
验证驱动器的安装。
重新安装有故障的驱动器。
PST0128
No memory is detected. Inspect memory devices.
系统 BIOS 无法检测到系统中的内存。
操作
重新安装内存。
PST0129
Memory is detected, but is not configurable. Check memory devices.
系统 BIOS 检测到内存,但无法基于系统运行对其进行配置。
操作
将系统内存安装与支持的系统内存配置进行比较。
PSU0001
PSU <number> failed. Check PSU.
PSU <number> 故障,检查 PSU。
操作
卸下并重新安装电源设备。
PSU0002
Predictive failure on PSU <number>. Check PSU.
PSU <number> 上的预测故障,检查 PSU。
操作
卸下电源设备并重新安装。
PSU0003
Power input for PSU <number> is lost. Check PSU cables.
PSU <number>电源设备安装正确,但输入源未连接或未起作用。
操作
验证输入源连接到设备。
验证输入源符合电源设备的操作要求。
PSU0006
Power supply is incorrectly configured. Check PSU.
电源设备 未正确配置,检查 PSU。电源设备的输入类型和额定功率应当相同。
操作
安装匹配的电源设备。
PSU0016
PSU <number> is absent. Check PSU.
PSU <number> 电源设备已卸下或出现故障。
操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。
PSU0031
Cannot communicate with PSU <number>. Re-seat PSU.
电源设备可以运行,但是电源设备的监控已降级,系统性能将降级。
操作
卸下并重新安装电源设备。
PSU0032
The temperature for power supply <number> is in a warning range.
电源设备 <number> 的温度在警告范围内。
操作
检查系统运行环境,包括通风和进气孔温度。
查看温度和热组件故障的日志。
PSU0033
PSU temperature outside of range. Check PSU.
PSU 温度超出范围,请检查 PSU。
操作
检查系统运行环境,包括通风和进气孔温度。
查看温度和热组件故障的日志。
PSU0034
An under voltage fault detected on PSU <number>. Check power source.
在 PSU <number> 上检测到电压过低故障,请检查电源。
操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。
PSU0035
Over voltage fault on PSU <number>. Check PSU.
在 PSU <number> 上发生电压高过故障,请检查 PSU。
操作
检查输入电源或重新安装电源设备。
PSU0036
An over current fault detected on PSU <number>. Check PSU.
在 PSU <number> 上检测到电流过高故障,请检查 PSU。
操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。
PSU0037
Fan failure detected on PSU <number>. Check PSU.
在 PSU <number> 上检测到风扇故障,请检查 PSU。
操作
检查风扇是否阻塞。
PSU0076
PSU wattage mismatch; PSU <number> = <value >watts
PSU 功率不匹配;PSU <number> = <value > 瓦特 ,电源设备的输入类型和额定功率应当相同。
操作
安装匹配的电源设备。
PSU1201
Power supply redundancy is lost.
电源设备冗余缺失。
操作
检查输入电源。
重新安装电源设备。
PSU1204
PSU redundancy degraded. Check PSU cables.
PSU 冗余降级,检查 PSU 电缆。电源设备异常、电源设备资源变化,或系统电源资源变化。
操作
检查事件日志排查电源设备故障。
查看系统配置和功耗。
PWR1004
The system performance degraded because power capacity has changed.
因为电源容量变化系统性能已降级。
操作
检查事件日志排查电源设备故障。
查看系统配置和功耗,并据此升级或安装电源设备。
PWR1005
The system performance degraded because the user-defined power capacity has changed.
用户定义的电源设置影响系统运行。
操作
如果是意外导致,查看系统配置变化和电源策略。
PWR1006
System power demand exceeds capacity. System halted.
系统电源需求超出容量,系统已停止。
操作
查看系统配置,升级电源设备或降低系统功耗。
RFM1008
Removable Flash Media <name> failed. Check SD Card.
可移动的闪存介质 <name> 出现故障,检查 SD 卡。SD 卡读取或写入过程中报告了错误。
操作
重置闪存介质。
RFM1014
Removable Flash Media <name> is write protected. Check SD Card.
可移动的闪存介质 <name> 为写保护状态,检查 SD 卡。该卡被 SD 卡上的物理锁进行了写保护,写保护状态的卡无法使用。
操作
如果是意外导致,卸下介质并禁用写保护。
RFM1201
Internal Dual SD Module redundancy is lost. Check SD Card.
其中一块或两块 SD 卡工作不正常。
RFM2001
Internal Dual SD Module <name> is absent. Check SD Card.
未检测到 SD 卡模块或该卡未安装。
操作
如果无意如此,则重新安装 SD 模块。
RFM2002
Internal Dual SD Module <name> is offline.
SD 卡模块已安装,但可能安装不正确,或配置不正确。
操作
重新安装 SD 模块。
RFM2004
Internal Dual SD Module <name> failed. Check SD Card.
SD 卡模块已安装,但配置不正确,或无法初始化。
操作
重新安装 SD 模块,然后卸下并重新安装 SD 卡。
RFM2006
Internal Dual SD Module <name> is write protected.
此模块为写保护,更改可能无法写入到介质。
操作
如果是意外导致,卸下介质并禁用写保护。
SEC0031
Intrusion detected. Check chassis cover.
检测到侵入,检查机箱盖。
操作
关闭机箱,检查系统日志。
SEC0033
Intrusion detected. Check chassis cover.
电源关闭状态下机箱打开。
操作
关闭机箱并验证硬件资源。
检查系统日志。
SEL0006
All event logging is disabled.
当用户禁用所有事件日志。
操作
若是意外导致,则重新启用日志。
SEL0008
Log is full.
日志已满。日志已满时,其他事件将不会写入到日志。早期的事件可能被覆盖并丢失。如果用户禁用了事件记录,也可能显示此消息。
操作
备份并清除日志。
SEL0012
Could not create or initialize the system event log.
无法创建或初始化系统事件日志。系统事件日志初始化失败,将不会捕获平台状态和故障事件,某些管理软件不会报告平台异常。
操作
重新引导管理控制器或 iDRAC。
关闭然后打开输入电源。
SEL1204
Unknown system hardware failure.
未知系统硬件故障。
操作
将系统重新配置为所支持的最低配置。
TMP0118
System inlet temperature is outside of range.
环境气温过低.
操作
检查系统运行环境。
TMP0119
System inlet temperature is outside of range.
环境气温过低。
操作
检查系统运行环境。
TMP0120
System inlet temperature is outside of range.
环境气温过高,或者可能一个或多个风扇发生故障。
操作
检查系统运行环境并查看事件日志排查风扇故障。
TMP0121
System inlet <name> temperature is outside of range. Check Fans.
环境气温过高,或者可能一个或多个风扇发生故障。
操作
检查系统运行环境并查看事件日志排查风扇故障。
VLT0204
System board voltage is outside of range.
系统硬件检测到电压过高或过低的情况。如果连续出现多个电压异常,系统可能切换到故障安全模式。
操作
查看系统日志了解电源设备异常。
将系统重新配置为最低配置,检查并重新安装系统电缆。