DELL服务器硬件报错及对应的解决方法(R720)

前言



由于我们的服务器的型号较多,前面板的报错的信息的格式也是多样的,下面是从网上整理的DELL R720的报错及对应的解决方法。



正文


代称含义


特定的系统组件 name
组件号 number
位置 bay



AMP0302

> The system board <name> current is greater than the upper warning threshold.
> 系统板 <name> 电流超出适宜范围
  • 1
  • 2

操作
审查系统电源策略。
检查系统日志确认电源相关故障。
审查系统配置更改。


AMP0303

System board <name> current is outside of range.
系统板 <name> 电流超出适宜范围
  • 1
  • 2

操作
审查系统电源策略。
检查系统日志确认电源相关故障。
审查系统配置更改。


ASR0000

The watchdog timer expired.
操作系统或应用程序在超时时段内通信失败
  • 1
  • 2

操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。


ASR0001

The watchdog timer reset the system.
操作系统或应用程序在超时时段内通信失败,系统被重设
  • 1
  • 2

操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。


ASR0002

The watchdog timer powered off the system.
操作系统或应用程序在超时时段内通信失败,系统被关闭
  • 1
  • 2

操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。


ASR0003

The watchdog timer power cycled the system.
操作系统或应用程序在超时时段内通信失败,系统在关闭后再次开启。
  • 1
  • 2

操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。


BAT0002

The system board battery has failed. Check battery. 
系统板电池失效。
  • 1
  • 2

操作
更换电池。


BAT0017

The <name> battery has failed. Check battery.
电池 <name> 可能出现缺失、故障因为温度问题导致无法充电。
  • 1
  • 2

操作
检查系统风扇。
如非风扇问题,更换电池。


CPU0000

CPU <number> has an internal error (IERR).
CPU <number> 出现内部错误.也许异常出现在处理器之外
  • 1
  • 2

操作
审查系统事件日志和操作系统日志。


CPU0001

CPU <number> has a thermal trip. Check CPU heat sink.
CPU <number> 出现热断路,检查 CPU 散热器
  • 1
  • 2

操作
检查风扇故障日志。
如果未检测到风扇故障,请检查进气孔温度(若适用)并重新安装处理器散热片


CPU0005

CPU <number> configuration is unsupported. Check CPU or BIOS revision.
CPU <number> 配置受支持,检查 CPU 或 BIOS 修订版本。系统无法引导,或正在降级运行。
  • 1
  • 2

操作
检查所支持的处理器类型的技术规格。


CPU0010

CPU <number> is throttled.
因为温度或电源情况导致 CPU<number>被节流。
  • 1
  • 2

操作
查阅系统日志排查电源或温度异常。


CPU0023

CPU <number> is absent. Check CPU.
CPU <number> 缺失,检查 CPU。
  • 1
  • 2

操作
验证处理器安装。
如果存在,则重新安装处理器。


CPU0204

CPU voltage is outside of range. Re-seat CPU.
CPU 电压超出范围,重新安装 CPU。电压超出容许范围可能损坏电气组件,或导致系统关闭。

操作
关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。


CPU0700

CPU <number> initialization error detected. Power cycle system.
检测到 CPU <number> 初始化错误,系统电源关闭然后打开。
  • 1
  • 2

操作
关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。


CPU0701

CPU protocol error detected. Power cycle system.
检测到 CPU 协议错误,系统电源关闭然后打开

操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。


CPU0702

CPU bus parity error detected. Power cycle system.
检测到 CPU 总线奇偶校验错误,系统电源关闭然后打开。
  • 1
  • 2

操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。


CPU0703

CPU bus initialization error detected. Power cycle system.
检测到 CPU 总线初始化错误,系统电源关闭然后打开。
  • 1
  • 2

操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。


CPU0704

CPU <number> machine check error detected. Power cycle system.
检测到 CPU <number> 机器检查错误,系统电源关闭然后打开。
  • 1
  • 2

操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。


FAN0000

Fan <number> RPM is less than the lower warning threshold.
风扇<number>运行速度超出范围。
  • 1
  • 2

操作
卸下并重新安装风扇。


FAN0001

Fan <number> RPM is outside of range. Check fan.
风扇 <number> 运行速度超出范围。
  • 1
  • 2

操作
卸下并重新安装风扇。


FAN1201

Fan redundancy lost. Check fans.
风扇发生故障。
  • 1
  • 2

操作
卸下并重新安装故障的风扇或安装其它风扇。


HWC1001

The <name> is absent. Check hardware.
硬件<name> 缺失,检查硬件。可能导致系统功能降级。
  • 1
  • 2

操作
重新安装或重新连接硬件。


HWC2003

Storage <name> cable or interconnect failure. Check connection.
存储设备 <name> 电缆或互联故障,请检查连接。可能导致系统功能降级。
  • 1
  • 2

操作
检查电缆是否存在,重新安装或重新连接。


HWC2005

System board <name> cable connection failure. Check connection.
系统板 <name> 电缆连接故障,请检查连接。可能导致系统功能降级。
  • 1
  • 2

操作
检查电缆是否存在,然后重新安装或重新连接。


MEM0000

Persistent correctable memory errors detected on a memory device at location(s) <location>.
在内存设备的位置 <location> 处检测到永久可纠正的内存错误。
  • 1
  • 2

操作
重新安装内存。


MEM0001

Multi-bit memory error on <location>. Re-seat memory.
<location> 处的多位内存错误,重新安装内存。可能导致系统功能降级,操作系统和/或应用程序可能会发生故障。
  • 1
  • 2

操作
重新安装内存。


MEM0007

Unsupported memory configuration. Check memory <location>.
内存可能安装不正确,配置错误,或者发生故障,内存大小减少。
  • 1
  • 2

操作
检查内存配置。重新安装内存。


MEM0701

Correctable memory error rate exceeded for <location>.
内存可能无法操作。
  • 1
  • 2

操作
重新安装内存。


MEM0702

Correctable memory error rate exceeded for <location>. Re-seat memory.
<location> 的可纠正内存错误比率超限,重新安装内存。
  • 1
  • 2

操作
重新安装内存。


MEM1205

Memory mirror lost on <location>. Power cycle system.
内存可能安装不正确,配置错误,或者发生故障。
  • 1
  • 2

操作
检查内存配置。重新安装内存。


MEM1208

Memory spare lost on <location>. Power cycle system.(
内存备份不再可用。
  • 1
  • 2

操作
重新安装内存。


MEM8000

SBE log disabled on <location>. Re-seat memory.
<location> 上 SBE 日志已禁用,重新安装内存。
  • 1
  • 2

操作
检查系统日志排查内存异常。
重新安装位于 处的内存。


PCI1302

A bus time-out was detected on a component at bus <bus> device<device> function <func>.
总线 <bus> 设备 <device> 功能 <func> 的组件上检测到总线超时。
  • 1
  • 2

操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。


PCI1304

I/O channel check error detected. Power cycle system.
检测到 I/O 通道检查错误,系统电源关闭然后打开。
  • 1
  • 2

操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。


PCI1308

PCI parity error on bus <bus> device <device> function <func>. Power cycle system.
总线 <bus> 设备 <device> 功能 <func> 上的 PCI 奇偶校验错误,关闭并打开系统电源。可能导致系统功能降级,PCI 设备可能无法运行,或系统无法运行。
  • 1
  • 2

操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。


PCI1320

Bus fatal error on bus <bus> device <device> function <func>. Power cycle system.
总线 <bus> 设备 <device> 功能 <func> 上的总线严重错误,关闭然后打开系统电源。可能导致系统功能降级,或系统可能无法运行。
  • 1
  • 2

操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。


PCI1342

A bus time-out was detected on a component at slot <number>.
插槽 <number> 的组件上检测到总线超时。可能导致系统功能降级,或系统可能无法运行。
  • 1
  • 2

操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。


PCI1348

PCI parity error on slot <number>. Re-seat PCI card.
插槽 <number> 上的 PCI 奇偶校验错误,重新安装 PCI 卡。可能导致系统功能降级,或系统可能无法运行。
  • 1
  • 2

操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。


PCI1360

Bus fatal error on slot <number>. Re-seat PCI card.
插槽 <number> 的严重总线错误,重新安装 PCI 卡。可能导致系统功能降级,或系统可能无法运行。
  • 1
  • 2

操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。


PDR0001

Fault detected on drive <number>. Check drive.
控制器在磁盘上检测到故障,并已使磁盘脱机。
  • 1
  • 2

操作
卸下然后重新安装有故障的磁盘。


Drive <number> removed from disk drive bay <bay>. Check drive.
控制器检测到驱动器已卸下。 
  • 1
  • 2

操作
验证驱动器的安装。
重新安装有故障的驱动器。


PST0128

No memory is detected. Inspect memory devices.
系统 BIOS 无法检测到系统中的内存。
  • 1
  • 2

操作
重新安装内存。


PST0129

Memory is detected, but is not configurable. Check memory devices.
系统 BIOS 检测到内存,但无法基于系统运行对其进行配置。
  • 1
  • 2

操作
将系统内存安装与支持的系统内存配置进行比较。


PSU0001

PSU <number> failed. Check PSU.
PSU <number> 故障,检查 PSU。
  • 1
  • 2

操作
卸下并重新安装电源设备。


PSU0002

Predictive failure on PSU <number>. Check PSU.
PSU <number> 上的预测故障,检查 PSU。
  • 1
  • 2

操作
卸下电源设备并重新安装。


PSU0003

Power input for PSU <number> is lost. Check PSU cables.
PSU <number>电源设备安装正确,但输入源未连接或未起作用。 
  • 1
  • 2

操作
验证输入源连接到设备。
验证输入源符合电源设备的操作要求。


PSU0006

Power supply is incorrectly configured. Check PSU.
电源设备 未正确配置,检查 PSU。电源设备的输入类型和额定功率应当相同。

操作
安装匹配的电源设备。


PSU0016

PSU <number> is absent. Check PSU.
PSU <number> 电源设备已卸下或出现故障。
  • 1
  • 2

操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。


PSU0031

Cannot communicate with PSU <number>. Re-seat PSU.
电源设备可以运行,但是电源设备的监控已降级,系统性能将降级。 
  • 1
  • 2

操作
卸下并重新安装电源设备。


PSU0032

The temperature for power supply <number> is in a warning range.
电源设备 <number> 的温度在警告范围内。
  • 1
  • 2

操作
检查系统运行环境,包括通风和进气孔温度。
查看温度和热组件故障的日志。


PSU0033

PSU temperature outside of range. Check PSU.
PSU 温度超出范围,请检查 PSU。
操作
检查系统运行环境,包括通风和进气孔温度。
查看温度和热组件故障的日志。


PSU0034

An under voltage fault detected on PSU <number>. Check power source.
在 PSU <number> 上检测到电压过低故障,请检查电源。
  • 1
  • 2

操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。


PSU0035

Over voltage fault on PSU <number>. Check PSU.
在 PSU <number> 上发生电压高过故障,请检查 PSU。
  • 1
  • 2

操作
检查输入电源或重新安装电源设备。


PSU0036

An over current fault detected on PSU <number>. Check PSU.
在 PSU <number> 上检测到电流过高故障,请检查 PSU。
  • 1
  • 2

操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。


PSU0037

Fan failure detected on PSU <number>. Check PSU.
在 PSU <number> 上检测到风扇故障,请检查 PSU。
  • 1
  • 2

操作
检查风扇是否阻塞。


PSU0076

PSU wattage mismatch; PSU <number> = <value >watts
PSU 功率不匹配;PSU <number> = <value > 瓦特 ,电源设备的输入类型和额定功率应当相同。

  • 1
  • 2
  • 3

操作
安装匹配的电源设备。


PSU1201

Power supply redundancy is lost.
电源设备冗余缺失。
  • 1
  • 2

操作
检查输入电源。
重新安装电源设备。


PSU1204

PSU redundancy degraded. Check PSU cables.
PSU 冗余降级,检查 PSU 电缆。电源设备异常、电源设备资源变化,或系统电源资源变化。
  • 1
  • 2

操作
检查事件日志排查电源设备故障。
查看系统配置和功耗。


PWR1004

The system performance degraded because power capacity has changed.
因为电源容量变化系统性能已降级。
  • 1
  • 2

操作
检查事件日志排查电源设备故障。
查看系统配置和功耗,并据此升级或安装电源设备。


PWR1005

The system performance degraded because the user-defined power capacity has changed.
用户定义的电源设置影响系统运行。
  • 1
  • 2

操作
如果是意外导致,查看系统配置变化和电源策略。


PWR1006

System power demand exceeds capacity. System halted.
系统电源需求超出容量,系统已停止。
操作
查看系统配置,升级电源设备或降低系统功耗。


RFM1008

Removable Flash Media <name> failed. Check SD Card.
可移动的闪存介质 <name> 出现故障,检查 SD 卡。SD 卡读取或写入过程中报告了错误。
  • 1
  • 2

操作
重置闪存介质。


RFM1014

Removable Flash Media <name> is write protected. Check SD Card.
可移动的闪存介质 <name> 为写保护状态,检查 SD 卡。该卡被 SD 卡上的物理锁进行了写保护,写保护状态的卡无法使用。
  • 1
  • 2

操作
如果是意外导致,卸下介质并禁用写保护。


RFM1201

Internal Dual SD Module redundancy is lost. Check SD Card.
其中一块或两块 SD 卡工作不正常。
  • 1
  • 2

RFM2001

Internal Dual SD Module <name> is absent. Check SD Card.
未检测到 SD 卡模块或该卡未安装。
  • 1
  • 2

操作
如果无意如此,则重新安装 SD 模块。


RFM2002

Internal Dual SD Module <name> is offline.
SD 卡模块已安装,但可能安装不正确,或配置不正确。
  • 1
  • 2

操作
重新安装 SD 模块。


RFM2004

Internal Dual SD Module <name> failed. Check SD Card.
SD 卡模块已安装,但配置不正确,或无法初始化。 
  • 1
  • 2

操作
重新安装 SD 模块,然后卸下并重新安装 SD 卡。


RFM2006

Internal Dual SD Module <name> is write protected.
此模块为写保护,更改可能无法写入到介质。 
  • 1
  • 2

操作
如果是意外导致,卸下介质并禁用写保护。


SEC0031

Intrusion detected. Check chassis cover.
检测到侵入,检查机箱盖。
  • 1
  • 2

操作
关闭机箱,检查系统日志。


SEC0033

Intrusion detected. Check chassis cover.
电源关闭状态下机箱打开。
  • 1
  • 2

操作
关闭机箱并验证硬件资源。
检查系统日志。


SEL0006

All event logging is disabled.
当用户禁用所有事件日志。
  • 1
  • 2

操作
若是意外导致,则重新启用日志。


SEL0008

Log is full.
日志已满。日志已满时,其他事件将不会写入到日志。早期的事件可能被覆盖并丢失。如果用户禁用了事件记录,也可能显示此消息。
  • 1
  • 2

操作
备份并清除日志。


SEL0012

Could not create or initialize the system event log.
无法创建或初始化系统事件日志。系统事件日志初始化失败,将不会捕获平台状态和故障事件,某些管理软件不会报告平台异常。
  • 1
  • 2

操作
重新引导管理控制器或 iDRAC。
关闭然后打开输入电源。


SEL1204

Unknown system hardware failure.
未知系统硬件故障。
  • 1
  • 2

操作
将系统重新配置为所支持的最低配置。


TMP0118

System inlet temperature is outside of range.
环境气温过低.
  • 1
  • 2

操作
检查系统运行环境。


TMP0119

System inlet temperature is outside of range.
环境气温过低。
  • 1
  • 2

操作
检查系统运行环境。


TMP0120

System inlet temperature is outside of range.
环境气温过高,或者可能一个或多个风扇发生故障。
  • 1
  • 2

操作
检查系统运行环境并查看事件日志排查风扇故障。


TMP0121

System inlet <name> temperature is outside of range. Check Fans.
环境气温过高,或者可能一个或多个风扇发生故障。
  • 1
  • 2

操作
检查系统运行环境并查看事件日志排查风扇故障。


VLT0204

System board voltage is outside of range.
系统硬件检测到电压过高或过低的情况。如果连续出现多个电压异常,系统可能切换到故障安全模式。
  • 1
  • 2

操作
查看系统日志了解电源设备异常。
将系统重新配置为最低配置,检查并重新安装系统电缆。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.