IBM Cloud Docs
RAID 控制器命令

RAID 控制器命令

您可以使用 Adapatec® CLI 运行 RAID 控制器命令。 以下命令是最常用的 RAID 控制器命令。

/usr/Adaptec_Event_Monitor/arcconf getstatus 1

_GETSTATUS_ 列出操作类型、逻辑驱动器编号、逻辑驱动器大小和操作进度。 您还可以查看正在运行的任何后台命令的状态,例如以下各项:

  • 最近的重建
  • 同步
  • 逻辑驱动器迁移
  • 压缩/扩展

/usr/Adaptec_Event_Monitor/arcconf getconfig 1

_GETCONFIG_ 列出控制器、逻辑驱动器和物理驱动器的相关信息。 您可以查看多种信息,例如以下各项:

  • 控制器类型
  • BIOS、引导块、设备驱动程序和固件版本
  • 物理设备类型、设备 ID、是否存在 PFA
  • 物理设备状态
  • 机箱信息:风扇、电源和温度

/usr/Adaptec_Event_Monitor/arcconf getlogs 1 device tabular

_GETLOGS_ 使您能够访问控制器的状态和事件日志。_DEVICE xxx_ 显示控制器迂到的任何设备错误的日志。

请参阅以下示例,了解使用 GETLOGS 命令产生的输出:

driveErrorEntry
smartError.. ............................ false
vendorID ................................ WDC
serialNumber ............................ WD-XXX
wwn ..................................... xxxxxxxxxxxxxxxx - CC_FILTER
deviceID ................................ 10
productID ............................... WD1003FB
numParityErrors ......................... 0
linkFailures ............................ 0
hwErrors ................................ 0
abortedCmds ............................. 7
mediumErrors ............................ 20
smartWarning ............................ 0

/opt/MegaRAID/storcli/storcli64 /c0/eall/sall show all | grep -iE "det|cou|tem|SN|S.M|fir”

使用此命令可显示特定驱动器及其可能存在的任何驱动器错误。 以下示例显示了输出:

Drive /c0/e252/s0 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 24C (75.20 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = XXXX
Firmware Revision = SN04

Drive /c0/e252/s1 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 22C (71.60 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = xxxx
Firmware Revision = SN03

Drive /c0/e252/s2 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 21C (69.80 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = xxxx
Firmware Revision = SN04

Drive /c0/e252/s3 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count =
Drive Temperature = 23C (73.40 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = xxxx
Firmware Revision = SN03

/opt/MegaRAID/storcli/storcli64 /c0/eall/sall show rebuild

该命令显示所有驱动器的重建状态和完成重建的预计时间。 在运行此命令时,您将看到以下输出:

---------------------------------------------
Drive-ID Progress% Status Estimated Time Left
---------------------------------------------
/c0/e252/s0 - Not in progress
/c0/e252/s1 - Not in progress
/c0/e252/s2 - Not in progress
/c0/e252/s3 - Not in progress
---------------------------------------------

RAID alert "Spam"

更改默认配置的“全局”部分(/opt/Broadcom/mrmonitor/MegaMonitor/config-current.xml):

<global>
<severity level="FATAL">
<do-systemlog/>
<do-email/>
</severity>
<severity level="CRITICAL">
<do-email/>
<do-systemlog/>
</severity>
<severity level="WARNING">
<do-email/>
<do-systemlog/>
</severity>
<severity level="INFO"><do-systemlog/>
</severity>
</global>

要像这样读:

<global>
<severity level="FATAL">
<do-systemlog/>
<do-email/>
</severity>
<severity level="CRITICAL">
<do-email/>
<do-systemlog/>
</severity>
<severity level="WARNING">
<do-systemlog/>
</severity>
<severity level="INFO">
<do-systemlog/>
</severity>
</global>

删除“警告”级别的“发送电子邮件”标记。 或者,将安全级别更改为“INFO”。

常见驱动器错误

最常见的驱动器错误是智能错误、硬件错误和介质错误。 如果驱动器发生故障,您会看到这些错误。 为此,您需要尽快更换该驱动器。

异常中止的命令是另一个常见错误。 但是,如果流产命令的数量增加(如 100 条),请打开支持案例。

链接错误可能指示可能需要重新安装或更换电缆。

支持案例信息

打开支持案例时需要以下信息。

Adaptec RAID 卡

确保在打开支持案例时包含 arcconf getconfig 1/arcconf getlogs 1 device tabular 的完整输出。 提供这些信息可帮助支持团队识别驱动器订单、阵列成员资格、阵列几何以及连线问题。 这些信息对于恢复丢失的 RAID 配置至关重要。 在初始更新中允许重启/关机或要求热插拔,可加快支持案例的处理速度。

Broadcom RAID 卡

使用以下命令获取 Broadcom RAID 卡的日志文件。 您需要在支持案例中包含这些日志文件的完整输出。

/opt/MegaRAID/storcli/storcli64 /c0 show all
/opt/MegaRAID/storcli/storcli64 /c0 show TermLog
/opt/MegaRAID/storcli/storcli64 /c0 /eall /sall show all | grep -iE "det|cou|tem|SN|S.M|fir"
/opt/MegaRAID/storcli/storcli64 /c0 show TermLog

安装 Storcli

对 Linux 使用以下步骤。

  1. 通过 SSH 登录到服务器
  2. cd /tmp(或您要求的任何目录)
  3. wget http://downloads.service.softlayer.com/lsitools/1.14.12_StorCLI.zip
  4. 解压缩 x.xx.xx_StorCLI.zip
  5. cd /tmp/storcli_all_os/Linux/(或转到下载目录)
  6. rpm -ivh storcli-x.xx.xx-x.noarch.rpm
  7. 检查 storcli 是否已成功安装

对 Vmware ESXi 使用以下步骤。

  1. 转到 /tmp 目录。

    # cd /tmp

  2. 下载 storcli。

    # wget http://downloads.service.softlayer.com/lsitools/1.14.12_StorCLI.zip

  3. 解压缩文件。

    "# unzip 1.14.12_StorCLI.zip"

  4. 转至 /tmp/storcli_all_os/Vmware-NDS/.。

    ` # cd /tmp/storcli_all_os/Vmware-NDS/'

  5. 安装 storcli。

    # esxcli software vib install -v=/tmp/storcli_all_os/Vmware-NDS/vmware-esx-storcli-1.14.12.vib --no-sig-check

安装 storcli 后,可以运行这两个命令来确认服务器的磁盘运行状况。

对于 ESXi 7.X,使用以下命令。

/opt/lsi/storcli64/storcli64 /c0 show all
/opt/lsi/storcli64/storcli64 /c0 show eventloginfo
/opt/lsi/storcli64/storcli64 /c0 /eall /sall show all | grep -iE "det|cou|tem|SN|S.M|fir"
/opt/lsi/storcli64/storcli64 /c0 show TermLog

检查 RAID 配置

使用以下命令来检查 RAID 配置。

/opt/lsi/storcli64/storcli64 /c0 show all
/opt/MegaRAID/storcli/storcli64 /c0 /eall /sall show all

从输出中,查找将 RAID 类型列为列的拓扑部分。

确保在排除故障前备份所有工作。