RAID 控制器命令
您可以使用 Adapatec® CLI 运行 RAID 控制器命令。 以下命令是最常用的 RAID 控制器命令。
/usr/Adaptec_Event_Monitor/arcconf getstatus 1
_GETSTATUS_
列出操作类型、逻辑驱动器编号、逻辑驱动器大小和操作进度。 您还可以查看正在运行的任何后台命令的状态,例如以下各项:
- 最近的重建
- 同步
- 逻辑驱动器迁移
- 压缩/扩展
/usr/Adaptec_Event_Monitor/arcconf getconfig 1
_GETCONFIG_
列出控制器、逻辑驱动器和物理驱动器的相关信息。 您可以查看多种信息,例如以下各项:
- 控制器类型
- BIOS、引导块、设备驱动程序和固件版本
- 物理设备类型、设备 ID、是否存在 PFA
- 物理设备状态
- 机箱信息:风扇、电源和温度
/usr/Adaptec_Event_Monitor/arcconf getlogs 1 device tabular
_GETLOGS_
使您能够访问控制器的状态和事件日志。_DEVICE xxx_
显示控制器迂到的任何设备错误的日志。
请参阅以下示例,了解使用 GETLOGS 命令产生的输出:
driveErrorEntry
smartError.. ............................ false
vendorID ................................ WDC
serialNumber ............................ WD-XXX
wwn ..................................... xxxxxxxxxxxxxxxx - CC_FILTER
deviceID ................................ 10
productID ............................... WD1003FB
numParityErrors ......................... 0
linkFailures ............................ 0
hwErrors ................................ 0
abortedCmds ............................. 7
mediumErrors ............................ 20
smartWarning ............................ 0
/opt/MegaRAID/storcli/storcli64 /c0/eall/sall show all | grep -iE "det|cou|tem|SN|S.M|fir”
使用此命令可显示特定驱动器及其可能存在的任何驱动器错误。 以下示例显示了输出:
Drive /c0/e252/s0 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 24C (75.20 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = XXXX
Firmware Revision = SN04
Drive /c0/e252/s1 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 22C (71.60 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = xxxx
Firmware Revision = SN03
Drive /c0/e252/s2 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 21C (69.80 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = xxxx
Firmware Revision = SN04
Drive /c0/e252/s3 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count =
Drive Temperature = 23C (73.40 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = xxxx
Firmware Revision = SN03
/opt/MegaRAID/storcli/storcli64 /c0/eall/sall show rebuild
该命令显示所有驱动器的重建状态和完成重建的预计时间。 在运行此命令时,您将看到以下输出:
---------------------------------------------
Drive-ID Progress% Status Estimated Time Left
---------------------------------------------
/c0/e252/s0 - Not in progress
/c0/e252/s1 - Not in progress
/c0/e252/s2 - Not in progress
/c0/e252/s3 - Not in progress
---------------------------------------------
RAID alert "Spam"
更改默认配置的“全局”部分(/opt/Broadcom/mrmonitor/MegaMonitor/config-current.xml
):
<global>
<severity level="FATAL">
<do-systemlog/>
<do-email/>
</severity>
<severity level="CRITICAL">
<do-email/>
<do-systemlog/>
</severity>
<severity level="WARNING">
<do-email/>
<do-systemlog/>
</severity>
<severity level="INFO"><do-systemlog/>
</severity>
</global>
要像这样读:
<global>
<severity level="FATAL">
<do-systemlog/>
<do-email/>
</severity>
<severity level="CRITICAL">
<do-email/>
<do-systemlog/>
</severity>
<severity level="WARNING">
<do-systemlog/>
</severity>
<severity level="INFO">
<do-systemlog/>
</severity>
</global>
删除“警告”级别的“发送电子邮件”标记。 或者,将安全级别更改为“INFO”。
常见驱动器错误
最常见的驱动器错误是智能错误、硬件错误和介质错误。 如果驱动器发生故障,您会看到这些错误。 为此,您需要尽快更换该驱动器。
异常中止的命令是另一个常见错误。 但是,如果流产命令的数量增加(如 100 条),请打开支持案例。
链接错误可能指示可能需要重新安装或更换电缆。
支持案例信息
打开支持案例时需要以下信息。
Adaptec RAID 卡
确保在打开支持案例时包含 arcconf getconfig 1/arcconf getlogs 1 device tabular
的完整输出。 提供这些信息可帮助支持团队识别驱动器订单、阵列成员资格、阵列几何以及连线问题。 这些信息对于恢复丢失的 RAID 配置至关重要。 在初始更新中允许重启/关机或要求热插拔,可加快支持案例的处理速度。
Broadcom RAID 卡
使用以下命令获取 Broadcom RAID 卡的日志文件。 您需要在支持案例中包含这些日志文件的完整输出。
/opt/MegaRAID/storcli/storcli64 /c0 show all
/opt/MegaRAID/storcli/storcli64 /c0 show TermLog
/opt/MegaRAID/storcli/storcli64 /c0 /eall /sall show all | grep -iE "det|cou|tem|SN|S.M|fir"
/opt/MegaRAID/storcli/storcli64 /c0 show TermLog
安装 Storcli
对 Linux 使用以下步骤。
- 通过 SSH 登录到服务器
cd /tmp
(或您要求的任何目录)- wget
http://downloads.service.softlayer.com/lsitools/1.14.12_StorCLI.zip
- 解压缩 x.xx.xx_StorCLI.zip
- cd
/tmp/storcli_all_os/Linux/
(或转到下载目录) - rpm
-ivh storcli-x.xx.xx-x.noarch.rpm
- 检查 storcli 是否已成功安装
对 Vmware ESXi 使用以下步骤。
-
转到 /tmp 目录。
# cd /tmp
-
下载 storcli。
# wget http://downloads.service.softlayer.com/lsitools/1.14.12_StorCLI.zip
-
解压缩文件。
"# unzip 1.14.12_StorCLI.zip"
-
转至 /tmp/storcli_all_os/Vmware-NDS/.。
` # cd /tmp/storcli_all_os/Vmware-NDS/'
-
安装 storcli。
# esxcli software vib install -v=/tmp/storcli_all_os/Vmware-NDS/vmware-esx-storcli-1.14.12.vib --no-sig-check
安装 storcli 后,可以运行这两个命令来确认服务器的磁盘运行状况。
对于 ESXi 7.X,使用以下命令。
/opt/lsi/storcli64/storcli64 /c0 show all
/opt/lsi/storcli64/storcli64 /c0 show eventloginfo
/opt/lsi/storcli64/storcli64 /c0 /eall /sall show all | grep -iE "det|cou|tem|SN|S.M|fir"
/opt/lsi/storcli64/storcli64 /c0 show TermLog
检查 RAID 配置
使用以下命令来检查 RAID 配置。
/opt/lsi/storcli64/storcli64 /c0 show all
/opt/MegaRAID/storcli/storcli64 /c0 /eall /sall show all
从输出中,查找将 RAID 类型列为列的拓扑部分。
确保在排除故障前备份所有工作。