RAID コントローラー・コマンド

Adapatec® CLI を使用して、RAID コントローラコマンドを実行できます。以下のコマンドは、使用できる最も一般的な RAID コントローラー・コマンドです。

/usr/Adaptec_Event_Monitor/arcconf getstatus 1

_GETSTATUS_ により、操作のタイプ、論理ドライブ番号、論理ドライブ・サイズ、および操作の進行がリストされます。以下の項目など、実行されているバックグラウンド・コマンドの状況を表示することもできます。

最新の再ビルド
同期
論理ドライブのマイグレーション
圧縮/拡張

/usr/Adaptec_Event_Monitor/arcconf getconfig 1

_GETCONFIG_ は、コントローラー、論理ドライブ、および物理ドライブに関する情報をリストします。以下の項目などの情報を表示できます。

コントローラー・タイプ
BIOS、ブート・ブロック、デバイス・ドライバー、およびファームウェアのバージョン
物理デバイスのタイプ、デバイス ID、PFA の存在
物理デバイスの状態
格納装置の情報: ファン、電源機構、および温度

/usr/Adaptec_Event_Monitor/arcconf getlogs 1 device tabular

_GETLOGS_ は、コントローラーの状況およびイベント・ログにアクセスできるようにします。_DEVICE xxx_ は、コントローラーで発生したデバイス・エラーのログを表示します。

GETLOGS コマンドを使用した場合に表示される出力については、以下の例を参照してください。

driveErrorEntry
smartError.. ............................ false
vendorID ................................ WDC
serialNumber ............................ WD-XXX
wwn ..................................... xxxxxxxxxxxxxxxx - CC_FILTER
deviceID ................................ 10
productID ............................... WD1003FB
numParityErrors ......................... 0
linkFailures ............................ 0
hwErrors ................................ 0
abortedCmds ............................. 7
mediumErrors ............................ 20
smartWarning ............................ 0

/opt/MegaRAID/storcli/storcli64 /c0/eall/sall show all | grep -iE "det|cou|tem|SN|S.M|fir”

このコマンドを使用すると、特定のドライブと、発生している可能性があるドライブ・エラーが表示されます。次に、出力例を示します。

Drive /c0/e252/s0 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 24C (75.20 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = XXXX
Firmware Revision = SN04

Drive /c0/e252/s1 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 22C (71.60 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = xxxx
Firmware Revision = SN03

Drive /c0/e252/s2 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature = 21C (69.80 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = xxxx
Firmware Revision = SN04

Drive /c0/e252/s3 - Detailed Information:
Shield Counter = 0
Media Error Count = 0
Other Error Count =
Drive Temperature = 23C (73.40 F)
Predictive Failure Count = 0
S.M.A.R.T alert flagged by drive = No
SN = xxxx
Firmware Revision = SN03

/opt/MegaRAID/storcli/storcli64 /c0/eall/sall show rebuild

このコマンドは、すべてのドライブの再ビルド状況と、再ビルドを完了するための見積もり時間を表示します。このコマンドを実行すると、次の出力が表示されます。

---------------------------------------------
Drive-ID Progress% Status Estimated Time Left
---------------------------------------------
/c0/e252/s0 - Not in progress
/c0/e252/s1 - Not in progress
/c0/e252/s2 - Not in progress
/c0/e252/s3 - Not in progress
---------------------------------------------

RAID alert "Spam"

デフォルトのコンフィグ（/opt/Broadcom/mrmonitor/MegaMonitor/config-current.xml）の "global "セクションを変更します：

<global>
<severity level="FATAL">
<do-systemlog/>
<do-email/>
</severity>
<severity level="CRITICAL">
<do-email/>
<do-systemlog/>
</severity>
<severity level="WARNING">
<do-email/>
<do-systemlog/>
</severity>
<severity level="INFO"><do-systemlog/>
</severity>
</global>

以下のようになります。

<global>
<severity level="FATAL">
<do-systemlog/>
<do-email/>
</severity>
<severity level="CRITICAL">
<do-email/>
<do-systemlog/>
</severity>
<severity level="WARNING">
<do-systemlog/>
</severity>
<severity level="INFO">
<do-systemlog/>
</severity>
</global>

レベル「WARNING」の「do-email」タグを削除します。または、セキュリティー・レベルを「INFO」に変更します。

一般的なドライブ・エラー

最も一般的なドライブ・エラーは、スマート・エラー、ハードウェア・エラー、およびメディア・エラーです。このようなエラーは、ドライブに障害がある場合に表示されます。そのため、できるだけ早くドライブを交換する必要があります。

異常ではありませんが、異常終了したコマンドも一般的な別のエラーです。ただし、異常終了したコマンドの数が増加した (100 など) 場合は、サポート・ケースを開いてください。

リンク・エラーは、ケーブルの取り付け直しまたは交換が必要な可能性があることを示しています。

サポート Case 情報

サポート Case を開くときは以下の情報が必要です。

Adaptec RAID カード

サポート Case を開く時には、arcconf getconfig 1/arcconf getlogs 1 device tabular の完全な出力を含めるようにしてください。この情報を提供すると、サポート・チームがドライブ順序、アレイのメンバーシップ、アレイの形状、およびケーブル接続の問題を特定する際に役立ちます。この情報は、失われた RAID 構成をリカバリーするためには不可欠です。最初のアップデートで再起動／電源ダウンの許可を与えるか、ホットスワップを依頼することで、サポートケースのプロセスがスピードアップする。

Broadcom RAID カード

Broadcom RAID カードのログ・ファイルを取得するには、以下のコマンドを使用します。これらのログ・ファイルの完全な出力をサポート・ケースに含める必要があります。

/opt/MegaRAID/storcli/storcli64 /c0 show all
/opt/MegaRAID/storcli/storcli64 /c0 show TermLog
/opt/MegaRAID/storcli/storcli64 /c0 /eall /sall show all | grep -iE "det|cou|tem|SN|S.M|fir"
/opt/MegaRAID/storcli/storcli64 /c0 show TermLog

Storcliのインストール

Linuxの場合は、以下の手順を使います。

サーバーへの SSH 接続
cd /tmp（または任意のディレクトリ）
wget http://downloads.service.softlayer.com/lsitools/1.14.12_StorCLI.zip
x.xx.xx_StorCLI.zipを解凍する
cd /tmp/storcli_all_os/Linux/（またはダウンロードしたディレクトリに移動する）
rpm -ivh storcli-x.xx.xx-x.noarch.rpm
storcliが正常にインストールされているか確認する

Vmware ESXiの場合は、以下の手順を使用します。

/tmpディレクトリに移動する。

# cd /tmp
storcli をダウンロードします。

# wget http://downloads.service.softlayer.com/lsitools/1.14.12_StorCLI.zip
ファイルを解凍します。

「# unzip 1.14.12_StorCLI.zip」
/tmp/storcli_all_os/Vmware-NDS/. に移動します。

` # cd /tmp/storcli_all_os/Vmware-NDS/'
storcli をインストールします。

# esxcli software vib install -v=/tmp/storcli_all_os/Vmware-NDS/vmware-esx-storcli-1.14.12.vib --no-sig-check

storcli がインストールされたら、以下の 2 つのコマンドを実行して、サーバーのディスク・ヘルスを確認できます。

ESXi 7.Xの場合は、以下のコマンドを使用します。

/opt/lsi/storcli64/storcli64 /c0 show all
/opt/lsi/storcli64/storcli64 /c0 show eventloginfo
/opt/lsi/storcli64/storcli64 /c0 /eall /sall show all | grep -iE "det|cou|tem|SN|S.M|fir"
/opt/lsi/storcli64/storcli64 /c0 show TermLog

RAID 構成の確認

以下のコマンドを使用して、RAID 構成を確認します。

/opt/lsi/storcli64/storcli64 /c0 show all
/opt/MegaRAID/storcli/storcli64 /c0 /eall /sall show all

出力から、RAID タイプが列としてリストされているトポロジー・セクションを探します。

トラブルシューティングを行う前に、必ず作業のバックアップを取ってください。