高可用性と災害復旧
IBM Watson® Discovery は、IBM Cloud® が提供されるすべての Discovery リージョンで高可用性を備えています。 ただし、リージョン全体が影響を受ける可能性のある災害から復旧するためには、計画と準備が必要です。
IBM Cloud
この情報は、管理対象デプロイメントにのみ適用されます。
サービスのカスタマイズと使用法を理解しておく必要があります。 新しいリージョンでサービスのインスタンスを再作成し、すべてのリージョンのデータを復元できるように準備しておく必要もあります。 ダウンタイムをゼロにする方法については、こちらをご覧ください。
高可用性
IBM Watson® Discovery は、単一障害点のない高可用性をサポートしています。 このサービスは、IBM Cloud に用意されているマルチゾーン・リージョン (MZR) 機能を使用して、高可用性を自動的かつ透過的に実現します。
IBM Cloud では、1 つのロケーション内で、単一障害点を共有しない複数のゾーンを利用できます。 1 つのリージョンの複数のゾーン間で自動的にロード・バランシングを行うこともできます。
災害時リカバリー
データ損失が発生する可能性のある重大な障害が IBM Cloud リージョンで発生した場合は、災害復旧が問題になります。 すべてのリージョンで MZR を利用できるわけではないので、あるリージョンが利用できなくなった場合は、IBM がそのリージョンを再びオンラインにするまで待ってください。 基盤になっているデータ・サービスがその障害でダメージを受けた場合は、IBM がそのデータ・サービスを復旧するまで待ちます。
壊滅的な障害が発生した場合は、IBM がデータベース・バックアップからデータを復旧できない可能性があります。 その場合は、お客様がデータをリストアして、サービス・インスタンスを最新の状態に戻す必要があります。 データを同じリージョンにリストアすることも、異なるリージョンにリストアすることもできます。
災害復旧計画の内容は、IBM Cloud 上で保持されているすべてのデータを把握して保存すること、およびこれらのデータを復元する準備をしておくことです。
Watson Discovery にあるデータのバックアップ
IBM Watson® Discoveryに保管されているデータをバックアップするには、いくつかの方法があります。 災害復旧計画では、以下のデータをバックアップできます。
- ソース文書のコピーとしてのデータ
- Discovery からインポートおよびエクスポートされたデータ
以下の表にリストされているリソースをバックアップして、災害復旧中のデータ損失を防ぐことができます。
リソース | バックアップのプロセス | リソース・ダウンロードの UI サポート | リソース・アップロードの UI サポート | APIのサポート |
---|---|---|---|---|
アップロードおよびクロールされたファイル | 取り込まれたデータのすべてのソース文書のバックアップを安全に保管します。 詳しくは、 取り込まれた文書 を参照してください。
元のデータ・ソースに再接続することで、再クロールのためにデータ・ソースの資格情報を保持します。 詳しくは、 外部データ・ソースへの接続の復元 を参照してください。 詳細は注 を参照。 |
いいえ | いいえ | ダウンロード-いいえ アップロード-いいえ |
関連性トレーニング・データ | すべてのトレーニング照会とサンプルをダウンロードし、それらをローカルに保存してトレーニング・データをバックアップします。 詳細は 「トレーニングデータ」 を参照してください。 | いいえ | いいえ | ダウンロード-はい アップロード-はい |
拡張リスト | 拡張リストを復元するには、 API を使用して拡張リストをダウンロードし、ローカルに保管します。 詳しくは、 拡張リスト を参照してください。 | いいえ | はい | ダウンロード-はい アップロード-はい |
ストップワード・リスト | API を使用してストップワード・リストをダウンロードし、それらをローカルに保管して、ストップワード・リストを復元します。 詳しくは、 ストップワード を参照してください。 | いいえ | はい | ダウンロード-はい アップロード-はい |
Smart Document Understanding ユーザー・トレーニング・モデル | モデルをエクスポートし、ローカルに保管してバックアップします。 詳しくは、 Smart Document Understanding モデルのリストア を参照してください。 | はい | はい | ダウンロード-いいえ アップロード-いいえ |
テキスト分類器エンリッチメント | 分類器の .csv ファイルをバックアップし、ローカルに保管します。 詳しくは、 テキスト分類器 を参照してください。 | いいえ | はい | アップロード-いいえ ダウンロード-いいえ |
センテンス・ラベル付けからのセンテンス分類器エンリッチメント | 作成したセンテンス分類器モデルの .sc ファイルを、センテンス・ラベル付け UI からダウンロードします。 詳しくは、 センテンス分類器の復元 を参照してください。 | はい | はい | ダウンロード-いいえ アップロード-いいえ |
文書分類器エンリッチメント | 分類器の .csv ファイルをバックアップし、ローカルに保管します。 詳しくは、 コンテンツ・マイニング・アプリケーションのリソース を参照してください。 | いいえ | はい | ダウンロード-いいえ アップロード-はい |
辞書エンリッチ | Discovery UI またはコンテンツ・マイニング・アプリケーションを使用して作成した辞書の .csv ファイルをダウンロードします。 詳しくは、 辞書エンリッチメントの復元 を参照してください。
CSV ファイルをアップロードして辞書を作成した場合、その辞書を CSV ファイルとしてダウンロードすることはできません。 |
はい | はい | ダウンロード-いいえ アップロード-はい |
エンティティー・エクストラクター・エンリッチ | エンティティー抽出プログラム・モデルをダウンロードしてローカルに保管し、モデルをバックアップします。 詳しくは、 エンティティー・エクストラクターの復元 を参照してください。 | はい | はい | ダウンロード-いいえ アップロード-いいえ |
正規表現エンリッチ | Discovery UI で指定した正規表現の用語を保持します。 詳しくは、 正規表現のエンリッチメント を参照してください。
API を使用して正規表現エンリッチメントを作成できますが、ダウンロードすることはできません。 |
いいえ | はい | ダウンロード-いいえ アップロード-はい |
パターン・エンリッチ | パターン・エンリッチメントを .zip ファイルとしてダウンロードし、ローカルに保管します。 詳しくは、 パターン・エンリッチメント および パターン・エンリッチメントの復元 を参照してください。 | はい | はい | ダウンロード-いいえ アップロード-いいえ |
拡張ルール・エンリッチ | 元のモデルファイルを.zipファイルとしてバックアップし、ローカルに保存します。 詳しくは、 拡張ルール・モデルのエンリッチメント を参照してください。 | いいえ | はい | ダウンロード-いいえ アップロード-いいえ |
Knowledge Studio で作成されたルール・ベース・モデル | 元のモデルファイルを.pearファイルとしてバックアップし、ローカルに保存します。 詳しくは、 インポートされた ML モデルを使用したカスタム項目の検索 を参照してください。 | いいえ | はい | ダウンロード-いいえ アップロード-はい |
Knowledge Studio で作成された機械学習モデル | 元のモデルファイルを.zipファイルとしてバックアップし、ローカルに保存します。 詳しくは、 インポートされた ML モデルを使用したカスタム項目の検索 を参照してください。 | いいえ | はい | ダウンロード-いいえ アップロード-はい |
IBM Cloud Pak for DataIBM Software Hub カスタムUIMAテキスト分析モデル | 元のモデルファイルを.pearファイルとしてバックアップし、ローカルに保存します。 詳しくは、 インポートされた ML モデルを使用したカスタム項目の検索 を参照してください。 | いいえ | はい | ダウンロード-いいえ アップロード-はい |
元のファイルは Discoveryに保管されていないため、後で Discovery に追加したファイルをダウンロードすることはできません。 ただし、元のファイルが処理されるときに、コレクション索引に保管されているファイルから情報を取得することができます。 照会 API を使用して、対象のファイルからパッセージを返す照会を送信し、ファイルからのデータの応答本文を確認します。 例えば、一部のファイル・タイプでは、元のファイルのテキストが
text
フィールドに保管されます。
コンテンツ・マイニング・アプリケーションで作成されるリソースについては、 コンテンツ・マイニング・リソース を参照してください。
センテンス分類器エンリッチメント
センテンス・ラベル付け UI から作成されたセンテンス分類器モデルをバックアップするには、モデルをダウンロードしてローカルに保管します。 モデルをダウンロードするには、事前に完全にトレーニングしておく必要があります。 詳しくは、「 センテンス分類器モデルのダウンロード」を参照してください。
取り込まれた文書
アップロードされた文書は変換され、エンリッチされた後に、検索索引に保管されます。 災害が発生した場合、検索索引はリカバリーできません。 すべてのソース文書のバックアップを安全な場所に保管してください。
外部データソースの定期クロールによってドキュメントをインポートしている場合、データソースへの接続を迅速に再確立できるように、データソースの認証情報を外部で保持しておきたいと思うかもしれません。 利用可能なソースの一覧と、それぞれに必要な認証情報は 、「 IBM Cloud データソースの設定」 を参照してください。
照会 API を使用して、元の文書が取り込まれたときに索引に保管されたテキストの一部を取得できます。 詳しくは、「 文書の回復」を参照してください。
トレーニング・データ
トレーニングされたプロジェクトのトレーニング・データの照会と例をバックアップするには、このタスクを参照してください。 トレーニング・データは、プロジェクトの明示的トレーニングに使用され、プロジェクト単位で保管されます。 トレーニング・データを抽出するには、API を使用して Discovery から照会と評価をダウンロードします。 トレーニング・データの照会と例をバックアップするには、以下の手順を実行します。
- トレーニングクエリAPIのリストを使用して、トレーニングデータをダウンロードします。
- トレーニングの照会と例をローカルに保存します。
トレーニング・データで使用する文書 ID は、現在のプロジェクトに含まれている文書を指しています。 新規プロジェクトで同じ ID を使用して、正しい文書が参照されるようにします。 ID が一致していないと、復元された関連性トレーニングは機能しません。
拡張リスト
照会変更に同義語 (照会拡張) を使用している場合は、.json 拡張リストをバックアップし、ローカルに保管します。 詳しくは、同義語の実装を参照してください。
ストップワード
ストップワードの場合はテキスト・ファイルをバックアップします。ストップワードについて詳しくは、ストップワードの定義を参照してください。
コレクション情報
これは必須ではありませんが、各コレクションの 状況の取得 を定期的に行い、情報をローカルに保管することがベスト・プラクティスです。 これらの統計を保持しておくと、後で必要に応じて、回復プロセスが成功したことを確認できます。
Smart Document Understanding モデル
スマートドキュメント理解(SDU)を使用している場合、構成に関連付けられたモデルがあります。 この情報がなくならないように、モデルをエクスポートし、バックアップし、ローカルに保管します。SDU モデルのファイル拡張子は .sdumodel
です。
辞書エンリッチメント
- プロジェクトを開いて、**「改善とカスタマイズ (Improve and customize)」**をクリックします。
- **「改善ツール (Improvement tools)」パネルで「ドメイン概念を学習させる (Teach domain concepts)」をクリックし、「辞書」**をクリックします。
- 辞書の横にあるダウンロード・アイコンをクリックします。 辞書が .csv ファイルとしてダウンロードされます。
正規表現エンリッチメント
正規表現を .csv ファイルとしてバックアップし、ローカルに保管します。 エンリッチメントを再作成できるように、エンリッチメントを作成する際に指定した正規表現をメモしておいてください。 詳しくは、 正規表現 を参照してください。
機械学習エンリッチメント
機械学習モデルの .zip ファイルや .pear ファイルをバックアップし、ローカルに保管します。 詳細については、機械学習エンリッチメントと Watson Explorer Content Analytics Studio のモデルを参照してください。
パターン・エンリッチメント
- プロジェクトを開きます。
- 「改善とカスタマイズ (Improve and customize)」 ページの 「改善ツール (Improvement tools)」 パネルで、 「各ドメインの概念 (Teach domain concepts)」 をクリックし、 「パターン (ベータ) (Patterns (Beta))」 をクリックします。
- パターンの横にあるダウンロード・アイコンをクリックします。 パターン・モデルが .zip ファイルとしてダウンロードされます。
拡張ルール・モデル・エンリッチ
モデル・ファイルを .zip ファイルとしてバックアップし、ローカルに保管します。 詳しくは、 拡張ルール・モデル を参照してください。
分類器エンリッチメント
分類器の .csv ファイルをバックアップし、ローカルに保管します。 詳しくは、 分類器 を参照してください。
エンティティー抽出のエンリッチメント
エンティティー抽出モデルをバックアップするには、モデルをダウンロードしてローカルに保管します。 モデルをダウンロードするには、事前に完全にトレーニングしておく必要があります。 詳しくは、 エンティティー抽出のエクスポート を参照してください。
コンテンツ・マイニング・アプリケーション・リソース
特定のデータ・タイプはバックアップできないため、手動で再作成する必要があります。 アプリケーションが自動的にバックアップしないコンテンツ・マイニング・カスタム・ユーザー・リソースがいくつかあります。 データ損失が発生した場合は、コンテンツ・マイニング・アプリケーションで以下のカスタム・ユーザー・リソースを手動で再作成するか、リソースを含むローカルに保存されたファイルをアップロードする必要があります。
-
カスタム・マップ
-
検索された文書のエクスポート: コンテンツ・マイニング・アプリケーションの 「文書」 ビューで、検索された文書をエクスポートすることはできますが、アプリケーションで再アップロードすることはできません。
-
ファセット分析結果のエクスポート: 「分析のエクスポート・オプション」 ダイアログ・ボックスの 「エクスポート」 アイコン、 「結果のエクスポート」、および 「エクスポート」 をクリックして、ファセット分析の結果をダウンロードできます。
-
コレクション: コレクションを .csv ファイルとしてローカルに保管し、アプリケーションにアップロードした場合は、コンテンツ・マイニング・コレクションを復元できます。 それ以外の場合は、コレクションを手動で再作成する必要があります。
-
ドキュメント分類器: ドキュメント分類器を .csv ファイルとしてローカルに保管し、アプリケーションにアップロードした場合は、ドキュメント分類器を復元できます。 それ以外の場合は、ドキュメント分類器を手動で再作成する必要があります。
-
カスタム・アノテーター
- 辞書: 辞書を .csv ファイルとしてローカルに保管し、アプリケーションにアップロードした場合は、アプリケーションで辞書を復元できます。
- 正規表現: 正規表現を .csv ファイルとしてローカルに保管し、アプリケーションにアップロードした場合は、アプリケーションでその正規表現を復元できます。
- 機械学習モデル: モデルを .zip ファイルとしてローカルに保管し、アプリケーションにアップロードした場合は、機械学習モデルを復元できます。
- PEAR ファイル: .pear ファイルをローカルに保管してアプリケーションにアップロードした場合は、そのファイルをアップロードできます。
以下のリソースはローカルでバックアップできないため、コンテンツ・マイニング・アプリケーションで再作成する必要があります。
- 保存された分析
- レポート
- ダッシュボード
新規 Watson Discovery インスタンスへのデータのリストア
バックアップを使用して別のデータ・センター (リージョンまたはロケーションともいう) の新しい Discovery インスタンスにリストアすることを検討してください。
リストアを開始するには、コレクション、関連付けられたデータ・ソース、およびファイル・バックアップのリストをまず確認します。
- プロジェクトとコレクションを作成します。 Discovery ツールまたは API を使用します。 プロジェクトの作成 および コレクションの作成を参照してください。
- ストップワードをコレクションに再追加します。 ストップワードの定義を参照してください。
- カスタム照会拡張を使用していた場合は、照会拡張を追加します。 同義語の実装を参照してください。
- エンリッチメントのために IBM Watson® Knowledge Studio のカスタム・エンティティー・モデルを使用していた場合は、Discovery インスタンスにそのモデルを再インポートします。 詳しくは、エンリッチメントの管理を参照してください。
プロジェクトとコレクションを以前と同じようにセットアップした後、ソース文書の取り込みを開始します。 以前の文書の取り込みに使用した方法に応じて、独自のソリューションや以下のどちらかの方法を使用することができます。
センテンス分類子の復元
センテンス・ラベル付け UI から作成されたセンテンス分類器モデルを復元するには、エクスポートされた .sc ファイルをインポートして、新しい機械学習モデルを作成します。 エクスポートされたモデルを文ラベル付け UI で開いて作業を続行することはできません。 ただし、完成したモデルをインポートし、それをセンテンス分類子エンリッチメントとしてコレクションに適用することができます。
センテンス分類器モデルをインポートして機械学習エンリッチメントを作成する方法について詳しくは、 インポートされた ML モデルを使用したカスタム用語の検索 を参照してください。
トレーニング・データのリストア
プロジェクトを復元した後、関連性トレーニングモデルの再作成プロセスを開始できます。 トレーニングデータ内のクエリとサンプルを復元するには、 トレーニングクエリ作成API を使用して個々のトレーニングクエリとサンプルを再作成するか、 Discovery でクエリとサンプルを復元してください。 Discovery を使用してトレーニング・データをリストアする方法について詳しくは、トレーニングを使用した結果関連性の改善で、「トレーニング (Train)」ページにアクセスする手順を参照してください。
リストアが正しく行われるように、トレーニング・データ・ポイントで使用する文書 ID が現在のプロジェクトの文書を指していることに注意してください。 新規プロジェクトで同じ ID を使用して、正しい文書が参照されるようにします。 ID が一致していないと、復元された関連性トレーニングは機能しません。
外部データ・ソースへの接続のリストア
予期しないデータ損失が発生すると、外部データ・ソースに対してスケジュールしたクロールが失われる可能性があります。 利用可能なソースのリストについては、IBM Cloud データ・ソースの作成を参照してください。
外部データを復元するには、これらのデータソースへの接続を再確立し、その後、再クロールします。
保管したデータ・ソースの資格情報を見つけるには、選択したデータ・ソース用の手順に従ってください。この手順は、IBM Cloud データ・ソースの構成に記載されています。 これらの手順では、データ・ソースに再接続し、データを Discovery にインポートする方法について説明しています。
Smart Document Understanding モデルのリストア
過去にエクスポートした Smart Document Understanding (SDU) モデルをインポートするには、モデルのインポートおよびエクスポートを参照してください。 SDU モデルのファイル拡張子は .sdumodel
です。
既存のSDUモデルを新しいコレクションにインポートする際には、まず新しいコレクションを作成し、1つの文書を追加してから、モデルをインポートし、残りの文書をアップロードするのがベストプラクティスです。
辞書エンリッチメントのリストア
- プロジェクトを開きます。
- 「改善とカスタマイズ (Improve and customize)」 ページの 「改善ツール (Improvement tools)」 パネルで、 「各ドメインの概念 (Teach domain concepts)」、 「辞書 (DicDictionary)」、 「アップロード」 の順にクリックします。
- **「辞書の適用 (Apply dictionary)」ダイアログ・ボックスで、.csv ファイルの名前を入力し、言語を選択し、ファセット・パスを指定し、「アップロード」**をクリックし、辞書の .csv ファイルを選択します。
- 「作成」 をクリックします。
リカバリー用の辞書の .csv ファイルをアップロードした後は、辞書エディターを使用してさらに用語を編集することはできなくなります。 辞書エディターを使用する場合は、辞書を作成してから、辞書の用語を手動で追加してください。
辞書強化用.csvファイルのアップロードに関する情報は 、「辞書」 を参照してください。
パターン・エンリッチメントのリストア
パターン・エンリッチメントの .zip ファイルを拡張ルール・モデルの .zip ファイルとしてリストアするには、以下の手順を実行します。
- プロジェクトを開きます。
- 「改善とカスタマイズ (Improve and customize)」 ページの 「改善ツール」 パネルで、 「各ドメインの概念 (Teach domain concepts)」、 「拡張ルール・モデル (Advanced rules models)」、 「アップロード」 の順にクリックします。
- **「拡張ルール・モデルの適用 (Apply advanced rules model)」ダイアログ・ボックスで、.zip ファイルの名前を入力し、言語を選択し、結果フィールドを指定し、「アップロード」**をクリックし、拡張ルール・モデルの .zip ファイルを選択します。
- 「作成」 をクリックします。
リカバリー用のパターン・モデルの .zip ファイルをアップロードした後は、パターン・エディターを使用してさらに .zip ファイルを編集することができなくなります。
高度なルールモデルの.zipファイルのアップロードに関する詳細は 、「高度なルールモデル」 を参照してください。
エンティティー抽出プログラムの復元
エンティティー抽出モデルを復元するには、エクスポートされた .ent ファイルをインポートして、新しい機械学習モデルを作成します。 エクスポートされたモデルをエンティティー抽出ツールで開いて作業を続行することはできません。 ただし、完成したモデルをインポートして、それをエンティティー抽出エンリッチメントとしてコレクションに適用することができます。
機械学習エンリッチメントを作成するためにエンティティー抽出モデルをインポートする方法について詳しくは、 インポートされた ML モデルを使用したカスタム用語の検索 を参照してください。