IBM Cloud Docs
IBM Cloud データ・ソースの概要

IBM Cloud データ・ソースの概要

IBM Watson® Discovery を IBM Cloud® 上で使用して、リモート・ソースに接続したり、リモート・ソースから文書をクロールしたりすることができます。

IBM Cloud IBM Cloud のみ

この情報は、管理対象デプロイメントにのみ適用されます。 IBM Cloud Pak for Data データ・ソースについて詳しくは、 Cloud Pak for Data データ・ソースの概要 を参照してください。

スケジュールに従って Discovery に文書をプルできるように、外部データ・ソースに接続します。 Discovery は、データ・ソースを クロール してデータ・ソースから文書をプルします。 クロールは、指定した開始位置から文書を体系的に参照および取得するプロセスです。 クローラーは、最初にデータ・ソースを処理するときに、フルクロールを実行します。 クローラーは、初期クロールの後に実行されるたびにリフレッシュを実行し、新規ファイルおよび変更されたファイルのみを検査します。

すべての Discovery データ・ソース・コネクターは読み取り専用です。 クロール・アカウントに付与されている許可に関係なく、 Discovery は、元のデータ・ソース内のコンテンツの書き込み、更新、削除を行うことはありません。

Discovery を使用して、以下のデータ・ソースからクロールできます。

データ・ソースがリストされていませんか? IBM® App Connect にデータ・ソースへのコネクターがあるかどうかを確認します。 App Connect 用に作成されたデフォルト・コネクターを使用して、データ・ソースから Discoveryにデータを送信できます。 App Connect のデフォルト・コネクターでサポートされるデータ・ソースのリストについては、 コネクター A-Zを参照してください。 App Connect を Discoveryと統合する方法について詳しくは、 How to use IBM App Connect with IBM Watson® Discoveryを参照してください。

App Connect コネクターを使用するには、個別の App Connect インスタンスを作成する必要があります。 有料の App Connect インスタンスで発生したコストは、 Discoveryを使用するコストには含まれません。 インデックス作成を除き、 Discovery は、 App Connect との統合はサポートしていません。

データ・ソース要件

以下の要件と制限事項は、Discovery 上の IBM Cloud に固有のものです。

  • 1 つのコレクションは、1 つのデータ・ソースにのみ接続できます。

  • プランごとに異なるサイズ制限について詳しくは、以下のトピックを参照してください。

データ・ソースの接続とデータ分離

外部データ・ソースに接続する場合、ソースとサービス間の転送データは分離できないため、サービス・インスタンスのデータ分離が低下します。 他のすべてのデータ分離(アットレスト、管理、クエリー)は完全なままである。 サービスとデータ・ソースの間のすべての伝送途中の通信は、TLS v1.2で暗号化されます。 TLS 証明書の秘密鍵は、 AES-256-GCM 暗号化を使用して保存時に暗号化されます。 サービス証明書は 3 年ごとに有効期限が切れ、証明書失効リストは毎月更新されます。 すべての認証情報は、TLS v1.2 を使用する暗号化された接続を介して送信され、 AES-256 暗号化で静止時に暗号化されます。 データ・ソースへの接続では、データ・ソースでサポートされているセキュア・プロトコルが使用されます。

IP 制限のあるデータ・ソースへの接続

一部のデータ・ソースでは、限られた数のトラステッド・ネットワーク・アドレスまたはドメインからのクローラーのみが、そのデータにアクセスして処理することができます。 接続するデータ・ソースのいずれかがこの方法でアクセスを制限する場合は、 IBM管理の IP アドレスをデータ・ソースの許可リストに追加できます。

ネットワーク・アドレスは、時々変更されることがあります。 このページのリポジトリー通知をサブスクライブすることで、これらのアドレスに対する更新をモニターできます。 「トピックの編集」 をクリックし、リポジトリーの「通知」ダイアログで 「監視」 を選択します。

  • 米国ベースのデータ・センターでホストされ、2020 年 5 月 1 日以降に作成されたサービス・インスタンスの場合は、以下の IP アドレスを追加します。

    150.238.21.0/28
    169.48.255.224/28
    174.36.69.128/28
    
  • 米国以外のデータ・センターでホストされ、2021 年 2 月 21 日以降に作成されたサービス・インスタンスの場合は、以下の IP アドレスを追加します。

    159.122.203.64/28
    158.175.114.128/28
    158.176.107.48/28