IBM Cloud Docs
Salesforce

Salesforce

Salesforceに格納されているドキュメントをクロールします。

IBM Cloud Pak for Data IBM Software Hub

この情報は、インストールされたデプロイメントにのみ適用されます。 管理対象配置から Salesforce への接続の詳細については、Salesforce を参照してください。

クロールされる文書

  • ナレッジベースの記事は、そのバージョンが公開され、言語がen-usの場合のみクロールされます。
  • Discovery でサポートされているドキュメントのみがクロールされ、それ以外は無視されます。 詳細については、サポートされているファイルの種類 を参照してください。
  • ソースが再クロールされると、新しい文書が追加され、更新された文書は最新バージョンに変更され、削除された文書はコレクションのインデックスから削除されます。
  • すべてのDiscoveryデータ・ソース・コネクタは読み取り専用です。 クロールアカウントに付与された権限に関係なく、Discovery は、元のデータソースのコンテンツを書き込んだり、更新したり、削除したりすることはありません。

Discoveryは以下のオブジェクトをクロールすることができます:

  • アクセス可能なデフォルトおよびカスタムオブジェクト
  • アカウント
  • 連絡先
  • ケース
  • 契約
  • ナレッジ記事
  • 添付ファイル

データ・ソース要件

すべてのインストール済みデプロイメントの データソースの要件 に加えて、Salesforceデータソースは次の要件を満たす必要があります:

  • 接続するインスタンスはEnterpriseプラン以上である必要があります。
  • 接続するデータ・ソースに必要なサービス・ライセンスを取得する必要があります。 ライセンスの詳細については、データソースのシステム管理者にお問い合わせください。

Salesforce の詳細については、Salesforce 開発者ドキュメントを参照してください。

前提条件ステップ

Salesforce のドキュメントをクロールするために、Discovery は Web サービス記述言語 (WSDL) ファイルを使用します。 WSDLファイルは、アクセスを管理するAPIを生成するためのウェブサービスを定義する。

Salesforce の Sandbox インスタンスと Production インスタンスの両方からドキュメントをクロールする場合は、それぞれの Web サービスへの接続を個別に確立する必要があります。 各WebサービスからJARファイルをダウンロードし、別々のコレクションを設定する必要があります。

WSDL JARファイルのダウンロードに関する情報は、以下のリンクを参照してください

  1. 以下の JAR ファイルをダウンロードします。

    • force-partner.jar (パートナー WSDL から)
    • force-metadata.jar (メタデータ WSDL から)
    • force-wsc.jar (Force.com Web Service Connector (WSC) から)
    • commons-beanutils.jar (Apache Commons BeanUtils)
  2. JARファイルを圧縮ファイルに圧縮します。 次の手順で、圧縮ファイルをDiscoveryにアップロードします。

Salesforce データソースへの接続

Discovery プロジェクトから、以下の手順を完了してください

  1. ナビゲーションペインから、コレクションの管理を選択します。

  2. 新しいコレクションをクリックします。

  3. クリック Salesforce し、次に 「次へ」 をクリックします。

  4. コレクションに名前をつける。

  5. Salesforce 内のドキュメントの言語が英語以外の場合は、適切な言語を選択してください。

    サポートされる言語のリストについては、言語サポートを参照してください。

  6. オプション:同期スケジュールを変更します。

    詳しくは、クロールスケジュールのオプション をご覧ください。

  7. Specify what you want to crawl セクションで、以下のフィールドに値を入力します:

    ユーザー名
    Salesforce APIを呼び出すためのユーザー名。
    パスワード
    指定したユーザーのパスワード。
    セキュリティー・トークン
    Salesforce APIを呼び出すユーザーのセキュリティトークン。
    Jar zip アーカイブファイル
    先にダウンロードしたJARファイルを含む圧縮ファイルをアップロードする。 または、以前にアップロードした圧縮ファイルを選択して再利用することもできます。
  8. オプションプロキシ設定セクションを展開し、プロキシサーバーを使用してデータソースサーバーにアクセスする場合に必要な情報を追加します。

    • プロキシ設定を有効にする:スイッチをオンに設定し、以下の情報を追加する:

      ユーザー名
      プロキシサーバが認証を必要とする場合に、認証に使用するプロキシサーバのユーザ名。 ユーザー名がわからない場合は、プロキシサーバーの管理者にお問い合わせください。
      パスワード
      プロキシサーバーが認証を必要とする場合に、認証に使用するプロキシサーバーのパスワード。 パスワードがわからない場合は、プロキシサーバーの管理者にお問い合わせください。
      プロキシサーバーのホスト名またはIPアドレス
      プロキシサーバーのホスト名またはIPアドレス。
      プロキシー・サーバーのポート番号
      プロキシサーバー上で接続したいネットワークポート。
  9. *オブジェクト・タイプ**セクションで、クロールするオブジェクト・タイプを指定する。

    デフォルトの動作では、すべてのオブジェクト・タイプがクロールされます。

    • カスタム・オブジェクト名の場合は、カスタム・オブジェクト名についての Salesforce API の規則に合わせるために __c を付加します。 例えば、MyCustomObject,をクロールするには、MyCustomObject__c を指定します。
    • FeedComment, CaseComment, IdeaComment のようなコメントオブジェクトを、FeedItem, Case, Idea のような対応するルートオブジェクトも指定せずに指定しないでください。
    • タグ・オブジェクトを指定する場合は、その親も指定する必要があります。 例えば、 Account オブジェクトを指定せずに、 AccountTag オブジェクトのみを指定しないでください。
  10. クローラーにサイト上の画像からテキストを抽出させたい場合は、その他の処理設定を展開し、光学式文字認識(OCR)を適用On に設定します。

    OCRが有効で、文書に画像が含まれている場合、処理に時間がかかります。 詳しくは、光学式文字認識 をご覧ください。

  11. 「完了 (Finish)」 をクリックします。

コレクションは素早く作られる。 データがコレクションに追加されるため、処理に時間がかかる。

進捗状況を確認したい場合は、アクティビティページにアクセスしてください。 ナビゲーションペインから、コレクションの管理をクリックし、クリックしてコレクションを開きます。