Salesforce

Salesforceに格納されているドキュメントをクロールします。

IBM Cloud Pak for Data IBM Software Hub

この情報は、インストールされたデプロイメントにのみ適用されます。管理対象配置から Salesforce への接続の詳細については、Salesforce を参照してください。

クロールされる文書

ナレッジベースの記事は、そのバージョンが公開され、言語がen-usの場合のみクロールされます。
Discovery でサポートされているドキュメントのみがクロールされ、それ以外は無視されます。詳細については、サポートされているファイルの種類を参照してください。
ソースが再クロールされると、新しい文書が追加され、更新された文書は最新バージョンに変更され、削除された文書はコレクションのインデックスから削除されます。
すべてのDiscoveryデータ・ソース・コネクタは読み取り専用です。クロールアカウントに付与された権限に関係なく、Discovery は、元のデータソースのコンテンツを書き込んだり、更新したり、削除したりすることはありません。

Discoveryは以下のオブジェクトをクロールすることができます：

アクセス可能なデフォルトおよびカスタムオブジェクト
アカウント
連絡先
ケース
契約
ナレッジ記事
添付ファイル

データ・ソース要件

すべてのインストール済みデプロイメントのデータソースの要件に加えて、Salesforceデータソースは次の要件を満たす必要があります：

接続するインスタンスはEnterpriseプラン以上である必要があります。
接続するデータ・ソースに必要なサービス・ライセンスを取得する必要があります。ライセンスの詳細については、データソースのシステム管理者にお問い合わせください。

Salesforce の詳細については、Salesforce 開発者ドキュメントを参照してください。

前提条件ステップ

Salesforce のドキュメントをクロールするために、Discovery は Web サービス記述言語 (WSDL) ファイルを使用します。 WSDLファイルは、アクセスを管理するAPIを生成するためのウェブサービスを定義する。

Salesforce の Sandbox インスタンスと Production インスタンスの両方からドキュメントをクロールする場合は、それぞれの Web サービスへの接続を個別に確立する必要があります。各WebサービスからJARファイルをダウンロードし、別々のコレクションを設定する必要があります。

WSDL JARファイルのダウンロードに関する情報は、以下のリンクを参照してください

以下の JAR ファイルをダウンロードします。
- force-partner.jar (パートナー WSDL から)
- force-metadata.jar (メタデータ WSDL から)
- force-wsc.jar (Force.com Web Service Connector (WSC) から)
- commons-beanutils.jar (Apache Commons BeanUtils)
JARファイルを圧縮ファイルに圧縮します。次の手順で、圧縮ファイルをDiscoveryにアップロードします。

Salesforce データソースへの接続

Discovery プロジェクトから、以下の手順を完了してください

ナビゲーションペインから、コレクションの管理を選択します。
新しいコレクションをクリックします。
クリック Salesforce し、次に 「次へ」 をクリックします。
コレクションに名前をつける。
Salesforce 内のドキュメントの言語が英語以外の場合は、適切な言語を選択してください。

サポートされる言語のリストについては、言語サポートを参照してください。
オプション：同期スケジュールを変更します。

詳しくは、クロールスケジュールのオプションをご覧ください。
Specify what you want to crawl セクションで、以下のフィールドに値を入力します：

ユーザー名

Salesforce APIを呼び出すためのユーザー名。

パスワード

指定したユーザーのパスワード。

セキュリティー・トークン

Salesforce APIを呼び出すユーザーのセキュリティトークン。

Jar zip アーカイブファイル

先にダウンロードしたJARファイルを含む圧縮ファイルをアップロードする。または、以前にアップロードした圧縮ファイルを選択して再利用することもできます。
オプション：プロキシ設定セクションを展開し、プロキシサーバーを使用してデータソースサーバーにアクセスする場合に必要な情報を追加します。
- プロキシ設定を有効にする：スイッチをオンに設定し、以下の情報を追加する：
  
  ユーザー名
  
  プロキシサーバが認証を必要とする場合に、認証に使用するプロキシサーバのユーザ名。ユーザー名がわからない場合は、プロキシサーバーの管理者にお問い合わせください。
  
  パスワード
  
  プロキシサーバーが認証を必要とする場合に、認証に使用するプロキシサーバーのパスワード。パスワードがわからない場合は、プロキシサーバーの管理者にお問い合わせください。
  
  プロキシサーバーのホスト名またはIPアドレス
  
  プロキシサーバーのホスト名またはIPアドレス。
  
  プロキシー・サーバーのポート番号
  
  プロキシサーバー上で接続したいネットワークポート。
*オブジェクト・タイプ**セクションで、クロールするオブジェクト・タイプを指定する。

デフォルトの動作では、すべてのオブジェクト・タイプがクロールされます。
- カスタム・オブジェクト名の場合は、カスタム・オブジェクト名についての Salesforce API の規則に合わせるために __c を付加します。例えば、MyCustomObject,をクロールするには、MyCustomObject__c を指定します。
- FeedComment, CaseComment, IdeaComment のようなコメントオブジェクトを、FeedItem, Case, Idea のような対応するルートオブジェクトも指定せずに指定しないでください。
- タグ・オブジェクトを指定する場合は、その親も指定する必要があります。例えば、 Account オブジェクトを指定せずに、 AccountTag オブジェクトのみを指定しないでください。
クローラーにサイト上の画像からテキストを抽出させたい場合は、その他の処理設定を展開し、光学式文字認識（OCR）を適用を On に設定します。

OCRが有効で、文書に画像が含まれている場合、処理に時間がかかります。詳しくは、光学式文字認識をご覧ください。
「完了 (Finish)」 をクリックします。

コレクションは素早く作られる。データがコレクションに追加されるため、処理に時間がかかる。

進捗状況を確認したい場合は、アクティビティページにアクセスしてください。ナビゲーションペインから、コレクションの管理をクリックし、クリックしてコレクションを開きます。