Salesforce
Salesforceに格納されているドキュメントをクロールします。
IBM Cloud Pak for Data IBM Software Hub
この情報は、インストールされたデプロイメントにのみ適用されます。 管理対象配置から Salesforce への接続の詳細については、Salesforce を参照してください。
クロールされる文書
- ナレッジベースの記事は、そのバージョンが公開され、言語がen-usの場合のみクロールされます。
- Discovery でサポートされているドキュメントのみがクロールされ、それ以外は無視されます。 詳細については、サポートされているファイルの種類 を参照してください。
- ソースが再クロールされると、新しい文書が追加され、更新された文書は最新バージョンに変更され、削除された文書はコレクションのインデックスから削除されます。
- すべてのDiscoveryデータ・ソース・コネクタは読み取り専用です。 クロールアカウントに付与された権限に関係なく、Discovery は、元のデータソースのコンテンツを書き込んだり、更新したり、削除したりすることはありません。
Discoveryは以下のオブジェクトをクロールすることができます:
- アクセス可能なデフォルトおよびカスタムオブジェクト
- アカウント
- 連絡先
- ケース
- 契約
- ナレッジ記事
- 添付ファイル
データ・ソース要件
すべてのインストール済みデプロイメントの データソースの要件 に加えて、Salesforceデータソースは次の要件を満たす必要があります:
- 接続するインスタンスはEnterpriseプラン以上である必要があります。
- 接続するデータ・ソースに必要なサービス・ライセンスを取得する必要があります。 ライセンスの詳細については、データソースのシステム管理者にお問い合わせください。
Salesforce の詳細については、Salesforce 開発者ドキュメントを参照してください。
前提条件ステップ
Salesforce のドキュメントをクロールするために、Discovery は Web サービス記述言語 (WSDL) ファイルを使用します。 WSDLファイルは、アクセスを管理するAPIを生成するためのウェブサービスを定義する。
Salesforce の Sandbox インスタンスと Production インスタンスの両方からドキュメントをクロールする場合は、それぞれの Web サービスへの接続を個別に確立する必要があります。 各WebサービスからJARファイルをダウンロードし、別々のコレクションを設定する必要があります。
WSDL JARファイルのダウンロードに関する情報は、以下のリンクを参照してください
-
以下の JAR ファイルをダウンロードします。
force-partner.jar
(パートナー WSDL から)force-metadata.jar
(メタデータ WSDL から)force-wsc.jar
(Force.com Web Service Connector (WSC) から)commons-beanutils.jar
(Apache Commons BeanUtils)
-
JARファイルを圧縮ファイルに圧縮します。 次の手順で、圧縮ファイルをDiscoveryにアップロードします。
Salesforce データソースへの接続
Discovery プロジェクトから、以下の手順を完了してください
-
ナビゲーションペインから、コレクションの管理を選択します。
-
新しいコレクションをクリックします。
-
クリック Salesforce し、次に 「次へ」 をクリックします。
-
コレクションに名前をつける。
-
Salesforce 内のドキュメントの言語が英語以外の場合は、適切な言語を選択してください。
サポートされる言語のリストについては、言語サポートを参照してください。
-
オプション:同期スケジュールを変更します。
詳しくは、クロールスケジュールのオプション をご覧ください。
-
Specify what you want to crawl セクションで、以下のフィールドに値を入力します:
- ユーザー名
- Salesforce APIを呼び出すためのユーザー名。
- パスワード
- 指定したユーザーのパスワード。
- セキュリティー・トークン
- Salesforce APIを呼び出すユーザーのセキュリティトークン。
- Jar zip アーカイブファイル
- 先にダウンロードしたJARファイルを含む圧縮ファイルをアップロードする。 または、以前にアップロードした圧縮ファイルを選択して再利用することもできます。
-
オプション:プロキシ設定セクションを展開し、プロキシサーバーを使用してデータソースサーバーにアクセスする場合に必要な情報を追加します。
-
プロキシ設定を有効にする:スイッチをオンに設定し、以下の情報を追加する:
- ユーザー名
- プロキシサーバが認証を必要とする場合に、認証に使用するプロキシサーバのユーザ名。 ユーザー名がわからない場合は、プロキシサーバーの管理者にお問い合わせください。
- パスワード
- プロキシサーバーが認証を必要とする場合に、認証に使用するプロキシサーバーのパスワード。 パスワードがわからない場合は、プロキシサーバーの管理者にお問い合わせください。
- プロキシサーバーのホスト名またはIPアドレス
- プロキシサーバーのホスト名またはIPアドレス。
- プロキシー・サーバーのポート番号
- プロキシサーバー上で接続したいネットワークポート。
-
-
*オブジェクト・タイプ**セクションで、クロールするオブジェクト・タイプを指定する。
デフォルトの動作では、すべてのオブジェクト・タイプがクロールされます。
- カスタム・オブジェクト名の場合は、カスタム・オブジェクト名についての Salesforce API の規則に合わせるために
__c
を付加します。 例えば、MyCustomObject,をクロールするには、MyCustomObject__c
を指定します。 FeedComment
,CaseComment
,IdeaComment
のようなコメントオブジェクトを、FeedItem
,Case
,Idea
のような対応するルートオブジェクトも指定せずに指定しないでください。- タグ・オブジェクトを指定する場合は、その親も指定する必要があります。 例えば、
Account
オブジェクトを指定せずに、AccountTag
オブジェクトのみを指定しないでください。
- カスタム・オブジェクト名の場合は、カスタム・オブジェクト名についての Salesforce API の規則に合わせるために
-
クローラーにサイト上の画像からテキストを抽出させたい場合は、その他の処理設定を展開し、光学式文字認識(OCR)を適用を
On
に設定します。OCRが有効で、文書に画像が含まれている場合、処理に時間がかかります。 詳しくは、光学式文字認識 をご覧ください。
-
「完了 (Finish)」 をクリックします。
コレクションは素早く作られる。 データがコレクションに追加されるため、処理に時間がかかる。
進捗状況を確認したい場合は、アクティビティページにアクセスしてください。 ナビゲーションペインから、コレクションの管理をクリックし、クリックしてコレクションを開きます。