IBM Cloud Docs
Salesforce

Salesforce

Crawlen von Dokumenten, die in Salesforce gespeichert sind.

IBM Cloud Pak for Data IBM Software Hub

Diese Informationen gelten nur für installierte Bereitstellungen. Weitere Informationen zur Verbindung mit Salesforce von einer verwalteten Bereitstellung aus finden Sie unter Salesforce.

Welche Dokumente werden gecrawlt

  • Wissensartikel werden nur durchsucht, wenn ihre Version veröffentlicht wurde und ihre Sprache "en-us" ist.
  • Nur Dokumente, die von Discovery unterstützt werden, werden durchsucht; alle anderen werden ignoriert. Weitere Informationen finden Sie unter Unterstützte Dateitypen.
  • Wenn eine Quelle erneut durchsucht wird, werden neue Dokumente hinzugefügt, aktualisierte Dokumente werden auf die aktuelle Version geändert und gelöschte Dokumente werden während der Aktualisierung aus dem Index der Sammlung gelöscht.
  • Alle Discovery Datenquellenkonnektoren sind schreibgeschützt. Unabhängig von den Berechtigungen, die dem Crawl-Konto gewährt werden, schreibt, aktualisiert oder löscht Discovery niemals Inhalte in der ursprünglichen Datenquelle.

Discovery kann die folgenden Objekte crawlen:

  • Alle Standard- und benutzerdefinierten Objekte, auf die Sie Zugriff haben
  • Accounts
  • Ansprechpartner
  • Fälle
  • Verträge
  • Wissensartikel
  • Anhänge

Datenquellenvoraussetzungen

Zusätzlich zu den Datenquellenanforderungen für alle installierten Bereitstellungen muss Ihre Salesforce-Datenquelle die folgenden Anforderungen erfüllen:

  • Die Instanz, mit der Sie sich verbinden möchten, muss Teil eines Enterprise-Tarifs oder höher sein.
  • Sie müssen alle erforderlichen Servicelizenzen für die Datenquelle erwerben, mit der Sie eine Verbindung herstellen möchten. Weitere Informationen zu Lizenzen erhalten Sie vom Systemadministrator der Datenquelle.

Weitere Informationen über Salesforce finden Sie in der Salesforce Entwicklerdokumentation.

Vorausgesetzter Schritt

Um Dokumente in Salesforce zu crawlen, verwendet Discovery eine WSDL-Datei (Web Service Description Language). Die WSDL-Datei definiert einen Webdienst, um eine API zu erstellen, die den Zugriff verwaltet.

Wenn Sie planen, Dokumente sowohl von einer Sandbox- als auch von einer Produktionsinstanz von Salesforce zu crawlen, müssen Sie eine Verbindung zu jedem Webservice separat herstellen. Sie müssen JAR-Dateien von jedem Webdienst herunterladen und separate Sammlungen einrichten.

Informationen zum Herunterladen der WSDL-JAR-Dateien finden Sie unter den folgenden Links:

  1. Laden Sie die folgenden JAR-Dateien herunter:

    • force-partner.jar (von Partner-WSDL)
    • force-metadata.jar (von Metadaten-WSDL)
    • force-wsc.jar (von force.com Web Service Connector (WSC))
    • commons-beanutils.jar (von Apache Commons BeanUtils)
  2. Komprimieren Sie die JAR-Dateien in eine komprimierte Datei. Im nächsten Schritt laden Sie die komprimierte Datei nach Discovery hoch.

Verbinden mit einer Salesforce-Datenquelle

Führen Sie die folgenden Schritte für Ihr Discovery-Projekt aus:

  1. Wählen Sie im Navigationsbereich Sammlungen verwalten.

  2. Klicken Sie auf "Neue Kollektion ".

  3. Klicken Sie auf Salesforce und dann auf Weiter.

  4. Benennen Sie die Sammlung.

  5. Wenn die Sprache der Dokumente in Salesforce nicht Englisch ist, wählen Sie die entsprechende Sprache.

    Eine Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung.

  6. Optional: Ändern Sie den Synchronisierungszeitplan.

    Weitere Informationen finden Sie unter Kriechplanoptionen.

  7. Geben Sie im Abschnitt Specify what you want to crawl Werte in die folgenden Felder ein:

    Benutzername
    Der Benutzername zum Aufrufen der Salesforce-API.
    Kennwort
    Das Kennwort des angegebenen Benutzers.
    Sicherheitstoken
    Das Sicherheitstoken des Benutzers, um die Salesforce-API aufzurufen.
    Jar-Zip-Archivdatei
    Laden Sie eine komprimierte Datei hoch, die die JAR-Dateien enthält, die Sie zuvor heruntergeladen haben. Oder wählen Sie eine komprimierte Datei aus, die Sie zuvor hochgeladen haben, um sie wiederzuverwenden.
  8. Optional: Erweitern Sie den Abschnitt Proxyeinstellungen, um Informationen hinzuzufügen, die erforderlich sind, wenn Sie einen Proxyserver für den Zugriff auf den Datenquellserver verwenden.

    • Proxy-Einstellungen aktivieren: Stellen Sie den Schalter auf Ein, und fügen Sie dann die folgenden Informationen hinzu:

      Benutzername
      Der Proxyserver-Benutzername, der zur Authentifizierung verwendet werden soll, wenn der Proxyserver eine Authentifizierung erfordert. Wenn Sie Ihren Benutzernamen nicht kennen, können Sie ihn beim Administrator Ihres Proxy-Servers erfragen.
      Kennwort
      Das Passwort des Proxyservers, das zur Authentifizierung verwendet werden soll, wenn der Proxyserver eine Authentifizierung erfordert. Wenn Sie Ihr Passwort nicht kennen, können Sie es beim Administrator Ihres Proxy-Servers erfragen.
      Hostname oder IP-Adresse des Proxyservers
      Der Hostname oder die IP-Adresse des Proxy-Servers.
      Portnummer des Proxy-Servers
      Der Netzwerkport, mit dem Sie sich auf dem Proxy-Server verbinden möchten.
  9. Im Abschnitt Objekttypen* geben Sie die zu durchsuchenden Objekttypen an.

    Das Standardverhalten besteht darin, alle Objekttypen zu durchsuchen.

    • Hängen Sie zur Einhaltung der Salesforce-API-Konvention für angepasste Objektnamen bei angepassten Objektnamen __c an. Um zum Beispiel MyCustomObject, zu crawlen, geben Sie MyCustomObject__c an.
    • Geben Sie kein Kommentarobjekt an, wie z. B. FeedComment, CaseComment, IdeaComment, ohne auch das entsprechende Stammobjekt anzugeben, wie z. B. FeedItem, Case und Idea.
    • Wenn Sie ein Tag-Objekt angeben, müssen Sie auch das übergeordnete Objekt angeben. Geben Sie zum Beispiel das Objekt AccountTag nicht an, ohne auch das Objekt Account anzugeben.
  10. Wenn Sie möchten, dass der Crawler Text aus Bildern auf der Website extrahiert, erweitern Sie Weitere Verarbeitungseinstellungen und setzen Sie optische Zeichenerkennung (OCR) anwenden auf On.

    Wenn OCR aktiviert ist und Ihre Dokumente Bilder enthalten, dauert die Verarbeitung länger. Weitere Informationen finden Sie unter Optische Zeichenerkennung.

  11. Klicken Sie auf Beenden.

Die Sammlung ist schnell erstellt. Die Verarbeitung der Daten nimmt mehr Zeit in Anspruch, da sie der Sammlung hinzugefügt werden.

Wenn Sie den Fortschritt überprüfen möchten, gehen Sie auf die Seite Aktivität. Klicken Sie im Navigationsbereich auf Sammlungen verwalten und dann auf , um die Sammlung zu öffnen.