IBM Cloud Docs
Erste Schritte mit Watson Discovery

Erste Schritte mit Watson Discovery

In diesem Lernprogramm stellen wir IBM Watson® Discovery vor und führen Sie durch das Beispielprojekt Discovery. Das Erkunden des Beispielprojekts ist eine großartige Möglichkeit, einige Funktionen des Produkts kennenzulernen und auszuprobieren.

Vorbereitende Schritte

Wählen Sie den entsprechenden Schritt für Ihre Implementierung aus:

  • IBM Cloud Pak for DataIBM Software Hub Installieren Sie Discovery. Informationen hierzu finden Sie in Discovery for Cloud Pak for Data installieren.

  • IBM Cloud Führen Sie die folgenden Schritte aus:

    1. Eröffnen Sie ein IBM Cloud-Konto oder melden Sie sich an.

    2. Sie können einen Plus-Plan für 30 Tage kostenlos verwenden. Um jedoch eine Plus-Plan-Instanz des Service erstellen zu können, benötigen Sie ein gebührenpflichtiges Konto.

      Weitere Informationen zum Erstellen eines gebührenpflichtigen Kontos finden Sie unter Upgrade für Ihr Konto durchführen.

      Wenn Sie den Plus-Plan nicht mehr nutzen möchten und nicht dafür bezahlen möchten, löschen Sie die Service-Instanz, bevor die 30-tägige Testphase endet.

    3. Rufen Sie die Seite Discovery-Ressource im IBM Cloud-Katalog auf und erstellen Sie eine Serviceinstanz des Plus-Plans.

Öffnen Watson Discovery

IBM Cloud

Diese Anweisungen gelten für alle verwalteten Implementierungen einschließlich IBM Cloud Pak for Data as a Service-Instanzen.

  1. Klicken Sie auf die von Ihnen erstellte Discovery-Instanz, um zum Service-Dashboard zu gelangen.

  2. Klicken Sie auf der Seite Verwalten auf die Option Watson Discovery starten.

Wenn Sie aufgefordert werden, sich anzumelden, geben Sie Ihre IBM Cloud-Berechtigungsnachweise an.

IBM Cloud Pak for Data IBM Software Hub

Diese Anweisungen gelten für Discovery-Implementierungen:

  1. Erweitern Sie im Hauptmenü des Web-Clients "Services " und klicken Sie dann auf "Instanzen ".

  2. Suchen Sie Ihre Instanz und klicken Sie darauf, um die zugehörige Zusammenfassungsseite zu öffnen.

    Sie können maximal 10 Instanzen pro Bereitstellung erstellen. Nachdem Sie die maximale Anzahl erreicht haben, wird die Schaltfläche "Neue Instanz" in IBM Cloud Pak for Data nicht mehr angezeigt.

  3. Klicken Sie auf Tool starten.

Beispielprojekt öffnen

Ein neuer Browser-Tab oder ein neues Browser-Fenster wird geöffnet und die Seite "Meine Projekte" wird angezeigt.

Zeigt die Hauptseite 'Eigene Projekte' mit einer einzelnen Kachel 'Beispielprojekt'.
My projects page of the Sample project

Um sich mit dem Produkt vertraut zu machen, können Sie ein unter 3-minütiges Übersichtsvideo ansehen, indem Sie auf der Produktseite auf den Link Video ansehen klicken.

In diesem Lernprogramm untersuchen Sie das Beispielprojekt.

Das Beispielprojekt ist ein integriertes Projekt, das als Ressource für Sie bereitgestellt wird, um das Produkt zu erkunden. Das Beispielprojekt hat den Projekttyp Dokumentabruf. Dokumentabrufprojekte werden verwendet, um die relevantesten Antworten aus Ihren Daten zu suchen und zu finden.

  1. Klicken Sie auf Beispielprojekt.

    Die Seite Verbessern und anpassen wird angezeigt.

    Wenn Sie Discovery gerade erst installiert haben, benötigt das Beispielprojekt Zeit, um die Verarbeitung der Dokumente abzuschließen. Warten Sie, bis die Verarbeitung abgeschlossen ist, bevor Sie mit dem Experimentieren beginnen. Sie können den Status der Datenverarbeitung auf der Seite Aktivität überprüfen, die im nächsten Schritt beschrieben wird.

    Zeigt die Seite 'Verbessern und Anpassen' für das Beispielprojekt.
    Sample project Improve and customize page

Informationen zur Beispielsammlung

Hier erfahren Sie, wie Sie eine Sammlung verwalten und erweitern können, indem Sie die mit dem Beispielprojekt verfügbare Beispielsammlung untersuchen. Die Beispielsammlung besteht aus einer Gruppe hochgeladener PDF-Dokumente für IBM Support.

  1. Klicken Sie auf das Symbol "Sammlungen verwalten" im Navigationsbereich.

    Hier werden alle Sammlungen in Ihrem Projekt angezeigt. Dieses Projekt verfügt nur über eine Sammlung.

    Zeigt die Seite 'Sammlungen' nur mit der Beispielsammlung an.
    Collections page in the Sample project

  2. Klicken Sie auf Sample Collection.

    Die Seite "Aktivität" wird angezeigt. Diese Seite zeigt den Status der Sammlung an. Beispielsweise wird die Gesamtzahl der Dokumente und der Zeitpunkt der letzten Aktualisierung angezeigt. Wenn bei der Erkennung beim Hochladen eines Dokuments oder beim Durchsuchen einer Datenquelle ein Problem auftritt, werden hier alle zugehörigen Nachrichten angezeigt.

    Zeigt die Aktivitätsseite für die Beispielsammlung an.
    Activities page in the Sample project

    Nachdem Sie eine Objektgruppe erstellt haben, können Sie auf dieser Seite nach Informationen zum Verarbeitungsstatus der Daten in der Objektgruppe suchen.

  3. Klicken Sie auf die Registerkarte Aufbereitungen.

    Auf der Seite Aufbereitungen wird eine Liste der verfügbaren Aufbereitungen angezeigt. Aufbereitungen erleichtern die Suche und Rückgabe aussagekräftiger Informationen in Suchvorgängen. Sie können integrierte Aufbereitungen auf Ihre Sammlung anwenden, um leistungsfähige Modelle von Natural Language Understanding zu nutzen, die Begriffe wie allgemein bekannte Schlüsselwörter taggen.

    Zeigt die Seite 'Aufbereitungen' für die Beispielsammlung.
    Enrichments page of the Sample project

    Die Aufbereitung Entities wird auf die Beispielsammlung angewendet:

    Entitäten
    Erkennt Substantive wie Personen, Städte und Organisationen, die im Inhalt erwähnt werden.

    Diese Aufbereitung wird automatisch auf Sammlungen angewendet, die Projekten des Typs Dokumentabruf hinzugefügt werden.

  4. Klicken Sie für die Aufbereitung für Entitäten v2 auf 1x Ausgewählte Felder.

    Eine Liste der verfügbaren Felder wird angezeigt und das Feld text ist ausgewählt. Diese Auswahl bedeutet, dass die Aufbereitung Entitäten auf Inhalte angewendet wurde, die indexiert und einem Feld namens text hinzugefügt wurden, als Dokumente aus der Objektgruppe verarbeitet wurden.

    Zeigt, dass die Entitätsaufbereitung auf das Textfeld angewendet wird.
    Entities enrichment being applied to the text field

    Auf dieser Seite können Sie neue Aufbereitungen auf Ihre Sammlung anwenden oder die Felder ändern, auf die eine Aufbereitung angewendet wird.

    Eine leistungsfähige Funktion von Discovery besteht darin, dass Sie eigene benutzerdefinierte Aufbereitungen wie Wörterverzeichnisse, Muster und Modelle für maschinelles Lernen hinzufügen können. Wenn Sie benutzerdefinierte Aufbereitungen erstellen, werden diese auch auf dieser Seite aufgelistet. Sie können von hier aus verwalten, wo sie verwendet werden.

    Weitere Informationen zu benutzerdefinierten Aufbereitungen finden Sie unter Domänenspezifische Ressourcen hinzufügen.

  5. Sie werden eine weitere Aufbereitung auf die Objektgruppe anwenden. Suchen Sie die Aufbereitung Schlüsselwörter in der Liste und klicken Sie anschließend auf Felder auswählen.

    Die Aufbereitung von Schlüsselwörtern erkennt wichtige allgemein bekannte Begriffe in Ihren Inhalten.

  6. Blättern Sie durch die Liste der Felder, bis Sie das Feld text finden, und wählen Sie es aus.

    Zeigt die Felder, auf die Sie die Aufbereitung für Schlüsselwörter anwenden können.
    Fields to which you can apply the Keywords enrichment

  7. Klicken Sie auf Änderungen anwenden und erneut verarbeiten.

    Während Ihre Dokumente erneut verarbeitet werden, um nach Schlüsselwörtern zu suchen und diese zu kennzeichnen, können Sie die verfügbaren Tools für die Verwaltung einer Objektgruppe untersuchen.

  8. Klicken Sie auf Felder identifizieren.

    Die meisten Inhalte aus einem Dokument werden im Feld text automatisch indexiert. Sie können bestimmte Inhaltstypen in verschiedenen Feldern indexieren oder große Dokumente aufteilen, sodass das Feld text weniger Passagen pro Dokument enthält. Dazu können Sie Discovery beibringen, wichtige Felder in Ihren Dokumenten zu erkennen, indem Sie ein Smart Document Understanding-Modell auf Ihre Sammlung anwenden.

    Smart Document Understanding (SDU) ist eine Technologie, die basierend auf der Struktur des Dokuments über den Inhalt eines Dokuments informiert. Sie können ein vordefiniertes SDU-Modell anwenden oder ein angepasstes SDU-Modell erstellen.

    Zeigt die SDU-Modelloptionen.
    Smart Document Understanding model options

    Zum Erstellen eines angepassten SDU-Modells wählen Sie die Option Benutzertrainiertes Modell aus und annotieren anschließend Felder in Ihrem Dokument. (Dokumente werden im Rahmen dieses Lernprogramms nicht annotiert.)

    Zeigt das Smart Document Understanding-Tool.
    Smart Document Understanding annotation tool

    Weitere Informationen zu SDU finden Sie unter Smart Document Understanding verwenden.

  9. Klicken Sie auf Felder verwalten.

    Auf der Seite Felder verwalten werden die indexierten Felder aufgelistet. Hier können Sie Felder in den Index einschließen oder daraus entfernen. Sie können auch große Dokumente in viele kleinere Dokumente aufteilen.

    Zeigt die Felder im Index an.
    Fields in the collection index

    Weitere Informationen zum Aufteilen von Dokumenten finden Sie unter Dokumente aufteilen, um Abfrageergebnisse prägnanter zu machen.

Beispielprojekt durchsuchen

  1. Klicken Sie im Navigationsbereich auf das Symbol "Verbessern und anpassen ".

    Auf der Seite "Verbessern und anpassen " können Sie Abfragen ausprobieren und dann Anpassungen hinzufügen und testen, um die Abfrageergebnisse für Ihr Projekt zu verbessern. Es wird eine Liste mit Beispielabfragen angezeigt, die Sie beim Übergeben von Testabfragen unterstützen.

  2. Klicken Sie auf die Schaltfläche Suche ausführen für IBM.

    Abfrageergebnisse werden angezeigt.

  3. Klicken Sie in einem der Abfrageergebnisse auf Passagen im Dokument anzeigen.

    Eine Vorschau des Dokuments, in dem das Ergebnis gefunden wurde, wird angezeigt.

  4. Gehen Sie wie folgt vor, um das Suchergebnis zu untersuchen.

    1. Klicken Sie auf "Erweiterte Ansicht öffnen ".

      Es werden nützliche Übersichtsdaten angezeigt, wie beispielsweise die Anzahl der Vorkommen von Aufbereitungen, die im Dokument erkannt werden.

    2. Wählen Sie die Entität URL aus, um Erwähnungen von URLs im Text hervorzuheben.

      Zeigt die erweiterte Textansicht mit hervorgehobenen URL-Entitäten.
      Advanced view that shows entities that were recognized

    3. Wenn Sie sehen möchten, wie die Informationen aus dem Dokument im JSON-Format gespeichert werden, klicken Sie im Ansichtsheader auf das Menü Anzeigen als und wählen Sie JSON aus.

      Eine JSON-Darstellung des Dokuments wird angezeigt.

      Zeigt die JSON-Darstellung des Dokuments an
      JSON representation of the document

      Sie können die JSON-Darstellung untersuchen, um Informationen anzuzeigen, die Discovery aus dem Dokument erfasst hat. Wenn Sie beispielsweise den Abschnitt enriched_text und anschließend den Abschnitt entities erweitern, werden Erwähnungen von Entitäten angezeigt, die von der Entitätsaufbereitung erkannt und mit Tags versehen wurden.

      Zeigt den Abschnitt entriched_text.entities der JSON-Datei.
      Shows the enrichment_text.entities section of the JSON representation

Beispielprojekt anpassen

Passen Sie nun die Suchergebnissicht ein wenig an, indem Sie eine Facette hinzufügen. Eine Facette ist eine Möglichkeit, Dokumente zu organisieren und zu klassifizieren, die ähnliche Muster oder Inhalte gemeinsam nutzen.

  1. Übergeben Sie auf der Seite Verbessern und Anpassen die folgende Abfrage in natürlicher Sprache:

    How do I install Discovery?
    
  2. Überprüfen Sie die angezeigten Abfrageergebnisse.

    Zeigt die Abfrageergebnisse für eine Abfrage in natürlicher Sprache mit erweiterter Facette 'Häufigste Entitäten ' an.
    Top Entities facet results

    Beachten Sie, dass der Abschnitt Top Entities angezeigt wird. Sie können die Entitäten erweitern und auf eine Entität klicken, um die Abfrageergebnisse zu filtern, sodass nur die Ergebnisse angezeigt werden, in denen die Entität erwähnt wird. Der Abschnitt Top Entities ist eine integrierte Facette. Es verwendet Informationen, die den Dokumenten durch die Entitätsaufbereitung hinzugefügt wurden.

    Sie fügen Ihre eigene Facette hinzu, die die Aufbereitung für Schlüsselwörter verwendet, die Sie im vorherigen Schritt auf die Objektgruppe angewendet haben.

  3. Erweitern Sie im Bereich "Verbesserungswerkzeuge" die Option "Anzeige anpassen " und klicken Sie dann auf "Facetten ".

    Zeigt den erweiterten Abschnitt 'Anzeige anpassen' im Teilfenster 'Verbesserungstools' an.
    Customize display options

  4. Klicken Sie auf "Neue Facette " und dann auf die Schaltfläche "Aus vorhandenen Feldern in einer Sammlung ".

  5. Wählen Sie enriched_text.keywords.mentions.text aus, ändern Sie die Bezeichnung in Keywords und klicken Sie dann auf Anwenden.

    Zeigt die Facettenanzeige, in der eine Schlüsselwortfacette hinzugefügt wird.
    Creating a Keywords-based facet

    Erinnern Sie sich an die JSON-Darstellung des Dokuments, das Sie zuvor angesehen haben? Jetzt, da die Aufbereitung für Schlüsselwörter auf das Feld text angewendet und die Dokumente erneut verarbeitet werden, werden alle im Feld text gefundenen Erwähnungen von Schlüsselwörtern in die JSON-Darstellung des Dokuments eingeschlossen.

    Das für die Facette ausgewählte Feld (enriched_text.keywords.mentions.text) gibt an, wo der Schlüsselworttext in JSON gespeichert ist.

    "enriched_{field_name}": [
      "keywords" : [
        "mentions" : [
          "text": "Cloud Pak"
        ]
      ]
    ]
    
  6. Die neue Facette wird angezeigt. Sie können auf ein Schlüsselwort klicken, um die Dokumente zu filtern, um nur die Ergebnisse einzuschließen, in denen das Schlüsselwort erwähnt wird.

    Zeigt, wie die Schlüsselwortfacette aussieht.
    Keywords facet

Sie haben erfolgreich eine integrierte NLU-Aufbereitung hinzugefügt, die Schlüsselwörter in den Beispielsammlungsdokumenten erkennt. Anschließend haben Sie eine Facette hinzugefügt, die die Aufbereitung für Schlüsselwörter verwendet, damit Sie die Dokumente nach Schlüsselwort filtern können.

Beispielprojekt gemeinsam nutzen

  1. Klicken Sie im Navigationsfenster auf Integrieren und implementieren.

    Von hier aus können Sie Ihr Projekt mit Kollegen teilen und es umsetzen.

  2. Folgen Sie den Anweisungen auf dem Bildschirm, um einen Benutzer hinzuzufügen, und senden Sie dann die Anmeldedaten und den bereitgestellten Link an Ihren Kollegen.

    Zeigt die Seite 'Integrieren und implementieren'.
    Integrate and deploy page

    Nachdem Sie Ihre eigene Suchanwendung erstellt haben und bereit sind, sie bereitzustellen, können Sie vordefinierte Benutzerschnittstellenkomponenten verwenden oder eine angepasste Anwendung erstellen.

    • Klicken Sie auf API-Informationen. Auf dieser Seite können Sie die Projekt-ID für Ihr Projekt abrufen. Sie benötigen die Projekt-ID, um die Erkennungs-API verwenden zu können. Sie benötigen außerdem die Service-Instanz URL und den API-Schlüssel. Die Details zu den Berechtigungsnachweisen finden Sie auf der Seite "Verwalten" Ihrer Service-Instanz unter IBM Cloud.

    • Klicken Sie auf UI-Komponenten, um Links zu gebrauchsfertiger Code zu finden, mit dem Sie schneller eine voll ausgestattete Suchanwendung erstellen können.

Eigenen Inhalt hinzufügen

Nachdem Sie nun mehr über einige der Produktfunktionen erfahren haben, können Sie die Daten auswerten, die Sie durchsuchen wollen.

Es geht um die Daten. Prüfen Sie die Inhaltstypen, deren Eigentümer Sie sind und die Ihre Suchlösung nutzen kann.

Unterstützte Datenquellen

Die folgende Tabelle zeigt die unterstützten Datenquellen für jeden Implementierungstyp.

Unterstützte Datenquellen
Diese Tabelle enthält Zeilen-und Spaltenüberschriften. Die Zeilenüberschriften geben unterstützte Datenquellen an. Die Spaltenüberschriften geben die verschiedenen Optionen für den Produktimplementierungstyp an. Um zu verstehen, welche Datenquellen für Ihren Bereitstellungstyp verfügbar sind, wechseln Sie zu der Zeile, die die Datenquelle beschreibt, und suchen Sie die Spalten für den Bereitstellungstyp, an dem Sie interessiert sind.
Datenquelle IBM Cloud IBM Cloud Pak for Data
Box Häkchen-Symbol Häkchen-Symbol
Datenbank (IBM Data Virtualization, IBM Db2, Microsoft SQL, Oracle, Postgres) Häkchen-Symbol
FileNet P8 Häkchen-Symbol
HCL Notes Häkchen-Symbol
IBM Cloud Object Storage Häkchen-Symbol
Lokales Dateisystem Häkchen-Symbol
Salesforce Häkchen-Symbol Häkchen-Symbol
Microsoft SharePoint Online Häkchen-Symbol Häkchen-Symbol
Microsoft SharePoint (lokal) Häkchen-Symbol Häkchen-Symbol
Website Häkchen-Symbol Häkchen-Symbol
Microsoft Windows dateisystem Häkchen-Symbol

Sie sind sich nicht sicher, was Sie erstellen können?

Weitere Informationen zu den Typen von Suchlösungen, die Sie erstellen können, finden Sie unter Wertschöpfung aus Ihren Daten.

Sie können jederzeit auf die Produktdokumentation zugreifen, indem Sie das Hilfesymbol Hilfesymbol in der Seitenkopfzeile der Produktbenutzerschnittstelle auswählen. Der Hilfeinhalt wird angepasst, um Informationen bereitzustellen, die sich auf Ihre Aktivitäten im Produkt beziehen.

Egal, was Sie erstellen, Schritt eins ist, ein Projekt zu erstellen. Entscheiden Sie, welcher Projekttyp Ihren Anforderungen am besten entspricht.

Wenn keiner der vorhandenen Typen recht gut ist, können Sie Keiner der oben genannten auswählen, um stattdessen ein angepasstes Projekt zu erstellen.

Projektbeschreibungen

Anwendungsfälle für den Projekttyp
Müssen Ziel Projekttyp
Ich möchte Daten extrahieren, um die Automatisierung sich wiederholender Dokumentverarbeitungstasks zu unterstützen Ich möchte schnell verstehen, welche Daten aus meinen Dokumenten extrahiert werden, und die Daten durch die Anwendung von Aufbereitungen verbessern. Intelligente Dokumentverarbeitung
Welches Dokument enthält die Antwort auf meine Frage? Suchen Sie aussagekräftige Informationen in Quellen, die eine Mischung aus strukturierten und unstrukturierten Daten enthalten, und stellen Sie sie in einer eigenständigen Anwendung für die Unternehmenssuche oder im Suchfeld einer Geschäftsanwendung dar. Dokumentabruf
Wo ist der Teil des Vertrags, den ich für meine Aufgabe benötige? Extrahieren Sie schnell kritische Informationen aus Verträgen. Dokumentabruf für Verträge
Ich möchte, dass der Chatbot, den ich erstelle, mein eigenes Wissen nutzt. Geben Sie einem virtuellen Assistenten schnellen Zugriff auf technische Informationen, die in verschiedenen externen Datenquellen und Dokumentformaten gespeichert sind, um Kundenfragen zu beantworten Dialogsuche
Ich möchte Erkenntnisse gewinnen, über die ich nicht gefragt habe. Gewinnen Sie Erkenntnisse aus Musteranalysen oder führen Sie Ursachenanalysen durch. Content Mining

Weitere Informationen finden Sie unter Projekte erstellen.