Erste Schritte mit Watson Discovery
In diesem Lernprogramm stellen wir IBM Watson® Discovery vor und führen Sie durch das Beispielprojekt Discovery. Das Erkunden des Beispielprojekts ist eine großartige Möglichkeit, einige Funktionen des Produkts kennenzulernen und auszuprobieren.
Öffnen Watson Discovery
IBM Cloud
Diese Anweisungen gelten für alle verwalteten Implementierungen einschließlich IBM Cloud Pak for Data as a Service-Instanzen.
-
Klicken Sie auf die von Ihnen erstellte Discovery-Instanz, um zum Service-Dashboard zu gelangen.
-
Klicken Sie auf der Seite Verwalten auf die Option Watson Discovery starten.
Wenn Sie aufgefordert werden, sich anzumelden, geben Sie Ihre IBM Cloud-Berechtigungsnachweise an.
IBM Cloud Pak for Data IBM Software Hub
Diese Anweisungen gelten für Discovery-Implementierungen:
-
Erweitern Sie im Hauptmenü des Web-Clients "Services " und klicken Sie dann auf "Instanzen ".
-
Suchen Sie Ihre Instanz und klicken Sie darauf, um die zugehörige Zusammenfassungsseite zu öffnen.
Sie können maximal 10 Instanzen pro Bereitstellung erstellen. Nachdem Sie die maximale Anzahl erreicht haben, wird die Schaltfläche "Neue Instanz" in IBM Cloud Pak for Data nicht mehr angezeigt.
-
Klicken Sie auf Tool starten.
Beispielprojekt öffnen
Ein neuer Browser-Tab oder ein neues Browser-Fenster wird geöffnet und die Seite "Meine Projekte" wird angezeigt.

Um sich mit dem Produkt vertraut zu machen, können Sie ein unter 3-minütiges Übersichtsvideo ansehen, indem Sie auf der Produktseite auf den Link Video ansehen klicken.
In diesem Lernprogramm untersuchen Sie das Beispielprojekt.
Das Beispielprojekt ist ein integriertes Projekt, das als Ressource für Sie bereitgestellt wird, um das Produkt zu erkunden. Das Beispielprojekt hat den Projekttyp Dokumentabruf. Dokumentabrufprojekte werden verwendet, um die relevantesten Antworten aus Ihren Daten zu suchen und zu finden.
-
Klicken Sie auf Beispielprojekt.
Die Seite Verbessern und anpassen wird angezeigt.
Wenn Sie Discovery gerade erst installiert haben, benötigt das Beispielprojekt Zeit, um die Verarbeitung der Dokumente abzuschließen. Warten Sie, bis die Verarbeitung abgeschlossen ist, bevor Sie mit dem Experimentieren beginnen. Sie können den Status der Datenverarbeitung auf der Seite Aktivität überprüfen, die im nächsten Schritt beschrieben wird.
Sample project Improve and customize page
Informationen zur Beispielsammlung
Hier erfahren Sie, wie Sie eine Sammlung verwalten und erweitern können, indem Sie die mit dem Beispielprojekt verfügbare Beispielsammlung untersuchen. Die Beispielsammlung besteht aus einer Gruppe hochgeladener PDF-Dokumente für IBM Support.
-
Klicken Sie auf das Symbol "Sammlungen verwalten" im Navigationsbereich.
Hier werden alle Sammlungen in Ihrem Projekt angezeigt. Dieses Projekt verfügt nur über eine Sammlung.
Collections page in the Sample project -
Klicken Sie auf Sample Collection.
Die Seite "Aktivität" wird angezeigt. Diese Seite zeigt den Status der Sammlung an. Beispielsweise wird die Gesamtzahl der Dokumente und der Zeitpunkt der letzten Aktualisierung angezeigt. Wenn bei der Erkennung beim Hochladen eines Dokuments oder beim Durchsuchen einer Datenquelle ein Problem auftritt, werden hier alle zugehörigen Nachrichten angezeigt.
Activities page in the Sample project Nachdem Sie eine Objektgruppe erstellt haben, können Sie auf dieser Seite nach Informationen zum Verarbeitungsstatus der Daten in der Objektgruppe suchen.
-
Klicken Sie auf die Registerkarte Aufbereitungen.
Auf der Seite Aufbereitungen wird eine Liste der verfügbaren Aufbereitungen angezeigt. Aufbereitungen erleichtern die Suche und Rückgabe aussagekräftiger Informationen in Suchvorgängen. Sie können integrierte Aufbereitungen auf Ihre Sammlung anwenden, um leistungsfähige Modelle von Natural Language Understanding zu nutzen, die Begriffe wie allgemein bekannte Schlüsselwörter taggen.
Enrichments page of the Sample project Die Aufbereitung Entities wird auf die Beispielsammlung angewendet:
- Entitäten
- Erkennt Substantive wie Personen, Städte und Organisationen, die im Inhalt erwähnt werden.
Diese Aufbereitung wird automatisch auf Sammlungen angewendet, die Projekten des Typs Dokumentabruf hinzugefügt werden.
-
Klicken Sie für die Aufbereitung für Entitäten v2 auf 1x Ausgewählte Felder.
Eine Liste der verfügbaren Felder wird angezeigt und das Feld
text
ist ausgewählt. Diese Auswahl bedeutet, dass die Aufbereitung Entitäten auf Inhalte angewendet wurde, die indexiert und einem Feld namenstext
hinzugefügt wurden, als Dokumente aus der Objektgruppe verarbeitet wurden.Entities enrichment being applied to the text field Auf dieser Seite können Sie neue Aufbereitungen auf Ihre Sammlung anwenden oder die Felder ändern, auf die eine Aufbereitung angewendet wird.
Eine leistungsfähige Funktion von Discovery besteht darin, dass Sie eigene benutzerdefinierte Aufbereitungen wie Wörterverzeichnisse, Muster und Modelle für maschinelles Lernen hinzufügen können. Wenn Sie benutzerdefinierte Aufbereitungen erstellen, werden diese auch auf dieser Seite aufgelistet. Sie können von hier aus verwalten, wo sie verwendet werden.
Weitere Informationen zu benutzerdefinierten Aufbereitungen finden Sie unter Domänenspezifische Ressourcen hinzufügen.
-
Sie werden eine weitere Aufbereitung auf die Objektgruppe anwenden. Suchen Sie die Aufbereitung Schlüsselwörter in der Liste und klicken Sie anschließend auf Felder auswählen.
Die Aufbereitung von Schlüsselwörtern erkennt wichtige allgemein bekannte Begriffe in Ihren Inhalten.
-
Blättern Sie durch die Liste der Felder, bis Sie das Feld
text
finden, und wählen Sie es aus.Fields to which you can apply the Keywords enrichment -
Klicken Sie auf Änderungen anwenden und erneut verarbeiten.
Während Ihre Dokumente erneut verarbeitet werden, um nach Schlüsselwörtern zu suchen und diese zu kennzeichnen, können Sie die verfügbaren Tools für die Verwaltung einer Objektgruppe untersuchen.
-
Klicken Sie auf Felder identifizieren.
Die meisten Inhalte aus einem Dokument werden im Feld
text
automatisch indexiert. Sie können bestimmte Inhaltstypen in verschiedenen Feldern indexieren oder große Dokumente aufteilen, sodass das Feldtext
weniger Passagen pro Dokument enthält. Dazu können Sie Discovery beibringen, wichtige Felder in Ihren Dokumenten zu erkennen, indem Sie ein Smart Document Understanding-Modell auf Ihre Sammlung anwenden.Smart Document Understanding (SDU) ist eine Technologie, die basierend auf der Struktur des Dokuments über den Inhalt eines Dokuments informiert. Sie können ein vordefiniertes SDU-Modell anwenden oder ein angepasstes SDU-Modell erstellen.
Smart Document Understanding model options Zum Erstellen eines angepassten SDU-Modells wählen Sie die Option Benutzertrainiertes Modell aus und annotieren anschließend Felder in Ihrem Dokument. (Dokumente werden im Rahmen dieses Lernprogramms nicht annotiert.)
Smart Document Understanding annotation tool Weitere Informationen zu SDU finden Sie unter Smart Document Understanding verwenden.
-
Klicken Sie auf Felder verwalten.
Auf der Seite Felder verwalten werden die indexierten Felder aufgelistet. Hier können Sie Felder in den Index einschließen oder daraus entfernen. Sie können auch große Dokumente in viele kleinere Dokumente aufteilen.
Fields in the collection index Weitere Informationen zum Aufteilen von Dokumenten finden Sie unter Dokumente aufteilen, um Abfrageergebnisse prägnanter zu machen.
Beispielprojekt durchsuchen
-
Klicken Sie im Navigationsbereich auf das Symbol "Verbessern und anpassen ".
Auf der Seite "Verbessern und anpassen " können Sie Abfragen ausprobieren und dann Anpassungen hinzufügen und testen, um die Abfrageergebnisse für Ihr Projekt zu verbessern. Es wird eine Liste mit Beispielabfragen angezeigt, die Sie beim Übergeben von Testabfragen unterstützen.
-
Klicken Sie auf die Schaltfläche Suche ausführen für
IBM
.Abfrageergebnisse werden angezeigt.
-
Klicken Sie in einem der Abfrageergebnisse auf Passagen im Dokument anzeigen.
Eine Vorschau des Dokuments, in dem das Ergebnis gefunden wurde, wird angezeigt.
-
Gehen Sie wie folgt vor, um das Suchergebnis zu untersuchen.
-
Klicken Sie auf "Erweiterte Ansicht öffnen ".
Es werden nützliche Übersichtsdaten angezeigt, wie beispielsweise die Anzahl der Vorkommen von Aufbereitungen, die im Dokument erkannt werden.
-
Wählen Sie die Entität
URL
aus, um Erwähnungen von URLs im Text hervorzuheben.Advanced view that shows entities that were recognized -
Wenn Sie sehen möchten, wie die Informationen aus dem Dokument im JSON-Format gespeichert werden, klicken Sie im Ansichtsheader auf das Menü Anzeigen als und wählen Sie JSON aus.
Eine JSON-Darstellung des Dokuments wird angezeigt.
JSON representation of the document Sie können die JSON-Darstellung untersuchen, um Informationen anzuzeigen, die Discovery aus dem Dokument erfasst hat. Wenn Sie beispielsweise den Abschnitt
enriched_text
und anschließend den Abschnittentities
erweitern, werden Erwähnungen von Entitäten angezeigt, die von der Entitätsaufbereitung erkannt und mit Tags versehen wurden.Shows the enrichment_text.entities section of the JSON representation
-
Beispielprojekt anpassen
Passen Sie nun die Suchergebnissicht ein wenig an, indem Sie eine Facette hinzufügen. Eine Facette ist eine Möglichkeit, Dokumente zu organisieren und zu klassifizieren, die ähnliche Muster oder Inhalte gemeinsam nutzen.
-
Übergeben Sie auf der Seite Verbessern und Anpassen die folgende Abfrage in natürlicher Sprache:
How do I install Discovery?
-
Überprüfen Sie die angezeigten Abfrageergebnisse.
Top Entities facet results Beachten Sie, dass der Abschnitt Top Entities angezeigt wird. Sie können die Entitäten erweitern und auf eine Entität klicken, um die Abfrageergebnisse zu filtern, sodass nur die Ergebnisse angezeigt werden, in denen die Entität erwähnt wird. Der Abschnitt Top Entities ist eine integrierte Facette. Es verwendet Informationen, die den Dokumenten durch die Entitätsaufbereitung hinzugefügt wurden.
Sie fügen Ihre eigene Facette hinzu, die die Aufbereitung für Schlüsselwörter verwendet, die Sie im vorherigen Schritt auf die Objektgruppe angewendet haben.
-
Erweitern Sie im Bereich "Verbesserungswerkzeuge" die Option "Anzeige anpassen " und klicken Sie dann auf "Facetten ".
Customize display options -
Klicken Sie auf "Neue Facette " und dann auf die Schaltfläche "Aus vorhandenen Feldern in einer Sammlung ".
-
Wählen Sie
enriched_text.keywords.mentions.text
aus, ändern Sie die Bezeichnung inKeywords
und klicken Sie dann auf Anwenden.Creating a Keywords-based facet Erinnern Sie sich an die JSON-Darstellung des Dokuments, das Sie zuvor angesehen haben? Jetzt, da die Aufbereitung für Schlüsselwörter auf das Feld
text
angewendet und die Dokumente erneut verarbeitet werden, werden alle im Feldtext
gefundenen Erwähnungen von Schlüsselwörtern in die JSON-Darstellung des Dokuments eingeschlossen.Das für die Facette ausgewählte Feld (
enriched_text.keywords.mentions.text
) gibt an, wo der Schlüsselworttext in JSON gespeichert ist."enriched_{field_name}": [ "keywords" : [ "mentions" : [ "text": "Cloud Pak" ] ] ]
-
Die neue Facette wird angezeigt. Sie können auf ein Schlüsselwort klicken, um die Dokumente zu filtern, um nur die Ergebnisse einzuschließen, in denen das Schlüsselwort erwähnt wird.
Keywords facet
Sie haben erfolgreich eine integrierte NLU-Aufbereitung hinzugefügt, die Schlüsselwörter in den Beispielsammlungsdokumenten erkennt. Anschließend haben Sie eine Facette hinzugefügt, die die Aufbereitung für Schlüsselwörter verwendet, damit Sie die Dokumente nach Schlüsselwort filtern können.
Beispielprojekt gemeinsam nutzen
-
Klicken Sie im Navigationsfenster auf Integrieren und implementieren.
Von hier aus können Sie Ihr Projekt mit Kollegen teilen und es umsetzen.
-
Folgen Sie den Anweisungen auf dem Bildschirm, um einen Benutzer hinzuzufügen, und senden Sie dann die Anmeldedaten und den bereitgestellten Link an Ihren Kollegen.
Integrate and deploy page Nachdem Sie Ihre eigene Suchanwendung erstellt haben und bereit sind, sie bereitzustellen, können Sie vordefinierte Benutzerschnittstellenkomponenten verwenden oder eine angepasste Anwendung erstellen.
-
Klicken Sie auf API-Informationen. Auf dieser Seite können Sie die Projekt-ID für Ihr Projekt abrufen. Sie benötigen die Projekt-ID, um die Erkennungs-API verwenden zu können. Sie benötigen außerdem die Service-Instanz URL und den API-Schlüssel. Die Details zu den Berechtigungsnachweisen finden Sie auf der Seite "Verwalten" Ihrer Service-Instanz unter IBM Cloud.
-
Klicken Sie auf UI-Komponenten, um Links zu gebrauchsfertiger Code zu finden, mit dem Sie schneller eine voll ausgestattete Suchanwendung erstellen können.
-
Eigenen Inhalt hinzufügen
Nachdem Sie nun mehr über einige der Produktfunktionen erfahren haben, können Sie die Daten auswerten, die Sie durchsuchen wollen.
Es geht um die Daten. Prüfen Sie die Inhaltstypen, deren Eigentümer Sie sind und die Ihre Suchlösung nutzen kann.
Unterstützte Datenquellen
Die folgende Tabelle zeigt die unterstützten Datenquellen für jeden Implementierungstyp.
Datenquelle | IBM Cloud | IBM Cloud Pak for Data |
---|---|---|
Box | ||
Datenbank (IBM Data Virtualization, IBM Db2, Microsoft SQL, Oracle, Postgres) | ||
FileNet P8 | ||
HCL Notes | ||
IBM Cloud Object Storage | ||
Lokales Dateisystem | ||
Salesforce | ||
Microsoft SharePoint Online | ||
Microsoft SharePoint (lokal) | ||
Website | ||
Microsoft Windows dateisystem |
Sie sind sich nicht sicher, was Sie erstellen können?
Weitere Informationen zu den Typen von Suchlösungen, die Sie erstellen können, finden Sie unter Wertschöpfung aus Ihren Daten.
Sie können jederzeit auf die Produktdokumentation zugreifen, indem Sie das Hilfesymbol in der Seitenkopfzeile der Produktbenutzerschnittstelle auswählen. Der Hilfeinhalt wird angepasst, um Informationen
bereitzustellen, die sich auf Ihre Aktivitäten im Produkt beziehen.
Egal, was Sie erstellen, Schritt eins ist, ein Projekt zu erstellen. Entscheiden Sie, welcher Projekttyp Ihren Anforderungen am besten entspricht.
Wenn keiner der vorhandenen Typen recht gut ist, können Sie Keiner der oben genannten auswählen, um stattdessen ein angepasstes Projekt zu erstellen.
Projektbeschreibungen
Müssen | Ziel | Projekttyp |
---|---|---|
Ich möchte Daten extrahieren, um die Automatisierung sich wiederholender Dokumentverarbeitungstasks zu unterstützen | Ich möchte schnell verstehen, welche Daten aus meinen Dokumenten extrahiert werden, und die Daten durch die Anwendung von Aufbereitungen verbessern. | Intelligente Dokumentverarbeitung |
Welches Dokument enthält die Antwort auf meine Frage? | Suchen Sie aussagekräftige Informationen in Quellen, die eine Mischung aus strukturierten und unstrukturierten Daten enthalten, und stellen Sie sie in einer eigenständigen Anwendung für die Unternehmenssuche oder im Suchfeld einer Geschäftsanwendung dar. | Dokumentabruf |
Wo ist der Teil des Vertrags, den ich für meine Aufgabe benötige? | Extrahieren Sie schnell kritische Informationen aus Verträgen. | Dokumentabruf für Verträge |
Ich möchte, dass der Chatbot, den ich erstelle, mein eigenes Wissen nutzt. | Geben Sie einem virtuellen Assistenten schnellen Zugriff auf technische Informationen, die in verschiedenen externen Datenquellen und Dokumentformaten gespeichert sind, um Kundenfragen zu beantworten | Dialogsuche |
Ich möchte Erkenntnisse gewinnen, über die ich nicht gefragt habe. | Gewinnen Sie Erkenntnisse aus Musteranalysen oder führen Sie Ursachenanalysen durch. | Content Mining |
Weitere Informationen finden Sie unter Projekte erstellen.