IBM Cloud Docs
Verwenden Sie die integrierte NLP Watson, um allgemeine Begriffe zu finden

Verwenden Sie die integrierte NLP Watson, um allgemeine Begriffe zu finden

Nutzen Sie die mehrfach ausgezeichneten Funktionen von Watson Natural Language Processing (NLP), indem Sie vordefinierte Aufbereitungen zu Ihren Dokumenten hinzufügen.

Mit Watson NLP können Sie aussagekräftige Informationen in Ihren Sammlungen identifizieren und kennzeichnen, damit Sie verstehen, was alles bedeutet, und fundiertere Entscheidungen treffen können.

Die folgenden Watson-NLP-Aufbereitungen sind verfügbar:

  • Entitäten: Erkennt die richtigen Nomen wie Personen, Städte und Organisationen, die im Inhalt erwähnt werden.
  • Schlüsselwörter: Erkennt wichtige Begriffe in Ihrem Inhalt.
  • Wortart: Gibt die Wortarten (z. B. Nomen und Verben) im Inhalt an
  • Stimmung: Begreift die allgemeine Stimmung des Inhalts.

Die folgenden anderen vortrainierten Aufbereitungen sind mit Discoveryverfügbar:

Watson-NLP-Aufbereitungen

Der folgende Screenshot zeigt beispielsweise ein Transkript der US-Unabhängigkeitserklärung, die einer Discovery-Sammlung hinzugefügt wurde, in der die Aufbereitungen für Entitäten und Schlüsselwörter aktiviert sind. Die Erwähnungen, die von den Aufbereitungen erkannt werden, werden im Dokumenttext hervorgehoben.

Zeigt einen Auszug der US-Unabhängigkeitserklärung mit mehreren hervorgehobenen Begriffen.
Excerpt of the US Declaration of Independence with highlighted terms

Einige der NLP-Aufbereitungen werden automatisch auf Projekte angewendet. Sie müssen sie nicht selbst anwenden, wenn Sie einen dieser Projekttypen verwenden.

Standardaufbereitungen nach Projekttyp

Einige vordefinierte Aufbereitungen werden je nach Projekttyp automatisch auf Sammlungen in einem Projekt angewendet. In der folgenden Tabelle sind die Standardaufbereitungen aufgeführt, die auf jeden Projekttyp angewendet werden.

Standardaufbereitungen nach Projekttyp
Diese Tabelle enthält Zeilen-und Spaltenüberschriften. Die Zeilenüberschriften geben Projekttypen an. Die Spaltenüberschriften geben verschiedene Aufbereitungen an. Um zu verstehen, welche Aufbereitungen standardmäßig auf einen Projekttyp angewendet werden, wechseln Sie zu der Zeile, die die Aufbereitungen beschreibt, und suchen Sie die Spalten für den Projekttyp, an dem Sie interessiert sind.
Aufbereitung Dokumentabruf Dokumentabruf für Verträge Dialogsuche Content Mining
Verträge Häkchen-Symbol
Entitäten Häkchen-Symbol Häkchen-Symbol
Suchbegriffe
Wortart Häkchen-Symbol
Stimmung des Dokuments
Table Understanding Häkchen-Symbol

Weitere Informationen zu den folgenden vorgefertigten Erweiterungen finden Sie in den folgenden Themen:

Weitere Informationen zum Erstellen angepasster Aufbereitungen finden Sie unter Domänenspezifische Ressourcen hinzufügen.

Weitere Informationen dazu, wie Sie Aufbereitungen optimal nutzen können, finden Sie im Blogbeitrag Aufbereiten Ihrer Dokumente kann die Suche effektiver machen.

Weitere Informationen zum Anwenden von Aufbereitungen mithilfe der API finden Sie unter Aufbereitungen mithilfe der API anwenden.

Aufbereitungen hinzufügen

Um eine NLP-Anreicherung hinzuzufügen, führen Sie die folgenden Schritte aus:

  1. Öffnen Sie Ihr Projekt und rufen Sie die Seite Sammlungen verwalten auf.

  2. Klicken Sie hier, um die Sammlung zu öffnen, die Sie aufbereiten möchten.

  3. Öffnen Sie die Registerkarte "Erweiterungen ".

  4. Blättern Sie nach der NLP-Aufbereitung, die Sie auf Ihre Dokumente anwenden wollen.

    Sowohl integrierte Aufbereitungen als auch benutzerdefinierte Aufbereitungen werden aufgelistet. Integrierte Aufbereitungen haben den Typwert System.

  5. Wählen Sie mindestens ein Feld aus, auf das die Aufbereitung angewendet werden soll.

    Sie können Aufbereitungen auf die Felder text und html sowie auf angepasste Felder anwenden, die aus hochgeladenen JSON-oder CSV-Dateien oder aus dem Tool Smart Document Understanding hinzugefügt wurden.

  6. Klicken Sie auf Änderungen anwenden und erneut verarbeiten.

Aufbereitungen, die Sie aktivieren, werden in zufälliger Reihenfolge auf die Dokumente angewendet. Informationen zum Entfernen einer Aufbereitung finden Sie unter Aufbereitungen verwalten.

Entitäten

Gibt Entitäten an Entitäten sind Begriffe, die in der Regel richtige Nomen darstellen, z. B. Personen, Städte und Organisationen, die in der Datenerfassung erwähnt werden. Discovery kann Entitäten erkennen, die Teil eines Entitätstypsystems sind, das vom Watson Natural Language Processing-Service (NLP) definiert wird.

Wenn Sie ungewöhnliche Begriffe identifizieren möchten, die für Ihr Unternehmen von Bedeutung sind, können Sie Ihr eigenes Modell trainieren, um angepasste Entitäten zu erkennen. Weitere Informationen finden Sie unter Entitätsextraktor.

Der von Discovery verwendete Watson-NLP-Entitätsextraktionsservice wird als NLU-Typsystembezeichnet. Der Name stammt aus der Tatsache, dass das Typsystem vom NLU-Service ( Watson Natural Language Understanding ) zusätzlich zum Service Watson Discovery verwendet wird. Es ist jedoch die Watson NLP-Implementierung des Typsystems, die direkt von Discovery verwendet wird, nicht die Watson NLU-Implementierung. Daher können die beiden Implementierungen unterschiedliche Ergebnisse liefern. Eine allgemeine Vorstellung von den Entitätstypen, die vom Service erkannt werden, erhalten Sie unter Entitäten.

Der folgende Screenshot zeigt, dass die Entitätsaufbereitung die Begriffe Systems of Government und King of Great Britain (unter anderem) erkennt und als Entitätserwähnungen kennzeichnet.

Zeigt die Erklärung mit den hervorgehobenen Begriffen Regierungen und König von Großbritannien.
The recognized entities, Governments and King of Great Britain, are highlighted

In der JSON-Ansicht des Dokuments sehen Sie die zugrunde liegende JSON-Struktur der Entitätserwähnungen.

Zeigt die JSON-Ansicht der Entitäten "Regierungssysteme" und "König von Großbritannien", die in dem Dokument identifiziert
der erkannten

Wenn Sie beispielsweise nach dem Entitätstyp 'Organisation' suchen möchten, können Sie den gesamten JSON-Inhalt in einen Texteditor kopieren und nach Organization suchen. Klicken Sie auf das Symbol Kopieren im Stammverzeichnis der JSON-Baumstrukturansicht.

Beispiel

Eingabe

"IBM is an American multinational technology company headquartered in Armonk."

Antwort

In der JSON-Ausgabe:

  • text = Zeichenfolge. Der Entitätstext
  • type = Zeichenfolge. Der Entitätstyp, z. B. Organization, Location, Person, Number.
  • mentions = Array. Die Erwähnungen und Positionen der Entität.
  • model_name = Zeichenfolge. Bei benutzerdefinierten Modellen enthält dieses Feld den vom Benutzer angegebenen Modellnamen. Andernfalls enthält dieses Feld den Standardnamen des Modells, z. B. watson_knowledge_studio, dictionary, character_pattern oder natural_language_understanding
{
  "entities": [
    {
      "model_name": "natural_language_understanding",
      "mentions": [
        {
          "confidence": 0.8317045,
          "location": {
            "end": 3,
            "begin": 0
          },
          "text": "IBM"
        }
      ],
      "text": "IBM",
      "type": "Organization"
    },
    {
      "model_name": "natural_language_understanding",
      "mentions": [
        {
          "confidence": 0.6114863,
          "location": {
            "end": 75,
            "begin": 69
          },
        "text": "Armonk"
        }
      ],
      "text": "Armonk",
      "type": "Location"
    }
  ]
}

Suchbegriffe

Gibt wichtige Schlüsselwörter aus dem Inhalt zurück.

Der folgende Screenshot zeigt beispielsweise hervorgehobene Begriffe aus der US-Unabhängigkeitserklärung, die von der Aufbereitung für Schlüsselwörter erkannt werden.

Zeigt die Schlüsselwörter an, die im Text des Dokuments erkannt
, die von der
erkannt wurden*

In der JSON-Ansicht des Dokuments wird die zugrunde liegende JSON-Struktur der Erwähnung des Schlüsselworts Declaration angezeigt.

Zeigt die JSON-Ansicht der Schlüsselwörter, die im Dokument identifiziert
der
zur Anreicherung mit Schlüsselwörtern*

Beispiel

Eingabe

"Watson Discovery is an award-winning AI search technology."

Antwort

In der JSON-Ausgabe:

  • text = Schlüsselworttext
  • mentions = Erwähnungen und Positionen der Entität
{
  "keywords": [
    {
      "mentions": [
        {
          "location": {
            "end": 157,
            "begin": 141
          },
          "text": "Watson Discovery"
        }
      ],
      "text": "Watson Discovery",
      "relevance": 0.503613
    },
    {
      "mentions": [
        {
          "location": {
           "end": 177,
            "begin": 164
          },
          "text": "award-winning"
        }
      ],
      "text": "award-winning",
      "relevance": 0.728722
    },
    {
      "mentions": [
        {
          "location": {
            "end": 198,
            "begin": 181
          },
          "text": "search technology"
        }
      ],
      "text": "search technology",
      "relevance": 0.779356
    }
  ]
}

Grenzwerte für Schlüsselwörter

Die Aufbereitung von Schlüsselwörtern kann bis zu 50 Schlüsselwörter identifizieren, jeweils mit einer oder mehreren Erwähnungen pro Dokument.

Wortart

Erkennt und markiert Wortarten, einschließlich Nomen, Verben, Adjektiven, Adverbien, Konjunktionen, Interjektionen und Ziffern.