Verwenden Sie die integrierte NLP Watson, um allgemeine Begriffe zu finden
Nutzen Sie die mehrfach ausgezeichneten Funktionen von Watson Natural Language Processing (NLP), indem Sie vordefinierte Aufbereitungen zu Ihren Dokumenten hinzufügen.
Mit Watson NLP können Sie aussagekräftige Informationen in Ihren Sammlungen identifizieren und kennzeichnen, damit Sie verstehen, was alles bedeutet, und fundiertere Entscheidungen treffen können.
Die folgenden Watson-NLP-Aufbereitungen sind verfügbar:
- Entitäten: Erkennt die richtigen Nomen wie Personen, Städte und Organisationen, die im Inhalt erwähnt werden.
- Schlüsselwörter: Erkennt wichtige Begriffe in Ihrem Inhalt.
- Wortart: Gibt die Wortarten (z. B. Nomen und Verben) im Inhalt an
- Stimmung: Begreift die allgemeine Stimmung des Inhalts.
Die folgenden anderen vortrainierten Aufbereitungen sind mit Discoveryverfügbar:
Watson-NLP-Aufbereitungen
Der folgende Screenshot zeigt beispielsweise ein Transkript der US-Unabhängigkeitserklärung, die einer Discovery-Sammlung hinzugefügt wurde, in der die Aufbereitungen für Entitäten und Schlüsselwörter aktiviert sind. Die Erwähnungen, die von den Aufbereitungen erkannt werden, werden im Dokumenttext hervorgehoben.

Einige der NLP-Aufbereitungen werden automatisch auf Projekte angewendet. Sie müssen sie nicht selbst anwenden, wenn Sie einen dieser Projekttypen verwenden.
Standardaufbereitungen nach Projekttyp
Einige vordefinierte Aufbereitungen werden je nach Projekttyp automatisch auf Sammlungen in einem Projekt angewendet. In der folgenden Tabelle sind die Standardaufbereitungen aufgeführt, die auf jeden Projekttyp angewendet werden.
Aufbereitung | Dokumentabruf | Dokumentabruf für Verträge | Dialogsuche | Content Mining |
---|---|---|---|---|
Verträge | ||||
Entitäten | ||||
Suchbegriffe | ||||
Wortart | ||||
Stimmung des Dokuments | ||||
Table Understanding |
Weitere Informationen zu den folgenden vorgefertigten Erweiterungen finden Sie in den folgenden Themen:
Weitere Informationen zum Erstellen angepasster Aufbereitungen finden Sie unter Domänenspezifische Ressourcen hinzufügen.
Weitere Informationen dazu, wie Sie Aufbereitungen optimal nutzen können, finden Sie im Blogbeitrag Aufbereiten Ihrer Dokumente kann die Suche effektiver machen.
Weitere Informationen zum Anwenden von Aufbereitungen mithilfe der API finden Sie unter Aufbereitungen mithilfe der API anwenden.
Aufbereitungen hinzufügen
Um eine NLP-Anreicherung hinzuzufügen, führen Sie die folgenden Schritte aus:
-
Öffnen Sie Ihr Projekt und rufen Sie die Seite Sammlungen verwalten auf.
-
Klicken Sie hier, um die Sammlung zu öffnen, die Sie aufbereiten möchten.
-
Öffnen Sie die Registerkarte "Erweiterungen ".
-
Blättern Sie nach der NLP-Aufbereitung, die Sie auf Ihre Dokumente anwenden wollen.
Sowohl integrierte Aufbereitungen als auch benutzerdefinierte Aufbereitungen werden aufgelistet. Integrierte Aufbereitungen haben den Typwert
System
. -
Wählen Sie mindestens ein Feld aus, auf das die Aufbereitung angewendet werden soll.
Sie können Aufbereitungen auf die Felder
text
undhtml
sowie auf angepasste Felder anwenden, die aus hochgeladenen JSON-oder CSV-Dateien oder aus dem Tool Smart Document Understanding hinzugefügt wurden. -
Klicken Sie auf Änderungen anwenden und erneut verarbeiten.
Aufbereitungen, die Sie aktivieren, werden in zufälliger Reihenfolge auf die Dokumente angewendet. Informationen zum Entfernen einer Aufbereitung finden Sie unter Aufbereitungen verwalten.
Entitäten
Gibt Entitäten an Entitäten sind Begriffe, die in der Regel richtige Nomen darstellen, z. B. Personen, Städte und Organisationen, die in der Datenerfassung erwähnt werden. Discovery kann Entitäten erkennen, die Teil eines Entitätstypsystems sind, das vom Watson Natural Language Processing-Service (NLP) definiert wird.
Wenn Sie ungewöhnliche Begriffe identifizieren möchten, die für Ihr Unternehmen von Bedeutung sind, können Sie Ihr eigenes Modell trainieren, um angepasste Entitäten zu erkennen. Weitere Informationen finden Sie unter Entitätsextraktor.
Der von Discovery verwendete Watson-NLP-Entitätsextraktionsservice wird als NLU-Typsystembezeichnet. Der Name stammt aus der Tatsache, dass das Typsystem vom NLU-Service ( Watson Natural Language Understanding ) zusätzlich zum Service Watson Discovery verwendet wird. Es ist jedoch die Watson NLP-Implementierung des Typsystems, die direkt von Discovery verwendet wird, nicht die Watson NLU-Implementierung. Daher können die beiden Implementierungen unterschiedliche Ergebnisse liefern. Eine allgemeine Vorstellung von den Entitätstypen, die vom Service erkannt werden, erhalten Sie unter Entitäten.
Der folgende Screenshot zeigt, dass die Entitätsaufbereitung die Begriffe Systems of Government und King of Great Britain (unter anderem) erkennt und als Entitätserwähnungen kennzeichnet.

In der JSON-Ansicht des Dokuments sehen Sie die zugrunde liegende JSON-Struktur der Entitätserwähnungen.

Wenn Sie beispielsweise nach dem Entitätstyp 'Organisation' suchen möchten, können Sie den gesamten JSON-Inhalt in einen Texteditor kopieren und nach Organization
suchen. Klicken Sie auf das Symbol Kopieren im Stammverzeichnis
der JSON-Baumstrukturansicht.
Beispiel
Eingabe
"IBM is an American multinational technology company headquartered in Armonk."
Antwort
In der JSON-Ausgabe:
text
= Zeichenfolge. Der Entitätstexttype
= Zeichenfolge. Der Entitätstyp, z. B.Organization
,Location
,Person
,Number
.mentions
= Array. Die Erwähnungen und Positionen der Entität.model_name
= Zeichenfolge. Bei benutzerdefinierten Modellen enthält dieses Feld den vom Benutzer angegebenen Modellnamen. Andernfalls enthält dieses Feld den Standardnamen des Modells, z. B.watson_knowledge_studio
,dictionary
,character_pattern
odernatural_language_understanding
{
"entities": [
{
"model_name": "natural_language_understanding",
"mentions": [
{
"confidence": 0.8317045,
"location": {
"end": 3,
"begin": 0
},
"text": "IBM"
}
],
"text": "IBM",
"type": "Organization"
},
{
"model_name": "natural_language_understanding",
"mentions": [
{
"confidence": 0.6114863,
"location": {
"end": 75,
"begin": 69
},
"text": "Armonk"
}
],
"text": "Armonk",
"type": "Location"
}
]
}
Suchbegriffe
Gibt wichtige Schlüsselwörter aus dem Inhalt zurück.
Der folgende Screenshot zeigt beispielsweise hervorgehobene Begriffe aus der US-Unabhängigkeitserklärung, die von der Aufbereitung für Schlüsselwörter erkannt werden.

In der JSON-Ansicht des Dokuments wird die zugrunde liegende JSON-Struktur der Erwähnung des Schlüsselworts Declaration
angezeigt.

Beispiel
Eingabe
"Watson Discovery is an award-winning AI search technology."
Antwort
In der JSON-Ausgabe:
text
= Schlüsselworttextmentions
= Erwähnungen und Positionen der Entität
{
"keywords": [
{
"mentions": [
{
"location": {
"end": 157,
"begin": 141
},
"text": "Watson Discovery"
}
],
"text": "Watson Discovery",
"relevance": 0.503613
},
{
"mentions": [
{
"location": {
"end": 177,
"begin": 164
},
"text": "award-winning"
}
],
"text": "award-winning",
"relevance": 0.728722
},
{
"mentions": [
{
"location": {
"end": 198,
"begin": 181
},
"text": "search technology"
}
],
"text": "search technology",
"relevance": 0.779356
}
]
}
Grenzwerte für Schlüsselwörter
Die Aufbereitung von Schlüsselwörtern kann bis zu 50 Schlüsselwörter identifizieren, jeweils mit einer oder mehreren Erwähnungen pro Dokument.
Wortart
Erkennt und markiert Wortarten, einschließlich Nomen, Verben, Adjektiven, Adverbien, Konjunktionen, Interjektionen und Ziffern.