Daten mit einer semantischen Automatisierungsebene anreichern
Um Ihre Daten anzureichern,IBM® watsonx.data nutzt Semantic Automation Layer (SAL) inIBM Knowledge Catalog.
Befolgen Sie die Anweisungen in diesem Thema, um Ihre Daten mit Geschäftsbegriffen und Beschreibungen anzureichern. Verwenden Sie dazu die Funktion zur semantischen Anreicherung inwatsonx.data.
Vorbereitende Schritte
-
Sie haben eine registrierte semantische Automatisierungsebene inwatsonx.data.
-
Sie haben eine CSV-Datei in einem vereinfachten Format mit den folgenden Feldern:
- Name: Der Geschäftsbegriff, den Sie definieren möchten.
- Artefakttyp: Immer „Glossarbegriff“.
- Beschreibung: Die Erklärung des Geschäftsbegriffs.
Beispieldateiformat:
Name,Artifact Type,Description Residence Address,glossary_term,"Identifies an Address at which an Individual dwells, for example John Doe Resides At 102 Oak Court." Involved Party Markets Product Limit Condition,glossary_term,"Identifies a Limit Condition that applies to the Involved Party's marketing of the Product; for example, minimum audience or venues." Social Security Number,glossary_term,The unique number assigned to an Individual by a governmental agency for the purposes of qualifying for Social Security benefits. Rating Provider,glossary_term,"Identifies a Rating Issuer that supplies the Rating; for example, Credit Agency XYZ Provides Rating For a customer's Credit Risk Rating."
Vorgehensweise
Benutzer mit den folgenden Rollen können semantische Anreicherungen durchführen inwatsonx.data:
- Administrator oder Metastore-Administrator: Diese Rollen können die semantische Automatisierungsebene registrieren und auf die Daten anreichern mit all ihren Funktionen zur Datenanreicherung.
- Benutzer- oder Metastore-Viewer: Diese Rollen können nicht die Aufbau Registerkarte für die Registrierung der semantischen Automatisierungsebene oder die Daten anreichern Tab. Beim Durchsuchen der Daten in den Tabellen können sie jedoch alle veröffentlichten angereicherten Informationen sehen, beispielsweise Geschäftsbegriffe und Beschreibungen.
-
Melden Sie sich an der watsonx.data-Konsole an.
-
Wählen Sie im Navigationsmenü Datenmanager und klicken Sie auf Daten anreichern Tab.
-
Klicken Anreicherungseinstellungen und wählen Sie Glossar verwalten um eine CSV-Datei mit Ihren Geschäftsbedingungen und Beschreibungen hochzuladen.
Damit das LLM Tags und Beschreibungen für die Tabellen und Spalten in watsonx.data vorschlagen kann, laden Sie eine CSV-Datei mit Ihren Geschäftsbegriffen (Tags), dem Artefakttyp und den entsprechenden Beschreibungen im gewünschten Format hoch. Die CSV-Datei muss der Vorlage wie folgt entsprechen: Name, Artefakttyp, Beschreibung wie in der Benutzeroberfläche angezeigt.
-
Im Glossar verwalten Klicken Sie im Fenster Glossar hochladen und ziehen Sie die CSV-Datei in das Feld oder klicken Sie zum Hochladen.
-
Wählen Sie die Option zum Zusammenführen aus:
- Alle Werte ersetzen: Überschreibt alle vorhandenen Tags und Beschreibungen.
- Nur definierte Werte ersetzen: Ersetzt vorhandene Werte nur, wenn der Begriff in der hochgeladenen Datei vorhanden ist.
- Nur leere Werte ersetzen: Fügt Tags und Beschreibungen aus der Datei nur zu Spalten hinzu, die keine vorhandenen haben.
-
Klicken Glossar hochladen. Das Glossar zeigt eine Liste von Tags und deren Beschreibungen an.
-
Klicken Anreicherungseinstellungen und wählen Sie Schwellenwerte anpassen um die Schwellenwerte für verschiedene Anreicherungsarten zu ändern. Klicken Speichern Sie alle Änderungen.
Die Genauigkeit der Ergebnisse der semantischen Anreicherung von Geschäftsbegriffen hängt weitgehend von der Fähigkeit des IKC ab, hochgeladene Begriffe mit den ausgewählten Tabellen und Spalten abzugleichen. Der Schwellenwert für Vorschläge kann angepasst werden, um die Übereinstimmungen mit dem Vertrauensniveau auszugleichen. Für mehr Übereinstimmungen mit potenziell geringerem Vertrauen senken Sie den Schwellenwert. Für weniger Übereinstimmungen mit höherem Vertrauen erhöhen Sie den Schwellenwert.
-
Wählen Sie ein Schema, das Sie anreichern möchten.
Für Benutzer des Lite-Plans: Sie können nur ein Schema aus der Liste anreichern. Nach der Anreicherung eines Schemas können keine anderen Schemata mehr ausgewählt werden. Die angereicherten Daten enthalten die Geschäftsbedingungen und Beschreibungen für jede Spalte in jeder Tabelle innerhalb des Schemas.
-
Klicken Sie auf das Überlaufmenü, das dem ausgewählten Schema entspricht, und wählen Sie Anreicherung ausführen. Sie können auch einzelne oder mehrere Schemata auswählen und auf Bereichern.
-
Klicken Sie auf das Überlaufmenü neben dem ausgewählten Schema und wählen Sie Anreicherung anzeigen. Auf der Seite wird die Liste der Tabellen im Schema angezeigt.
-
Klicken Sie auf eine beliebige Tabelle, um Details anzuzeigen.
-
Geschäftsbegriffe und Beschreibungen manuell zuweisen:
a. Bewegen Sie den Mauszeiger über einen Geschäftsbegriff und wählen Sie Mehr sehen, wählen Führung und klicken Sie auf Geschäftsbegriffe zuweisen.
b. Wählen Sie den entsprechenden Begriff aus dem hochgeladenen Glossar aus und klicken Sie auf Zuordnen.
-
Anzeigenamen und Beschreibungen manuell hinzufügen:
a. Bewegen Sie den Mauszeiger über einen Geschäftsbegriff und wählen Sie Mehr sehen, wählen Einzelheiten und klicken Sie auf Bearbeiten Symbol.
b. Modifiziere den Anzeigename oder Beschreibung und klicken Sie auf Speichern.
-
Überprüfen Sie die angereicherten Spalten und klicken Sie auf das Überlaufmenü neben einer Spalte oder Mehr und wählen Sie Als überprüft markieren.
-
Gehen Sie zur Tabellenansicht und prüfen Sie, ob der Überprüfungsstatus abgeschlossen ist.
-
Klicken Sie auf das Überlaufmenü neben dem ausgewählten Schema und wählen Sie Veröffentlichen. Auf der Seite wird die Liste der angereicherten Tabellen innerhalb des Schemas angezeigt.
Wenn Sie Metadatenanreicherungen für Tabellen in watsonx.data veröffentlichen, werden Dinge wie neue Anzeigenamen, Beschreibungen und Tags für andere Benutzer im Datenmanager sichtbar und durchsuchbar.
-
Überprüfen Sie die angereicherten Daten im Daten durchsuchen der Datenmanager indem Sie nach erfolgreichem Abschluss der Veröffentlichung das von Ihnen angereicherte Schema auswählen.
Zugehörige API
Informationen zu verwandten APIs finden Sie unter
- Anreicherung von Jobs in Schemata und Tabellen auslösen
- Erhalten Sie semantische Anreicherungsressourcen, die mit dem Schema verknüpft sind
- Erhalten Sie semantische Anreicherungsdaten, die mit der Tabelle verknüpft sind
- Erhalten Sie Job-Ausführungs-Protokolle zur semantischen Anreicherung, die mit der Job-Ausführung verknüpft sind
- Erhalten Sie semantische Anreicherungs-Jobläufe, die mit dem Schema verknüpft sind
- Erhalten Sie semantische Anreicherungsjobs, die mit dem Schema verknüpft sind
- Liste der hochgeladenen Glossarbegriffe abrufen
- WKC-Katalog und Projekt dem Schema zuordnen
- Globale Einstellungen für die Metadatenanreicherung abrufen
- Globale Einstellungen für die Metadatenanreicherung hinzufügen
- Einstellungen zur Metadatenanreicherung für ein Projekt abrufen
- Einstellungen zur Metadatenanreicherung für ein Projekt hinzufügen
- Hochladen des Glossars für Geschäftsbegriffe zur semantischen Anreicherung
- Status des Hochladevorgangs für den Glossar-Auftrag abrufen