Diese Dokumentation bezieht sich auf IBM Watson® Knowledge Studio on IBM Cloud®. Die Dokumentation für die Vorgängerversion von Knowledge Studio on IBM Marketplace kann über diesen Link aufgerufen werden.
Machine Learning-Modell trainieren
Zum Erstellen des Machine Learning-Modells in IBM Watson® Knowledge Studio gehört das Trainieren des Modells und das Bewerten der Funktionsweise des Modells beim Annotieren von Test- und Blinddaten.
Machine Learning-Modell erstellen
Beim Erstellen eines Machine Learning-Modells wählen Sie die Dokumentgruppen aus, die zum Trainieren des Modells verwendet werden sollen, und geben an, welcher Anteil der Dokumente als Trainingsdaten, als Testdaten und als Blinddaten verwendet werden soll.
Informationen zu diesem Vorgang
Mithilfe der Leistungsmetriken können Sie Methoden finden, um die Genauigkeit des Modells zu verbessern.
Einschränkung: Für jede Knowledge Studio-Instanz können nur drei Machine Learning-Modelle auf einmal trainiert werden. Wenn Ihre Instanz mehrere Arbeitsbereiche enthält und derzeit bereits insgesamt 3 Machine Learning-Modelle in anderen Arbeitsbereichen trainiert werden, wird Ihre Anforderung zum Trainieren des Machine Learning-Modells in Ihrem Arbeitsbereich in die Warteschlange eingereiht, bis die anderen Trainingsprozesse abgeschlossen sind.
Vorgehensweise
So erstellen Sie ein Machine Learning-Modell:
-
Melden Sie sich als Knowledge Studio-Administrator an und wählen Sie Ihren Arbeitsbereich aus.
-
Wählen Sie Machine Learning-Modell > Leistung aus.
-
Vergewissern Sie sich, dass alle Dokumentgruppen genehmigt und alle Annotationskonflikte durch Beurteilung behoben wurden. Nur Dokumente, die durch Beurteilung oder Genehmigung in die Ground Truth hochgestuft wurden, können zum Trainieren des Modells verwendet werden.
-
Klicken Sie auf Trainieren und auswerten.
-
Optional: Wenn Sie angeben möchten, wie Dokumente aus Ihren Dokumentgruppen zur Verwendung durch die Trainings-, Test- oder Blinddatensets auf Systemebene zugeordnet werden sollen, klicken Sie auf Einstellungen bearbeiten.
Hilfe zum Festlegen der anzuwendenden Aufteilungsverhältnisse finden Sie unter Dokumentgruppen verwalten.
-
Klicken Sie auf Trainieren, um das Modell zu trainieren, oder klicken Sie auf Trainieren und auswerten, um das Modell zu trainieren, die vom Modell für maschinelles Lernen hinzugefügten Annotationen auszuwerten und die Leistungsstatistik zu analysieren.
Wichtig: Das Trainieren eines Modells für maschinelles Lernen kann mehrere Minuten oder mehrere Stunden dauern, abhängig von der Anzahl der vorhandenen Benutzerannotationen und der Gesamtzahl der Wörter in allen Dokumenten.
-
Wählen Sie die Dokumentgruppen aus, die Sie zum Trainieren des Modells verwenden möchten.
Anmerkung: Die Dokumentgruppen müssen mindestens 10 annotierte Dokumente enthalten.
-
Nachdem das Modell erstellt wurde, wählen Sie eine der folgenden Aktionen aus:
Option | Beschreibung |
---|---|
Protokollierung | Zeigen Sie die Protokolldatei an, um zu sehen, ob Probleme aufgetreten sind. |
Details | Zeigen Sie die Leistungsstatistik für die Annotation an oder ändern Sie die Dokumentgruppen, die Sie zum Trainieren |
und Testen des Modells verwenden möchten, und erstellen Sie Snapshotversionen
der Modellartefakte. |
| Exportieren | Wenn Sie einen Standardplan oder einen Premium-Plan haben, können Sie eine ZIP
-Datei in Ihr lokales System exportieren, die die Komponenten enthält, die zum Ausführen des Modells in einer Machine Learning-Laufzeitumgebung
erforderlich sind, z. B. Watson Explorer. |
Vom Modell hinzugefügte Annotationen auswerten
Sie können die Ground Truth-Ansicht der von Annotatorbenutzern hinzugefügten Annotationen mit den vom Modell hinzugefügten Annotationen vergleichen.
Vorgehensweise
So werten Sie die vom Modell hinzugefügten Annotationen aus:
- Wählen Sie Machine Learning-Modell > Leistung > Trainieren und auswerten aus. Die Seite für Trainings-, Test- und Blinddatensets wird angezeigt.
- Klicken Sie auf Ground Truth anzeigen für das Trainingsset oder Testset, um die Annotationen anzuzeigen, die durch das Vorannotieren und durch Annotatorbenutzer hinzugefügt wurden. Der Ground Truth-Editor wird geöffnet. Öffnen Sie einzelne Dokumente durch Klicken, um zu prüfen, wie die Erwähnungen, Beziehungen und Koreferenzen annotiert wurden.
- Klicken Sie auf der Seite Leistung auf Decodierungsergebnisse anzeigen, um die Annotationen anzuzeigen, die vom Machine Learning-Modell in den Dokumenten des Testsets hinzugefügt wurden. Diese Schaltfläche ist erst verfügbar, nachdem Sie das Modell ausgewertet haben. Beim Anzeigen der Ergebnisse können Sie erkennen, wie zutreffend die Erwähnungen, Beziehungen und koreferenzierten Erwähnungen in den Testdaten vom Machine Learning-Modell beschriftet wurden.
- Wenn Sie das Aufteilungsverhältnis der Dokumente zwischen den Trainings-, Test- und Blinddatensets ändern möchten, klicken Sie auf Leistung > Trainieren und auswerten > Einstellungen bearbeiten. Wenn die ersten Ergebnisse akzeptabel aussehen, können Sie gegebenenfalls die Anzahl der Dokumente im Testset erhöhen, um die Ergebnisse des Machine Learning-Modells noch eingehender zu testen. Sie können das Verhältnis für die automatische Aufteilung der Dokumente für verschiedene Zwecke ändern oder Sie können bestimmte Dokumentgruppen auswählen, die als Trainingsdaten, Testdaten und Blinddaten verwendet werden sollen.
- Wenn Sie Änderungen vorgenommen haben, klicken Sie auf Trainieren und auswerten, um das Modell erneut zu trainieren und die Annotationen erneut auszuwerten.
Machine Learning-Modell löschen
Ein Machine Learning-Modell kann nicht gelöscht werden.
Sie können den Arbeitsbereich löschen, der zum Entwickeln des Modells verwendet wurde, aber Sie können das Modell an sich nicht löschen. Das Löschen eines Modells ist keine empfehlenswerte Vorgehensweise. Stattdessen sollten die Artefakte zum Trainieren des Modells aktualisiert oder ersetzt werden. Auch ein Modell, das nicht die erwarteten Ergebnisse liefert, kann optimiert werden. Bei jedem Erstellen einer neuen Modellversion wird das Modell neu erstellt. Beim Trainieren der nächsten Version können Sie Artefakte wie Wörterverzeichnisse und das Typsystem bearbeiten und andere Annotationsgruppen verwenden.