Daten hochladen
Sie können jederzeit ein einmaliges Hochladen von Dokumenten aus Ihrem lokalen Dateisystem durchführen, um einem Projekt Daten hinzuzufügen.
Sie können bis zu 200 Dateien gleichzeitig hochladen.
Zur Verarbeitung von Dokumentgruppen, die größer als 200 Dateien sind, können Sie sie zu einer externen Datenquelle hinzufügen und sie mithilfe eines Datenquellencrawlers hochladen. Für IBM Cloud Pak for Data-Implementierungen können Sie zu diesem Zweck eine Datenquelle Lokales Dateisystem verwenden.
Weitere Informationen zur maximal zulässigen Größe für jede Datei finden Sie unter Dokumentbegrenzungen.
Bevor Sie eine CSV-Datei in ein Content-Mining-Projekt hochladen, sollten Sie Header zur Quellendatei hinzufügen, damit alle Felder, die aus der Datei generiert werden, aussagekräftige Namen haben. Ohne Header erhalten Felder generische Namen
wie column_0
, column_1
usw.
Um Daten hochzuladen, führen Sie die folgenden Schritte aus:
-
Öffnen Sie Ihr Projekt, rufen Sie die Seite Sammlungen verwalten auf und klicken Sie auf Neue Sammlung.
-
Gehen Sie je nach Bereitstellungstyp wie folgt vor:
IBM Cloud Pak for Data IBM Software Hub
-
Wählen Sie Daten als Datenquelle hochladen aus, und klicken Sie anschließend auf Weiter.
Sie können auch eine Verbindung zu einer anderen Datenquelle herstellen, anstatt Daten wie die Wiederverwendung von Daten aus einer Objektgruppe oder das Durchsuchen einer externen Datenquelle hochzuladen. Weitere Informationen finden Sie unter Daten aus einer Sammlung wiederverwenden und Übersicht über Cloud Pak for Data-Datenquellen.
-
Benennen Sie die Objektgruppe. Wenn die Sprache der Dokumente im Speicher nicht Englisch ist, wählen Sie die entsprechende Sprache aus. Eine Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung.
-
Optional können Sie auf Weitere Verarbeitungseinstellungen klicken, um das Menü zu erweitern. Sie können die folgenden Einstellungen auswählen:
-
Setzen Sie den Schalter Optische Zeichenerkennung (OCR) anwenden auf Ein, um OCR zu aktivieren.
Wenn OCR aktiviert ist und Ihre Dokumente Bilder enthalten, dauert die Verarbeitung länger. Weitere Informationen finden Sie unter Optische Zeichenerkennung.
-
Setzen Sie Normalformenreduktion anstelle von Normalformenreduktion bei der Indexierung verwenden auf Ein, um Normalformenreduktion anstelle von Normalformenreduktion zu verwenden, um Wörter im Index und in Abfragen zu normalisieren. Weitere Informationen finden Sie unter Normalformenreduktion für nicht kuratierte Daten aktivieren.
-
-
Klicken Sie auf Weiter
-
Laden Sie Daten hoch, indem Sie nach den zu durchsuchenden Dateien suchen.
Sie können Dokumente, die Sie zu Ihrer Sammlung hinzufügen möchten, ziehen.
Weitere Informationen zu unterstützten Dateitypen finden Sie unter Unterstützte Dateitypen.
-
Klicken Sie auf Beenden.
IBM Cloud
-
Benennen Sie die Objektgruppe. Wenn die Sprache der Dokumente im Speicher nicht Englisch ist, wählen Sie die entsprechende Sprache aus. Eine Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung.
-
Laden Sie Daten hoch, indem Sie nach den Dateien suchen, die Sie hinzufügen möchten.
Sie können Dokumente, die Sie zu Ihrer Sammlung hinzufügen möchten, ziehen.
Weitere Informationen zu unterstützten Dateitypen finden Sie unter Unterstützte Dateitypen.
Sie können auch eine Verbindung zu einer anderen Datenquelle herstellen, anstatt Daten wie die Wiederverwendung von Daten aus einer Objektgruppe oder das Durchsuchen einer externen Datenquelle hochzuladen. Wenn Sie eine Verbindung zu einer anderen Datenquelle herstellen möchten, klicken Sie auf den Link neben Sie müssen eine Verbindung zu einer Datenquelle herstellen. Feld. Weitere Informationen finden Sie unter Daten aus einer Sammlung wiederverwenden und unter Übersicht über Clouddatenquellen.
-
Optional können Sie auf Weitere Verarbeitungseinstellungen klicken, um das Menü zu erweitern. Sie können Folgendes auswählen:
-
Setzen Sie den Schalter Optische Zeichenerkennung (OCR) anwenden auf Ein, um OCR zu aktivieren.
Wenn OCR aktiviert ist und Ihre Dokumente Bilder enthalten, dauert die Verarbeitung länger. Weitere Informationen finden Sie unter Optische Zeichenerkennung.
-
Setzen Sie Normalformenreduktion anstelle von Normalformenreduktion bei der Indexierung verwenden auf Ein, um Normalformenreduktion anstelle von Normalformenreduktion zu verwenden, um Wörter im Index und in Abfragen zu normalisieren. Weitere Informationen finden Sie unter Normalformenreduktion für nicht kuratierte Daten aktivieren.
-
-
Klicken Sie auf Beenden.
-
Der Dateiupload wird schnell abgeschlossen. Es dauert länger, bis die Daten verarbeitet werden, wenn sie der Objektgruppe hinzugefügt werden. Nachdem die Dateien hochgeladen und verarbeitet wurden, werden auf der Seite Aktivität die Uploadergebnisse angezeigt.
Im Gegensatz zu durchsuchten Datenquellen können Sie keine regelmäßigen Aktualisierungen für hochgeladene Dateien planen. Wenn Sie eine neuere Version einer Datei hinzufügen möchten, löschen Sie die frühere Version der Datei und laden Sie dann die neueste Version hoch.
Informationen zur Fehlerbehebung bei Problemen, die beim Hinzufügen von Dokumenten zu einer Objektgruppe auftreten können, finden Sie unter Fehlerbehebung bei der Aufnahme.
Weitere Informationen zu den nächsten Aktionen finden Sie unter Verarbeitung der Datenquelle.