IBM Cloud Docs
Datensammlungen verwalten

Datensammlungen verwalten

Nachdem die Verarbeitung einer neuen Datenerfassung abgeschlossen ist, können Sie auf der Seite Sammlungen verwalten eine Zusammenfassung der Einstellungen anzeigen, die auf Ihre Sammlung angewendet werden.

Weitere Informationen zum Erstellen einer Sammlung finden Sie unter Sammlungen erstellen.

Daten verwalten

Die Seite Daten verwalten ist ab dem Release 4.6.5 von IBM Cloud Pak for Datain installierten Implementierungen verfügbar.

Nachdem Sie eine Objektgruppe erstellt haben und die Dokumente in der Objektgruppe indexiert wurden, wird eine Liste der Dokumente auf der Seite Daten verwalten angezeigt.

  1. Öffnen Sie die Seite Sammlungen verwalten.

  2. Klicken Sie auf diese Schaltfläche, um die Objektgruppe zu öffnen, die Sie ändern wollen.

  3. Klicken Sie auf die Registerkarte "Daten verwalten ".

    Eine Liste der Dokumente in der Sammlung wird angezeigt.

    IBM Cloud Um eine Vorschau eines Dokuments in der Objektgruppe in der erweiterten Dokumentansicht anzuzeigen, klicken Sie auf Vorschau der Daten.

  4. Optional: Sie können die angezeigten Daten ändern.

    Um die in der Ansicht angezeigten Felder zu ändern, klicken Sie auf das Symbol Einstellungen am Anfang der Ansicht. Wählen Sie ein anderes Feld für die erste und zweite Spalte aus und klicken Sie dann auf Anwenden.

    Sie können beispielsweise die Felder in der Ansicht ändern, um die folgenden Ziele zu erreichen:

    • Rufen Sie die Dokument-ID für ein Dokument ab, mit dem Sie mithilfe der API arbeiten wollen.
    • Sucht das übergeordnete Dokument für ein Dokument. Einige Dateitypen, wie z. B. CSV-oder JSON-Dateien, generieren Unterdokumente, wenn sie beispielsweise zu einer Sammlung hinzugefügt werden. Durch das Aufteilen eines Dokuments wird ein Dokument in mehrere Dokumentsegmente umgewandelt.
    • Ursprünglichen Dateinamen für ein Dokument abrufen.
    • Ermitteln Sie, wie viele Seiten sich in einem Dokument befinden.

    Die benutzerdefinierten Einstellungen, die Sie anwenden, werden nicht beibehalten. Die Standardfeldeinstellungen werden beim nächsten Zugriff auf die Seite angezeigt.

  5. Optional: Auf dieser Seite können Sie ein Dokument aus der Sammlung löschen. Weitere Informationen finden Sie unter Inhalt aus Abfrageergebnissen ausschließen.

Verarbeitung einer Datenquelle ändern

Sie können Einstellungen ändern, die bei der Erstellung einer Sammlung angewendet wurden. Sie können beispielsweise den Zeitplan ändern, nach dem eine externe Datenquelle durchsucht wird.

Führen Sie die folgenden Schritte aus, um die Verarbeitung einer Datenquelle zu ändern:

  1. Öffnen Sie die Seite Sammlungen verwalten.

  2. Klicken Sie auf diese Schaltfläche, um die Objektgruppe zu öffnen, die Sie ändern wollen.

  3. Klicken Sie auf die Registerkarte "Verarbeitungseinstellungen ".

  4. Nehmen Sie die gewünschten Änderungen an den Verarbeitungseinstellungen vor.

    Sie können beispielsweise die optische Zeichenerkennung (OCR) aktivieren oder inaktivieren, eine Funktion, die Text aus Bildern extrahiert. Weitere Informationen finden Sie unter Optische Zeichenerkennung.

    Weitere Informationen zum Ändern von Datensynchronisationszeitplänen finden Sie in Zeitplanoptionen für Crawlersuche.

    Andere Einstellungsoptionen unterscheiden sich je nach Datenquellentyp.

  5. Klicken Sie auf Änderungen anwenden und erneut verarbeiten.

Ermitteln, wo eine Objektgruppe verwendet wird

Um herauszufinden, ob eine Sammlung gemeinsam genutzt wird, öffnen Sie die Seite Eigene Projekte und führen Sie dann den entsprechenden Schritt für Ihre Implementierung durch.

  • IBM Cloud Pak for DataIBM Software Hub Verwendung und Weitergabe von Click Collection.
  • IBM Cloud Klicken Sie auf Datennutzung und DSGVO und überprüfen Sie dann die Seite Sammlungsnutzung.

Sammlungen können einem einzelnen Projekt zugeordnet werden, von zwei oder mehr Projekten gemeinsam genutzt werden oder keinem Projekt zugeordnet sein.

Daten aus einer Objektgruppe wiederverwenden

Wenn Sie Sammlungen in mehreren Projekten gemeinsam nutzen, werden die folgenden Ressourcen gemeinsam genutzt:

  • Verarbeitete Daten
  • Konfigurierter Connector

Wenn Sie eine der folgenden Änderungen an einer gemeinsam genutzten Sammlung vornehmen, werden die Änderungen auf die Sammlung in jedem Projekt angewendet, in dem sie gemeinsam genutzt wird:

  • Einstellung für optische Zeichenerkennung (OCR) ändern
  • Felder mit Smart Document Understanding kommentieren oder hinzufügen
  • Aktivierung oder Inaktivierung von Feldern
  • Änderung der Einstellung für Dokumentaufteilung
  • Änderung einer Connectoreinstellung

Einstellungen für Erweiterungen und Verbesserungen sind nicht enthalten, wenn eine Sammlung freigegeben wird, da sie auf Projektebene festgelegt werden.

Weitere Informationen zu den anderen Registerkarten finden Sie in den folgenden Themen:

  • Bezeichnung für DSGVO-Daten IBM Cloud: Weitere Informationen zur DSGVO und zur Kennzeichnung von Daten finden Sie unterEU-Datenschutz-Grundverordnung(DSGVO).
  • API-Nutzung IBM Cloud Pak for DataIBM Software Hub Weitere Informationen zur Überwachung der API-Nutzung finden Sie unter"Überwachung der Nutzung ".

Sammlungen löschen

Stellen Sie fest, ob eine Objektgruppe verwendet wird, bevor Sie sie auf der Seite Objektgruppennutzung löschen. Nicht gemeinsam genutzte Sammlungen können direkt von der Seite gelöscht werden.

  • Um eine einzelne Sammlung aus einem Projekt zu löschen, öffnen Sie die Seite Sammlungen verwalten im Navigationsfenster, suchen Sie die Sammlungskachel und klicken Sie dann auf das Löschsymbol.

    Entscheiden Sie, ob die zugrunde liegenden Daten und Konfigurationseinstellungen beibehalten werden sollen. Wenn Sie die Daten beibehalten möchten, finden Sie die Sammlung in der Liste "Nicht gemeinsam genutzt" auf der Seite Sammlungsnutzung. Möglicherweise müssen Sie einige Minuten warten, bis die Sammlung angezeigt wird.

    Klicken Sie auf "Aus Projekt löschen ".

  • IBM Cloud Pak for DataIBM Software Hub Um alle Sammlungen in Ihrer Umgebung zu löschen, wählen Sie das Symbol "Umgebungsdetails" und dann "Umgebung löschen" aus.

    Umgebung bezieht sich auf die Discovery-Instanz, die Sie in IBM Cloud Pak for Databereitgestellt haben.

Sie können die Sammlung Beispielprojekt nicht löschen.