IBM Cloud Docs
管理数据收集

管理数据收集

完成新数据收集的处理后,您可以从“管理集合”页面查看应用于集合的设置的摘要。

有关如何创建集合的更多信息,请参阅 创建集合

管理数据

从 IBM Cloud Pak for Data的 4.6.5 发行版开始,“管理数据”页面在已安装的部署中可用。

在创建集合并对集合中的文档建立索引之后,您可以从“管理数据”页面查看文档列表。

  1. 打开“管理集合”页面。

  2. 单击以打开要更改的集合。

  3. 点击 “管理数据” 选项卡。

    这将显示集合中文档的列表。

    IBM Cloud 要在高级文档视图中预览集合中的文档,请单击 预览数据

  4. 可选: 您可以更改显示的信息。

    要更改视图中显示的字段,请单击视图开头的 设置 图标。 为第一列和第二列选择不同的字段,然后单击 应用

    例如,您可以更改视图中的字段以实现以下目标:

    • 获取要使用 API 处理的文档的文档标识。
    • 查找文档的父文档。 例如,某些文件类型 (例如,CSV 或 JSON 文件) 在添加到集合时生成子文档。 拆分文档会将一个文档转换为多个文档段。
    • 检索文档的原始文件名。
    • 了解文档中的页面数。

    不会保留您应用的定制设置。 缺省字段设置将在您下次访问页面时显示。

  5. 可选: 您可以从此页面从集合中删除文档。 有关更多信息,请参阅 从查询结果中排除内容

更改数据源的处理方式

您可以更改创建集合时应用于该集合的设置。 例如,您可能希望更改搜寻外部数据源的调度。

要更改数据源的处理方式,请完成以下步骤:

  1. 打开“管理集合”页面。

  2. 单击以打开要更改的集合。

  3. 点击 “处理设置” 选项卡。

  4. 对处理设置进行任何要进行的更改。

    例如,您可能想要启用或禁用光学字符识别 (OCR),这是从图像中抽取文本的功能。 有关更多信息,请参阅 光学字符识别

    有关更改数据同步调度的更多信息,请参阅 搜寻调度选项

    其他设置选项因数据源类型而异。

  5. 单击应用更改并重新处理

查找使用集合的位置

要了解是否正在共享集合,请打开“我的项目”页面,然后完成部署的相应步骤:

  • IBM Cloud Pak for Data 点击收藏的使用和分享。IBM Software Hub 点击 “收藏的使用和分享”。
  • IBM Cloud 单击 数据使用情况和 GDPR,然后查看“收集使用情况”页面。

集合可以与单个项目关联,由两个或多个项目共享,也可以不与任何项目关联。

复用集合中的数据

在多个项目之间共享集合时,将共享以下资源:

  • 已处理的数据
  • 配置的连接器

如果您对共享的收藏集进行以下任何更改,这些更改将应用于共享该收藏集的每个项目:

  • 更改光学字符识别 (OCR) 设置
  • 使用智能文档理解功能注释字段或添加字段
  • 启用或禁用字段
  • 更改文档拆分设置
  • 更改任何连接器设置

当共享一个收藏时,丰富和改善工具的设置不会包括在内,因为它们是在项目级别设置的。

如需了解其他选项卡的更多信息,请参阅以下主题:

删除集合

在从“集合使用情况”页面中删除集合之前,了解是否在任何位置使用该集合。 可以从此页面直接删除未共享的集合。

  • 要从项目中删除单个集合,请从导航面板打开“管理集合”页面,找到集合磁贴,然后单击“删除”图标。

    决定是否保留底层数据和配置设置。 如果选择保留数据,那么可以在“集合使用情况”页面上的非共享列表中找到集合。 您可能需要等待几分钟才能显示集合。

    点击 “从项目中删除”。

  • IBM Cloud Pak for Data 要删除您环境中的所有收藏,请选择环境详情图标,然后选择删除环境。IBM Software Hub 要删除您环境中的所有收藏,请选择环境详情图标,然后选择删除环境

    环境 是指您在 IBM Cloud Pak for Data中供应的 Discovery 实例。

无法删除 样本项目 集合。