管理数据收集
完成新数据收集的处理后,您可以从“管理集合”页面查看应用于集合的设置的摘要。
有关如何创建集合的更多信息,请参阅 创建集合。
管理数据
从 IBM Cloud Pak for Data的 4.6.5 发行版开始,“管理数据”页面在已安装的部署中可用。
在创建集合并对集合中的文档建立索引之后,您可以从“管理数据”页面查看文档列表。
-
打开“管理集合”页面。
-
单击以打开要更改的集合。
-
点击 “管理数据” 选项卡。
这将显示集合中文档的列表。
IBM Cloud 要在高级文档视图中预览集合中的文档,请单击 预览数据。
-
可选: 您可以更改显示的信息。
要更改视图中显示的字段,请单击视图开头的 设置 图标。 为第一列和第二列选择不同的字段,然后单击 应用。
例如,您可以更改视图中的字段以实现以下目标:
- 获取要使用 API 处理的文档的文档标识。
- 查找文档的父文档。 例如,某些文件类型 (例如,CSV 或 JSON 文件) 在添加到集合时生成子文档。 拆分文档会将一个文档转换为多个文档段。
- 检索文档的原始文件名。
- 了解文档中的页面数。
不会保留您应用的定制设置。 缺省字段设置将在您下次访问页面时显示。
-
可选: 您可以从此页面从集合中删除文档。 有关更多信息,请参阅 从查询结果中排除内容。
更改数据源的处理方式
您可以更改创建集合时应用于该集合的设置。 例如,您可能希望更改搜寻外部数据源的调度。
要更改数据源的处理方式,请完成以下步骤:
查找使用集合的位置
要了解是否正在共享集合,请打开“我的项目”页面,然后完成部署的相应步骤:
- IBM Cloud Pak for Data 点击收藏的使用和分享。IBM Software Hub 点击 “收藏的使用和分享”。
- IBM Cloud 单击 数据使用情况和 GDPR,然后查看“收集使用情况”页面。
集合可以与单个项目关联,由两个或多个项目共享,也可以不与任何项目关联。
复用集合中的数据
在多个项目之间共享集合时,将共享以下资源:
- 已处理的数据
- 配置的连接器
如果您对共享的收藏集进行以下任何更改,这些更改将应用于共享该收藏集的每个项目:
- 更改光学字符识别 (OCR) 设置
- 使用智能文档理解功能注释字段或添加字段
- 启用或禁用字段
- 更改文档拆分设置
- 更改任何连接器设置
当共享一个收藏时,丰富和改善工具的设置不会包括在内,因为它们是在项目级别设置的。
如需了解其他选项卡的更多信息,请参阅以下主题:
- GDPR 数据标签 IBM Cloud: 有关 GDPR 和标签数据的更多信息,请参阅欧盟通用数据保护条例(GDPR)。
- API使用情况IBM Cloud Pak for DataIBM Software Hub 有关监控和分析API使用情况的更多信息,请参阅监控使用情况。
删除集合
在从“集合使用情况”页面中删除集合之前,了解是否在任何位置使用该集合。 可以从此页面直接删除未共享的集合。
-
要从项目中删除单个集合,请从导航面板打开“管理集合”页面,找到集合磁贴,然后单击“删除”图标。
决定是否保留底层数据和配置设置。 如果选择保留数据,那么可以在“集合使用情况”页面上的非共享列表中找到集合。 您可能需要等待几分钟才能显示集合。
点击 “从项目中删除”。
-
IBM Cloud Pak for Data 要删除您环境中的所有收藏,请选择环境详情图标,然后选择删除环境。IBM Software Hub 要删除您环境中的所有收藏,请选择环境详情
,然后选择删除环境。
环境 是指您在 IBM Cloud Pak for Data中供应的 Discovery 实例。
无法删除 样本项目 集合。