IBM Cloud Docs
编辑集合

编辑集合

您可以从“内容挖掘”应用程序更改集合的特征。

您可以更改以下特性:

编辑集合

  1. 从集合的分析视图中,单击页面标题中的 集合 链接。

  2. 在集合的磁贴中,单击 打开和关闭选项列表 图标,然后选择 编辑集合

  3. 使用相应的选项卡来更改集合的特征。

  4. 完成更改后,点击 “保存”。

    这将显示以下消息:

    You need to clear index to make these changes.
    After clearing index, fully build the index to
    analyze using this collection.
    

    您可以忽略该消息。 当您单击 确定时,将自动重建索引。

  5. 点击“确定” 确认更改。

  6. 单击 关闭 以返回到“集合”页面。

    请等待重建索引,然后再继续分析。 在“集合”页面中,可以查看索引重建的进度。

  7. 单击收集磁贴以返回到数据分析页面。

更改时区

要更改趋势图所使用的时区,必须编辑集合的缺省时区。

  1. 完成 编辑集合 中的步骤,使集合进入编辑方式。
  2. 编辑 选项卡中,更改 时区 字段的值,然后单击 保存

添加文档标志

要添加文档标记,请完成以下步骤:

  1. 完成 编辑集合 中的步骤,使集合进入编辑方式。
  2. 单击 文档标志 选项卡,然后单击 添加标志
  3. 在“文档标志”对话框中,命名该标志,添加描述,选择标志颜色,然后单击 添加
  4. 重复上述步骤以添加更多标志。
  5. 文档标记视图中,选择 “已启用”,以便在文档中显示标记,然后点击 “保存” 使其在您的收藏中可用。

有关如何标记文档的更多信息,请参阅 标记感兴趣的文档

标识文本字段

使用“内容挖掘”应用程序分析数据时,“发现”确定哪个字段包含要分析的文本的 主体。 它通过查找具有最高平均字数的字段来执行此操作。

您可以检查将哪个字段指定为主文本主体字段,并通过更改另一个字段的索引类型来更改或扩充该字段。

  1. 完成 编辑集合 中的步骤,使集合进入编辑方式。

  2. 点击 “字段”选项卡。 检查 索引类型 列以查找使用 可分析文本内容 索引类型指定的字段。

    您可以更改该字段或将多个文本字段设置为 可分析文本内容 索引类型。

  3. 单击保存

如果您选择多个字段进行分析,则无法查看仅一个字段的分面分析。 要查看多个字段的分析,必须对字段进行分组。

对多个文本字段进行分组

  1. 完成 编辑集合 中的步骤,使集合进入编辑方式。

  2. 单击 上下文视图 选项卡,然后单击 添加视图

  3. 填写以下字段:

    • 名称:分组视图的名称或标签。
    • 标识:Discovery 在提交文本查询时使用的字母数字标识。 例如,ans1
    • 字段:已应用可分析文本内容设置的文本字段。 选择一个或多个要进行分组以便查看构面分析的文本字段。
  4. 单击添加

    如果要添加更多要进行分组以便查看构面分析的文本字段,请重复此任务。

  5. 单击保存

现在,您可以返回到集合的数据分析页面。 从“构面分析”面板中,可以单击 构面视图选择 以查看您分组的文本字段。 您可以选择其中一个文本字段来查看该字段的构面分析。

扩充集合

Discovery 提供了内置自然语言处理模型,如 实体 扩充项,可识别常见事物的提及项,例如业务或位置名以及其他类型的适当名词。 您可以将这些内置 NLP 扩充项应用于集合。

您还可以将在“内容挖掘”应用程序中创建的文档分类器扩充应用于集合。

或者,可以将在同一服务实例中的其他项目中构建的扩充项应用于内容挖掘项目中的集合。 例如,可以将在同一服务实例中的另一个项目中构建的字典或文本分类器应用于集合。

要将扩充项应用于集合,请完成以下步骤:

  1. 完成 编辑集合 中的步骤,使集合进入编辑方式。
  2. 单击 扩充项 选项卡,然后选择要应用于集合的扩充项。
  3. 单击保存