IBM Cloud Docs
管理扩充项

管理扩充项

将扩充项应用于文档中的字段,使有意义的信息更易于在搜索中查找和返回。

通常在创建扩充项时将扩充项应用于字段。 但是,您可以稍后将扩充项应用于字段。 例如,您可能希望将现有扩充应用于使用 SDU 工具创建的新定制字段。 您还可以除去应用于字段的扩充项。

如需了解可用增强功能的更多信息,请参阅以下主题:

要将扩充项应用于内容挖掘项目,您应该使用“内容挖掘”应用程序,而不是使用“发现”用户界面。 使用“内容挖掘”应用程序时,将确保在“内容挖掘”项目中接受扩充项。 有关将扩充项 (例如,字典或短语观点) 应用于内容挖掘项目的更多信息,请参阅 扩充集合

要管理丰富内容,请完成以下步骤:

  1. 从导航窗格中,打开“管理集合”页面,然后单击集合以将其打开。

  2. 单击扩充项选项卡。

    显示可用增强功能的列表。

    您可以识别内置扩充项,因为这些扩充项分类为类型 System。 该列表还包含在服务实例中的任何项目中创建的任何定制扩充项。

  3. 查找要应用或除去的扩充项。

  4. 单击关联字段中的折叠标记以展开字段列表。

  5. 执行以下某个操作:

    • 要将扩充应用于文档,请选择要扩充的一个或多个字段。 您可以将扩充项应用于 texthtml 字段,以及从上载的 JSON 或 CSV 文件或从“智能文档理解”(SDU) 工具添加的定制字段。

      如果您选择的字段来自 JSON 文件,那么在应用扩充之后,字段数据类型将转换为数组。 即使字段包含单个值,也会将其转换为数组。 例如,"field1": "Discovery" 变为 "field1": ["Discovery"]。 将仅扩充 JSON 文件中定制字段的前 50,000 个字符。

    • 要除去扩充项,请清除要从中除去扩充项的字段的复选框。

  6. 单击 应用更改并重新处理 以将更改应用于集合。

删除扩充项

您可以删除为教授 Discovery 有关服务的信息而构建的定制扩充项。 定制扩充项包括字典,正则表达式和模式等。 有关更多信息,请参阅 添加特定于域的资源

无法删除预构建的扩充项。 预构建的扩充项包括内置到产品中的 Natural Language Understanding 扩充项,例如 Entities 扩充项。 要确定内置哪些扩充项,请检查集合的“扩充项”页面的 类型 列。 预构建的扩充项具有 System 类型。

要删除自定义的丰富内容,请完成以下步骤:

  1. 打开使用定制扩充项的项目。

  2. 单击 管理集合,然后打开正在使用扩充项的集合。

  3. 从集合的“扩充项”页面中,从应用扩充项的任何字段中除去扩充项。

  4. 单击 应用更改并重新处理,然后等待系统在不进行扩充的情况下处理集合中的文档。

  5. 对使用扩充项的每个项目中的每个集合重复上一步。

    请记住,定制扩充项可以由单个 Discovery 服务实例中的任何项目中的任何集合使用。

  6. 从使用扩充项的任何集合中,打开“扩充项”页面,然后单击“删除”图标以删除扩充项。

定制扩充项将从此服务实例中的所有位置的 扩充项 列表中除去。

使用 API 来管理扩充项

要使用 API 对数据应用扩充项,请完成以下步骤:

  1. 首先,您必须知道要应用的扩充项的唯一标识。 有关更多信息,请参阅 扩充标识
  2. 使用 创建集合更新集合 方法对集合中的文档应用扩充项。 有关更多信息,请参阅 使用 API 应用扩充项

扩充项标识

如果要将为一个集合创建的定制扩充项应用于另一个集合,那么必须知道在创建扩充项时为其生成的唯一标识。 使用 API 从正在使用定制扩充项的项目中 列示扩充项。 返回的列表包含扩充项标识信息。

对于预构建的扩充项,唯一标识不会更改。 下表列出了与每个预构建的扩充项类型相关联的标识,并标识了支持扩充项的集合语言。 除非扩充项支持集合语言,否则无法将扩充项应用于集合。

预构建的扩充项标识
名称 扩充项标识 支持的语言
合约 701db916-fc83-57ab-0000-000000000014 zh-CN
实体 701db916-fc83-57ab-0000-00000000001e ar,de,en,es,fr,it,ja,ko,nl,pt,zh-CN
关键字 701db916-fc83-57ab-0000-000000000018 ar,de,en,es,fr,it,ja,ko,nl,pt,zh-CN
词性 701db916-fc83-57ab-0000-000000000002 所有受支持的语言
文档的观点 701db916-fc83-57ab-0000-000000000016 ar,de,en,es,fr,it,ja,ko,nl,pt,zh-CN
表理解 701db916-fc83-57ab-0000-000000000012 所有受支持的语言

有关所有受支持语言的更多信息,请参阅 语言支持

使用 API 应用扩充项

要使用API进行数据丰富,请完成以下步骤:

  1. 确定端点的 URL 以及部署的令牌或API密钥。

    有关更多信息,请参阅 使用 API 构建定制应用程序

  2. 获取项目的项目标识。

    从产品用户界面,转至“集成和部署 > 查看 API 信息”页面,然后复制项目标识。

  3. 如果您不知道要对其应用扩充项的集合的标识,请获取集合列表以进行查找。

    例如:

    GET $authentication $url/v2/projects/$project_id/collections?version=2019-11-22
    

    将返回 collection_id

  4. 发送 GET 请求以返回列出所应用扩充项的集合的配置。

    例如:

    GET $authentication $url/v2/projects/$project_id/collections/$collection_id?version=2019-11-22
    

    有关预构建扩充项的扩充项标识,请参阅 扩充项标识

  5. 添加要应用的扩充项。

    例如,要添加 关键字 扩充项,可以在扩充项列表中包含该扩充项。 首先,从表中获取其标识。

    关键字扩充项标识为 701db916-fc83-57ab-0000-000000000018。 要指示您要将“关键字”扩充项应用于集合中文档的 text 字段中的内容,可以 JSON 格式表示该内容,如下所示:

    {
        "enrichment_id" : "701db916-fc83-57ab-0000-000000000018",
        "fields" : [ "text" ]
    }
    

    您指定的任何扩充项都将替换缺省扩充项。 因此,如果要保留缺省扩充项,请不要忘记将其包含在应用于集合的扩充项列表中。 有关每种项目类型的缺省扩充项的列表,请参阅 每种项目类型的缺省扩充项

    例如,要保留 实体 扩充项并添加 关键字 扩充项,可以在请求主体中指定以下内容。

    "enrichments": [
      {
        "enrichment_id": "701db916-fc83-57ab-0000-00000000001e",
        "fields": [
          "text"
        ]
      },
      {
        "enrichment_id": "701db916-fc83-57ab-0000-000000000018",
        "fields": [
          "text"
        ]
      }
    ]
    
  6. 使用 update collection 方法提交更新后的 JSON 请求主体,以将扩充项应用于集合。

    例如:

    POST $authentication -d '$requestBody' $url/v2/projects/$project_id/collections/$collection_id?version=2019-11-22
    

每个项目类型的缺省扩充项

某些预构建的扩充项将根据项目类型自动应用于项目中的集合。 下表显示了应用于每种项目类型的缺省扩充项。

每个项目类型的缺省扩充项
此表具有行和列标题。 行标题标识项目类型。 列标题标识不同的扩充项。 要了解缺省情况下哪些扩充项应用于项目类型,请转至描述扩充项的行,并查找您感兴趣的项目类型的列。
扩充 文档检索 合同的文档检索 会话式搜索 内容挖掘
合约 “勾选标记”图标
实体 “勾选标记”图标 “勾选标记”图标
关键字
词性 “勾选标记”图标
文档的观点
表理解 “勾选标记”图标