管理扩充项
将扩充项应用于文档中的字段,使有意义的信息更易于在搜索中查找和返回。
通常在创建扩充项时将扩充项应用于字段。 但是,您可以稍后将扩充项应用于字段。 例如,您可能希望将现有扩充应用于使用 SDU 工具创建的新定制字段。 您还可以除去应用于字段的扩充项。
如需了解可用增强功能的更多信息,请参阅以下主题:
要将扩充项应用于内容挖掘项目,您应该使用“内容挖掘”应用程序,而不是使用“发现”用户界面。 使用“内容挖掘”应用程序时,将确保在“内容挖掘”项目中接受扩充项。 有关将扩充项 (例如,字典或短语观点) 应用于内容挖掘项目的更多信息,请参阅 扩充集合。
要管理丰富内容,请完成以下步骤:
-
从导航窗格中,打开“管理集合”页面,然后单击集合以将其打开。
-
单击扩充项选项卡。
显示可用增强功能的列表。
您可以识别内置扩充项,因为这些扩充项分类为类型
System
。 该列表还包含在服务实例中的任何项目中创建的任何定制扩充项。 -
查找要应用或除去的扩充项。
-
单击关联字段中的折叠标记以展开字段列表。
-
执行以下某个操作:
-
要将扩充应用于文档,请选择要扩充的一个或多个字段。 您可以将扩充项应用于
text
和html
字段,以及从上载的 JSON 或 CSV 文件或从“智能文档理解”(SDU) 工具添加的定制字段。如果您选择的字段来自 JSON 文件,那么在应用扩充之后,字段数据类型将转换为数组。 即使字段包含单个值,也会将其转换为数组。 例如,
"field1": "Discovery"
变为"field1": ["Discovery"]
。 将仅扩充 JSON 文件中定制字段的前 50,000 个字符。 -
要除去扩充项,请清除要从中除去扩充项的字段的复选框。
-
-
单击 应用更改并重新处理 以将更改应用于集合。
删除扩充项
您可以删除为教授 Discovery 有关服务的信息而构建的定制扩充项。 定制扩充项包括字典,正则表达式和模式等。 有关更多信息,请参阅 添加特定于域的资源。
无法删除预构建的扩充项。 预构建的扩充项包括内置到产品中的 Natural Language Understanding 扩充项,例如 Entities 扩充项。 要确定内置哪些扩充项,请检查集合的“扩充项”页面的 类型 列。 预构建的扩充项具有 System
类型。
要删除自定义的丰富内容,请完成以下步骤:
-
打开使用定制扩充项的项目。
-
单击 管理集合,然后打开正在使用扩充项的集合。
-
从集合的“扩充项”页面中,从应用扩充项的任何字段中除去扩充项。
-
单击 应用更改并重新处理,然后等待系统在不进行扩充的情况下处理集合中的文档。
-
对使用扩充项的每个项目中的每个集合重复上一步。
请记住,定制扩充项可以由单个 Discovery 服务实例中的任何项目中的任何集合使用。
-
从使用扩充项的任何集合中,打开“扩充项”页面,然后单击“删除”图标以删除扩充项。
定制扩充项将从此服务实例中的所有位置的 扩充项 列表中除去。
使用 API 来管理扩充项
要使用 API 对数据应用扩充项,请完成以下步骤:
- 首先,您必须知道要应用的扩充项的唯一标识。 有关更多信息,请参阅 扩充标识。
- 使用 创建集合 或 更新集合 方法对集合中的文档应用扩充项。 有关更多信息,请参阅 使用 API 应用扩充项
扩充项标识
如果要将为一个集合创建的定制扩充项应用于另一个集合,那么必须知道在创建扩充项时为其生成的唯一标识。 使用 API 从正在使用定制扩充项的项目中 列示扩充项。 返回的列表包含扩充项标识信息。
对于预构建的扩充项,唯一标识不会更改。 下表列出了与每个预构建的扩充项类型相关联的标识,并标识了支持扩充项的集合语言。 除非扩充项支持集合语言,否则无法将扩充项应用于集合。
名称 | 扩充项标识 | 支持的语言 |
---|---|---|
合约 | 701db916-fc83-57ab-0000-000000000014 | zh-CN |
实体 | 701db916-fc83-57ab-0000-00000000001e | ar,de,en,es,fr,it,ja,ko,nl,pt,zh-CN |
关键字 | 701db916-fc83-57ab-0000-000000000018 | ar,de,en,es,fr,it,ja,ko,nl,pt,zh-CN |
词性 | 701db916-fc83-57ab-0000-000000000002 | 所有受支持的语言 |
文档的观点 | 701db916-fc83-57ab-0000-000000000016 | ar,de,en,es,fr,it,ja,ko,nl,pt,zh-CN |
表理解 | 701db916-fc83-57ab-0000-000000000012 | 所有受支持的语言 |
有关所有受支持语言的更多信息,请参阅 语言支持。
使用 API 应用扩充项
要使用API进行数据丰富,请完成以下步骤:
-
确定端点的 URL 以及部署的令牌或API密钥。
有关更多信息,请参阅 使用 API 构建定制应用程序。
-
获取项目的项目标识。
从产品用户界面,转至“集成和部署 > 查看 API 信息”页面,然后复制项目标识。
-
如果您不知道要对其应用扩充项的集合的标识,请获取集合列表以进行查找。
例如:
GET $authentication $url/v2/projects/$project_id/collections?version=2019-11-22
将返回
collection_id
。 -
发送 GET 请求以返回列出所应用扩充项的集合的配置。
例如:
GET $authentication $url/v2/projects/$project_id/collections/$collection_id?version=2019-11-22
有关预构建扩充项的扩充项标识,请参阅 扩充项标识。
-
添加要应用的扩充项。
例如,要添加 关键字 扩充项,可以在扩充项列表中包含该扩充项。 首先,从表中获取其标识。
关键字扩充项标识为
701db916-fc83-57ab-0000-000000000018
。 要指示您要将“关键字”扩充项应用于集合中文档的text
字段中的内容,可以 JSON 格式表示该内容,如下所示:{ "enrichment_id" : "701db916-fc83-57ab-0000-000000000018", "fields" : [ "text" ] }
您指定的任何扩充项都将替换缺省扩充项。 因此,如果要保留缺省扩充项,请不要忘记将其包含在应用于集合的扩充项列表中。 有关每种项目类型的缺省扩充项的列表,请参阅 每种项目类型的缺省扩充项。
例如,要保留 实体 扩充项并添加 关键字 扩充项,可以在请求主体中指定以下内容。
"enrichments": [ { "enrichment_id": "701db916-fc83-57ab-0000-00000000001e", "fields": [ "text" ] }, { "enrichment_id": "701db916-fc83-57ab-0000-000000000018", "fields": [ "text" ] } ]
-
使用 update collection 方法提交更新后的 JSON 请求主体,以将扩充项应用于集合。
例如:
POST $authentication -d '$requestBody' $url/v2/projects/$project_id/collections/$collection_id?version=2019-11-22
每个项目类型的缺省扩充项
某些预构建的扩充项将根据项目类型自动应用于项目中的集合。 下表显示了应用于每种项目类型的缺省扩充项。
扩充 | 文档检索 | 合同的文档检索 | 会话式搜索 | 内容挖掘 |
---|---|---|---|---|
合约 | ||||
实体 | ||||
关键字 | ||||
词性 | ||||
文档的观点 | ||||
表理解 |