IBM Cloud Docs
关于

关于

使用 IBM Watson® Knowledge Studio 可创建机器学习模型,用于了解特定于您行业的语言细微差别、含义和关系,也可创建基于规则的模型,用于根据定义的规则在文档中查找实体。

识别定制实体和关系

通过实体和关系工作空间,您可以创建自己的实体类型系统,并训练定制模型使其能够识别文本中的定制实体。 通过机器学习模型,还可以定义定制关系类型,并训练模型以识别两个实体何时相关。 假设有以下示例句子。

ABC Motors has received great reviews for its new 2020 Lightning.

可以训练定制实体和关系模型,以将“2020 Lightning”识别为 Vehicle 实体,将“ABC Motors”识别为 Manufacturer 实体。 还可以训练模型以识别这两个实体通过 isManufacturedBy 关系相连接。

构建机器学习模型

Knowledge Studio 提供了多个易于使用的工具,用于对非结构化领域文献进行注释,并使用这些注释来创建定制机器学习模型以理解领域的语言。 模型的准确性通过迭代测试进行改进,最终生成的算法可以从模型看到的模式进行学习,并在新文档的大型集合中识别这些模式。 您可以将完成的机器学习模型部署到其他 Watson 基于云的产品和认知解决方案,以查找并抽取关系和实体的提及项,包括实体指代。

构建机器学习模型的过程概述 图 1. 构建机器学习模型的过程概述

  1. 团队根据一组特定于领域的源文档来创建类型系统,以用于为将使用该模型的应用程序的相关信息定义实体类型和关系类型。
  2. 包含两个或更多人工注释者的组对一小组源文档进行注释,以标注表示实体类型的词,标识其中文本识别到实体提及项之间关系的关系类型,以及定义指代来识别指同一事物(即,同一实体)的不同提及项。 解决了注释中的任何不一致情况后,会构建一组最佳注释的文档,这些文档即构成参考标准。
  3. Knowledge Studio 使用参考标准来训练模型。
  4. 已训练的模型用于在从未见过的新文档中查找实体、关系和指代。

有关更多详细信息,请参阅创建机器学习模型

构建基于规则的模型

Knowledge Studio 提供了一个规则编辑器,用于简化在文档中查找和捕获公共模式作为规则的过程。 然后,可以创建识别规则模式的模型,并部署该模型以用于其他服务。

有关更多详细信息,请参阅创建基于规则的模型

使用高级规则分析文本

高级规则功能为 Beta 版。 此功能处于开发的试用阶段,不适合用于生产环境。

您可以通过可视高级规则编辑器创建文本抽取器,其定制潜力高于实体和关系规则编辑器中提供的抽取器。 提供了一些样本抽取器,例如,Finance Actions 抽取器和 Parts of Speech。 您可以编辑并组合它们以创建您自己的高级规则模型。 您可以直接在编辑器中分析文档,也可以导出模型以用于其他服务,例如 Natural Language Understanding

要开始使用,请参阅创建高级规则模型

识别定制类别

定制类别是试验性功能。 此功能随时可能会更改或临时通知被停用。 定制类别不适合用于生产环境。

通过类别工作空间,您可以定义定制内容类别的层次结构,并为服务提供用来将文本内容分类的相关关键短语。 您可以部署要使用的定制类别模型,而不使用 Natural Language Understanding 和 Discovery 提供的标准类别

Watson 服务集成

将领域工件和模型在 IBM Watson® Knowledge Studio 和其他 Watson 服务之间共享。

使用 Knowledge Studio 执行以下任务:

支持 HIPAA

美国健康保险可移植性和责任法案 (HIPAA) 支持可用于 2019 年 4 月 1 日或之后在华盛顿位置创建的高端套餐。 有关更多信息,请参阅 启用欧盟和 HIPAA 支持的设置