IBM Cloud Docs
机器学习模型创建工作流程

本文档适用于 IBM Watson® Knowledge Studio 上的 IBM Cloud®。 要查看 Knowledge Studio Marketplace 上 IBM 先前版本的文档,请单击此链接

机器学习模型创建工作流程

创建机器学习模型,以对您可用于识别新文档中相关实体、指代和关系的模型进行训练。

了解用于在 Knowledge Studio 中创建机器学习模型的典型工作流程。

所有步骤都由项目经理执行,但注释文档步骤除外,该步骤由人工注释者执行。 因为人工注释者通常是主题专家,所以在创建工作空间资源(例如,类型系统)期间,还可向他们咨询。

用于开发机器学习模型的工作流程 图 1。 开发机器学习模型的工作流程

创建或优化模型的步骤

步骤 描述
创建工作空间 请参阅创建工作空间。 工作空间包含用于创建模型的资源,包括:

-类型系统: 上载或创建类型系统,并定义人工注释者在注释文本时可以应用的实体类型和关系类型。 模型流程管理者通常与您的领域的主题专家一起工作,以定义类型系统。 请参阅 建立类型系统

-源文档: 通过将代表域内容的样本文档上载到工作空间来创建语料库。 请参阅添加文档以进行注释。 将语料库划分为文档集,指定所有文档集之间共享的文档百分比,并将文档集分配给人工注释者。

- 词典: 上传或创建用于注释文本的词典。 可以选择手动添加字典条目,或从文件上传条目,然后编辑条目。 请参阅创建字典
可选: 预先注释文件 根据工作区词典中的术语或您定义的规则对文档进行预注释。 请参阅引导注释
注释文档
  1. 管理员和项目经理可以直接注释文档,而无需创建注释任务或完成裁定过程。 请参阅直接注释文档集
  2. 项目经理通常将注释任务分配给人工注释者,配置注释者间一致性阈值,并提供人工注释者要遵循的注释准则。 请参阅创建注释任务
  3. 人工注释者使用参考标准编辑器对文档进行手动注释。 人工注释者识别领域内容中相关的提及项,然后使用实体类型对其进行标注。 人工注释者还会识别提及项之间的关系(例如,Mary is an employee of IBM)以及提及项如何指代同一实体(例如,出现“she”以指示 Mary)。 请参阅注释文档
裁定和升级文档 接受或拒绝由人工注释者生成的参考标准,并对任何注释差异进行裁定以解决冲突。 评估人工注释工作的准确性和一致性可能是高级人工注释者或主题经验比项目经理更丰富的用户的职责。 请参阅裁定
训练模型 创建机器学习模型。 请参阅创建机器学习模型
评估模型 评估模型的准确性。 请参阅评估模型添加的注释。 根据模型的准确性,此步骤可能会导致需要一再重复先前的步骤,直至达到最佳准确性为止。 有关根据常见性能问题要更新的内容的构想,请参阅分析机器学习模型性能
发布模型 导出模型。 请参阅使用机器学习模型