本文档适用于 IBM Watson® Knowledge Studio 上的 IBM Cloud®。 要查看 Knowledge Studio Marketplace 上 IBM 先前版本的文档,请单击此链接。
训练机器学习模型
在 IBM Watson® Knowledge Studio 中,创建机器学习模型包括训练机器学习模型和评估模型在注释测试数据和盲区数据时的执行情况。
创建机器学习模型
在创建机器学习模型时,请选择要用于训练模型的文档集,并指定要用作训练数据、测试数据和盲区数据的文档的百分比。
关于本任务
通过探索性能度量值,您可以识别提高模型准确性的方法。
限制:每个 Knowledge Studio 实例一次只能训练三个机器学习模型。 如果实例包含多个工作空间,并且其他工作空间中正在训练的机器学习模型的数量合计已达 3 个,那么在您的工作空间中训练机器学习模型的请求将排队,直至其他训练过程完成。
过程
要创建机器学习模型:
-
以 Knowledge Studio 管理员身份登录,然后选择工作空间。
-
选择机器学习模型 > 性能。
-
验证所有文档集是否均已获得核准,以及是否已通过裁定解决了所有注释冲突。 只有通过裁定或核准成为参考标准的文档才能用于训练模型。
-
单击训练和评估。
-
可选:要指定想要如何从文档集分配文档以供系统级别训练、测试或盲区集使用,请单击编辑设置。
请参阅文档集管理以获取帮助来确定要应用的比率。
-
单击 训练 以训练模型,或者单击 训练和评估 以训练模型,评估机器学习模型添加的注释以及分析性能统计信息。
重要信息: 训练机器学习模型可能需要几分钟或几小时,具体取决于存在的人员注释数以及所有文档中的总字数。
-
选择想要用于训练模型的文档集。
注: 文档集必须至少包含 10 个带注释的文档。
-
创建模型后,选择以下操作之一:
选项 | 描述 |
---|---|
日志 | 查看日志文件以确定是否发生了任何问题。 |
详细信息 | 查看注释性能统计信息,更改想要用于训练和测试模型的文档集,以及创建模型工件的快照版本。 |
导出 | 如果您有标准套餐或高端套餐,那么可以将 ZIP 文件导出到包含在机器学习运行时环境(例如,Watson Explorer)中运行模型所需的组件的本地系统。 |
评估模型添加的注释
您可以将人工注释者添加的注释的参考标准视图与模型添加的注释进行比较。
过程
要评估模型添加的注释:
- 选择机器学习模型 > 性能 > 训练和评估。 此时将显示“训练/测试/盲区集”页面。
- 针对训练集或测试集单击查看参考标准以查看通过预注释添加的注释和人工注释者添加的注释。 此时将打开参考标准编辑器。 单击以打开单个文档并查看如何注释提及项、关系和指代的提及项。
- 在性能页面上,单击查看解译结果以查看机器学习模型向测试集内的文档添加的注释。 仅在评估模型后,此按钮才可用。 通过查看结果,您可以查看机器学习模型对测试数据中的提及项、关系和指代的提及项进行标注的良好程度。
- 如果想要更改在训练、测试和盲区数据集之间划分文档的方式,请单击性能 > 训练和评估 >编辑设置。 例如,如果初始结果看起来可接受,那么您可能想要增加测试集内的文档数量以进一步测试机器学习模型的结果。 您可以更改针对不同用途自动划分文档的比率,也可以选择特定文档集以用作训练数据、测试数据和盲区数据。
- 如果进行了任何更改,请单击 训练和评估 以重新训练模型并重新评估注释。
删除机器学习模型
您无法删除机器学习模型。
您可以删除用于开发模型的工作空间,但无法删除模型自身。 删除模型并不是最佳方法。 请改为更新或替换用于训练模型的工件。 即使模型未生成期望的结果,您仍可以继续优化模型。 每次创建新版本时,都将重新构建模型。 您可以编辑诸如字典和类型系统之类的工件,并选择在训练下一个版本时使用不同的注释集。