IBM Cloud Docs
高可用性和灾难恢复

高可用性和灾难恢复

IBM Watson® Discovery 在提供 IBM Cloud® 的所有 Discovery 区域中都具有高可用性。 但是,要从影响整个区域的潜在灾难中恢复,需要进行规划和准备。

IBM Cloud

此信息仅适用于受管部署。

了解服务的定制和使用情况是您的责任。 您还应负责准备好在新区域重新创建服务实例,并在任何区域复原数据。 更多信息,请参阅 “如何确保零停机时间?”

高可用性

IBM Watson® Discovery 支持无单点故障的高可用性。 该服务使用 IBM Cloud 提供的多专区区域 (MZR) 功能,自动、透明地实现高可用性。

IBM Cloud 支持在单个位置中不共享单点故障的多个专区。 它还提供区域内各专区之间的自动负载均衡。

灾难恢复

如果 IBM Cloud 区域遇到重大故障,包括潜在的数据丢失,那么灾难恢复可能会成为问题。 由于 MZR 并不是在所有区域都可用,因此请等待 IBM 将不可用的区域恢复为联机状态。 如果底层数据服务受到故障影响,那么还要等待 IBM 复原这些数据服务。

如果发生灾难性故障,IBM 可能无法从数据库备份恢复数据。 在这种情况下,您需要复原数据,以将服务实例恢复为其最新状态。 您可以将数据复原到同一区域或不同区域。

您的灾难恢复计划应包括了解和保留在 IBM Cloud 上维护的所有数据,并准备好复原这些数据。

备份 Watson Discovery 中的数据

您有多种方法来备份存储在 IBM Watson® Discovery中的数据。 您可以在灾难恢复计划中备份以下数据:

  • 作为源文档副本的数据
  • 从 Discovery 导入和导出的数据

您可以备份下表中列出的资源,以防止在灾难恢复期间丢失数据。

资源恢复支持详细信息
此表具有行和列标题。 行标题标识资源。 列标题标识不同类型的恢复支持。 要了解资源支持哪些恢复方法,请转至描述该资源的行,并查找您感兴趣的恢复方法的列。
资源 备份过程 针对资源下载的 UI 支持 针对资源上载的 UI 支持 API 支持
已上载和已搜寻的文件 安全地存储所摄入数据的所有源文档的备份。 有关更多信息,请参阅 Ingested documents

通过重新连接到原始数据源,保留数据源的凭证以进行重新搜寻。 有关更多信息,请参阅 复原与外部数据源的连接

更多信息,请参阅 备注

False False 下载-否
上载-否
相关性训练数据 下载所有训练查询和示例,并将其保存在本地以备份训练数据。 更多信息,请参阅 培训数据 False False 下载-是
上载-是
扩展列表 通过 API 下载扩展列表,并将其存储在本地以复原扩展列表。 有关更多信息,请参阅 扩展列表 False 下载-是
上载-是
停用词列表 通过 API 下载停用词列表,并将其存储在本地以复原停用词列表。 有关更多信息,请参阅 停用词 False 下载-是
上载-是
Smart Document Understanding 用户训练的模型 导出模型并将其存储在本地以将其备份。 有关更多信息,请参阅 复原智能文档理解模型 下载-否
上载-否
文本分类器扩充项 备份分类器的 .csv 文件并将其存储在本地。 有关更多信息,请参阅 文本分类器 False 上载-否
下载-否
从句子标签中扩充句子分类器 下载从句子标记 UI 创建的句子分类器模型的 .sc 文件。 有关更多信息,请参阅 复原语句分类器 下载-否
上载-否
文档分类器扩充项 备份分类器的 .csv 文件并将其存储在本地。 有关更多信息,请参阅 内容挖掘应用程序资源 False 下载-否
上载-是
字典扩充项 下载使用 Discovery UI 或 Content Mining 应用程序创建的字典的 .csv 文件。 有关更多信息,请参阅 复原字典扩充项

如果通过上载 CSV 文件创建了字典,那么无法将该字典下载为 CSV 文件。

下载-否
上载-是
实体抽取器扩充项 下载实体抽取器模型并将其存储在本地以备份模型。 有关更多信息,请参阅 复原实体抽取器 下载-否
上载-否
正则表达式扩充项 保留在 Discovery UI 中指定的正则表达式的术语。 有关更多信息,请参阅 正则表达式扩充项

您可以通过 API 创建正则表达式扩充项,但无法将其下载。

False 下载-否
上载-是
模式扩充 将模式扩充项下载为 .zip 文件,并将其存储在本地。 有关更多信息,请参阅 模式扩充项复原模式扩充项 下载-否
上载-否
高级规则扩充项 将原始模型文件备份为.zip文件,并保存在本地。 有关更多信息,请参阅 高级规则模型扩充项 False 下载-否
上载-否
在 Knowledge Studio 中创建的基于规则的模型 将原始模型文件备份为.pear文件,并保存在本地。 有关更多信息,请参阅 使用导入的 ML 模型来查找定制术语 False 下载-否
上载-是
在 Knowledge Studio 中创建的机器学习模型 将原始模型文件备份为.zip文件,并保存在本地。 有关更多信息,请参阅 使用导入的 ML 模型来查找定制术语 False 下载-否
上载-是
IBM Cloud Pak for Data 自定义UIMA文本分析模型 IBM Software Hub 自定义UIMA文本分析模型 将原始模型文件备份为.pear文件,并保存在本地。 有关更多信息,请参阅 使用导入的 ML 模型来查找定制术语 False 下载-否
上载-是

随后无法下载添加到 Discovery 的文件,因为原始文件未存储在 Discovery中。 但是,在处理原始文件时,可以从集合索引中存储的文件检索信息。 使用 查询 API 来提交将从相关文件返回段落的查询,然后检查响应主体以获取该文件中的数据。 例如,对于某些文件类型,原始文件中的文本存储在 text 字段中。

有关使用“内容挖掘”应用程序创建的资源的信息,请参阅 内容挖掘资源

句子分类器扩充项

要备份从句子标注 UI 创建的句子分类器模型,请下载这些模型并将其存储在本地。 必须先对模型进行完整训练,然后才能下载该模型。 有关更多信息,请参阅 下载语句分类器模型

摄入的文档

您上传的文档将进行转换和扩充,然后存储到搜索索引中。 如果发生灾难,那么搜索索引不可恢复。 因此请将所有源文档的备份存储到安全的位置。

如果您还通过定期抓取外部数据源来导入文档,您可能希望将数据源凭证保存在外部,以便快速重新建立与数据源的连接。 如需查看可用数据源列表以及每个数据源所需的凭证,请参阅 配置 IBM Cloud 数据源

您可以获取在使用查询 API 摄入原始文档时存储在索引中的部分文本。 有关更多信息,请参阅 恢复文档

训练数据

请参阅此任务来备份训练项目的训练数据查询和示例。 训练数据用于对项目进行显式训练,并逐个项目进行存储。 要抽取训练数据,请使用 API 从 Discovery 下载查询和评级。 要备份训练数据查询和示例,请完成以下步骤:

  1. 使用 列表训练查询API 下载训练数据。
  2. 在本地保存训练查询和示例。

您在训练数据点中使用的文档标识指向当前项目中的文档。 请在新项目中使用相同的标识,以确保引用正确的文档。 如果标识不匹配,那么复原的相关性训练将不起作用。

扩展列表

如果要使用同义词(查询扩展)进行查询修改,请备份 .json 扩展列表并将其存储在本地。 有关更多信息,请参阅实现同义词

非索引字

对于非索引字,请备份文本文件。有关非索引字的更多信息,请参阅定义非索引字

集合信息

这不是必需的,但最佳做法是定期 检索每个集合的状态 并将信息存储在本地。 通过保留这些统计信息,您稍后可在需要时验证复原过程是否成功。

智能文档理解模型

如果您使用智能文档理解(SDU),那么您的配置将关联到相应的模型。 要避免丢失此信息,请导出模型,将其备份,并将其存储在本地。SDU 模型的文件扩展名为 .sdumodel

字典扩充项

  1. 打开项目,然后单击改进和定制
  2. 改进工具面板上,单击指导领域概念,然后单击字典
  3. 单击字典旁边的下载图标。 然后,字典将下载为 .csv 文件。

正则表达式扩充项

将正则表达式备份为 .csv 文件,并将其存储在本地。 请注意您为创建丰富信息而指定的正则表达式,以便您能够根据这些表达式重新创建丰富信息。 有关更多信息,请参阅 正则表达式

机器学习扩充项

备份机器学习模型 .zip 或 .pear 文件,并将其存储在本地。 有关更多信息,请参阅机器学习扩充项和 Watson Explorer Content Analytics Studio 模型

模式扩充项

  1. 打开项目。
  2. 在“改进和定制”页面的“改进工具”面板上,单击 Teach 域概念,然后单击 模式 (Beta)
  3. 单击模式旁边的下载图标。 然后,模式模型将下载为 .zip 文件。

高级规则模型扩充项

将模型文件备份为 .zip 文件,并将其存储在本地。 有关更多信息,请参阅 高级规则模型

分类器扩充项

备份分类器 .csv 文件,并将其存储在本地。 有关更多信息,请参阅 分类器

实体抽取器扩充项

要备份实体抽取器模型,请下载模型并将其存储在本地。 必须先对模型进行完整训练,然后才能下载该模型。 有关更多信息,请参阅 导出实体抽取器

Content Mining 应用程序资源

您无法备份某些数据类型,必须手动重新创建这些数据类型。 有多个内容挖掘定制用户资源,应用程序不会自动备份这些资源。 如果发生数据丢失,那么必须在“内容挖掘”应用程序中手动重新创建以下定制用户资源,或者上载包含该资源的本地保存文件:

  • 定制映射

  • 搜索的文档导出: 可以在“内容挖掘”应用程序的“文档”视图中导出搜索的文档,但不能在该应用程序中重新上载该文档。

  • 构面分析结果导出: 您可以通过单击 导出 图标,然后单击“分析导出选项”对话框中的 导出结果导出 来下载构面分析结果。

  • 集合: 如果在本地将集合存储为 .csv 文件,然后将其上载到应用程序中,那么可以复原内容挖掘集合。 否则,必须手动重新创建集合。

  • 文档分类器: 如果在本地将文档分类器存储为 .csv 文件,然后将其上载到应用程序中,那么可以复原文档分类器。 否则,必须手动重新创建文档分类器。

  • 定制注释器

    • 字典: 如果在本地将字典存储为 .csv 文件并将其上载到应用程序中,那么可以在应用程序中复原该字典。
    • 正则表达式: 如果在本地将正则表达式存储为 .csv 文件并将其上载到应用程序中,那么可以在应用程序中复原正则表达式。
    • 机器学习模型: 如果在本地将模型存储为 .zip 文件,然后将其上载到应用程序中,那么可以复原机器学习模型。
    • PEAR 文件: 如果您将 .pear 文件存储在本地,然后将其上载到应用程序中,那么可以上载该文件。

您无法在本地备份以下资源,必须在“内容挖掘”应用程序中重新创建这些资源。

  • 已保存的分析
  • 报告
  • 仪表板

将数据复原到新的 Watson Discovery 实例

考虑使用备份来复原到位于其他数据中心(也称为区域或位置)的新 Discovery 实例。

要开始复原,首先请复查集合和关联数据源的列表以及文件备份。

  • 创建项目和集合。 请使用 Discovery 工具或 API。 请参阅 创建项目创建集合
  • 将非索引字添加回集合中。 请参阅定义非索引字
  • 如果使用定制查询扩展,请添加查询扩展。 请参阅实现同义词
  • 如果使用 IBM Watson® Knowledge Studio 中的任何定制实体模型进行扩充,请将该模型重新导入到 Discovery 实例。 有关详细信息,请参阅管理扩充项

在按照之前那样配置项目和集合之后,开始摄入源文档。 根据您先前摄入文档的方式,可以使用您自己的解决方案或下列其中一种方法来摄入文档:

复原语句分类器

要复原从句子标注 UI 创建的句子分类器模型,请导入导出的 .sc 文件以创建新的机器学习模型。 无法在语句标记 UI 中打开导出的模型以继续使用该模型。 但是,您可以导入已完成的模型并将其作为语句分类器扩充项应用于集合。

有关如何导入语句分类器模型以创建机器学习扩充项的更多信息,请参阅 使用导入的 ML 模型来查找定制术语

复原训练数据

在恢复项目后,您可以开始重新创建相关性培训模型。 要恢复您的培训数据查询和示例,请使用 创建培训查询API 重新创建您的个人培训查询和示例,或者您也可以通过 Discovery 恢复您的查询和示例。 有关使用 Discovery 复原训练数据的更多信息,请参阅通过训练改进结果相关性中有关访问 训练页面的指示信息。

要使复原正常工作,请注意您在训练数据点中使用的文档标识指向当前项目中的文档。 请在新项目中使用相同的标识,以确保引用正确的文档。 如果标识不匹配,那么复原的相关性训练将不起作用。

复原与外部数据源的连接

在意外丢失数据的情况下,您可能会丢失外部数据源的已安排的搜寻。 有关可用源的列表,请参阅配置 IBM Cloud 数据源

要恢复外部数据,请重新建立与这些数据源的连接,然后重新抓取它们。

要查找存储的数据源凭证,请按照配置 IBM Cloud 数据源中有关所选数据源的指示信息进行操作。 这些指示信息说明了如何重新连接到数据源,并将数据导入到 Discovery 中。

复原智能文档理解模型

要导入先前导出的“智能文档理解”(SDU) 模型,请参阅导入和导出模型。 SDU 模型的文件扩展名为 .sdumodel

将SDU现有模型导入新系列时,最佳做法是创建新系列并添加一个文档,然后导入模型并上传其余文档。

复原字典扩充项

  1. 打开项目。
  2. 在“改进和定制”页面的“改进工具”面板上,单击 Teach 域概念字典,然后单击 上载
  3. 应用字典对话框中,输入 .csv 文件的名称,选择语言,指定构面路径,单击上传,然后选择字典 .csv 文件。
  4. 单击创建

在上传字典 .csv 文件进行恢复后,您无法使用字典编辑器来进一步编辑词汇。 如果要使用字典编辑器,请创建字典,然后手动添加字典词汇。

有关上传词典扩展.csv文件的信息,请参阅 词典

复原模式扩充项

通过完成以下步骤,可以将模式扩充项 .zip 文件复原为高级规则模型 .zip 文件:

  1. 打开项目。
  2. 在“改进和定制”页面的“改进工具”面板上,单击 Teach 域概念高级规则模型,然后单击 上载
  3. 应用高级规则模型对话框中,输入 .zip 文件的名称,选择语言,指定结果字段,单击上传,然后选择高级规则模型 .zip 文件。
  4. 单击创建

在上传模式模型 .zip 文件进行恢复后,您无法使用模式编辑器来进一步编辑这些 .zip 文件。

有关上传高级规则模型.zip文件的更多信息,请参阅 高级规则模型

复原实体抽取器

要复原实体抽取器模型,请导入导出的 .ent 文件以创建新的机器学习模型。 无法在实体抽取器工具中打开导出的模型以继续使用该模型。 但是,您可以导入已完成的模型,并将其作为实体抽取器扩充项应用于集合。

有关如何导入实体抽取器模型以创建机器学习扩充项的更多信息,请参阅 使用导入的 ML 模型来查找定制术语