已知问题

Discovery 为 IBM Cloud Pak for Data Red Hat OpenShift API for Data Protection (OADP) 备份和复原实用程序生成部分失败状态消息。
- 错误: 使用 OADP 备份实用程序来备份安装了 Discovery 的集群后，检查其状态时，将显示 Phase: PartiallyFailed 消息。一个或多个 Discovery 组件包含在 Failed 列表中。
- 原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。当 Discovery 服务存在，并且管理员备份整个 IBM Cloud Pak for Data 实例时，将显示指示部分失败的状态消息。显示此状态是因为未备份 Discovery 的持久卷声明 (PVC)。但是，此消息不会影响其余服务的备份。
- 解决方案: 不需要执行任何操作来解析状态消息。您可以单独除去与 Discovery 服务关联的持久卷声明。在使用脚本来备份发现服务数据之后，可以遵循发现服务的卸载指示信息中记录的步骤来删除 PVC。有关如何除去与 Discovery 关联的 PVC 的更多信息，请参阅卸载 Discovery 服务。

4.0.8，2022 年 4 月 27 日

如果系统管理员以外的任何人执行升级，那么 wd-discovery-multi-tenant-migration 作业将失败。
- 错误: 使用除 admin 以外的用户标识进行升级时，迁移作业失败。
- 原因: 迁移脚本假定脚本由具有 admin 用户标识的用户运行。
- 解决方案: 应用允许迁移成功的补丁。完成以下步骤：
  1. 从 Cloud Pak for Data Web 客户机中，获取要升级的实例的所有者的用户标识。
  2. 从 Watson Developer Cloud GitHub 存储库下载 wd-migration-uid-patch.zip 补丁文件。
  3. 从归档文件中抽取 wd-migration-uid-patch.yaml 文件，然后在文本编辑器中打开该文件。
  4. 将 <user_id> 变量替换为要升级的实例的所有者的用户标识。
  5. 在登录到集群的终端中运行以下命令:
```
oc create -f wd-migration-uid-patch.yaml
```
  6. 使用以下命令删除之前的迁移任务：
```
oc delete job wd-discovery-multi-tenant-migration
```
删除作业后，迁移作业将重新启动并恢复迁移。

此问题已随 4.0.9 发行版一起解决。
Discovery 为 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序生成部分故障状态消息。
- 错误: 使用 OADP 备份实用程序来备份安装了 Discovery 的集群后，检查其状态时，将显示 Phase: PartiallyFailed 消息。一个或多个 Discovery 组件包含在 Failed 列表中。
- 原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。当 Discovery 服务存在，并且管理员备份整个 IBM Cloud Pak for Data 实例时，将显示指示部分失败的状态消息。显示此状态是因为未备份 Discovery 的持久卷声明 (PVC)。但是，此消息不会影响其余服务的备份。
- 解决方案: 不需要执行任何操作来解析状态消息。您可以单独除去与 Discovery 服务关联的持久卷声明。在使用脚本来备份发现服务数据之后，可以遵循发现服务的卸载指示信息中记录的步骤来删除 PVC。有关如何除去与 Discovery 关联的 PVC 的更多信息，请参阅卸载 Discovery 服务。

4.0.7，2022 年 3 月 30 日

Discovery 在 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序中生成错误。
- 错误: 实用程序未成功完成，并将以下消息写入日志: preBackupViaConfigHookRule on backupconfig/watson-discovery in namespace cpd (status=error)
- 原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。当 Discovery 服务存在，并且管理员尝试备份整个 IBM Cloud Pak for Data 实例时，Discovery 会阻止该实用程序成功完成。
- 解决方案: 应用用于阻止 Discovery 阻止实用程序成功完成的补丁。
  1. 从 Watson Developer Cloud Github 存储库下载 wd-aux-br-patch.zip 文件。
  2. 从 ZIP 文件中抽取 wd-aux-br-patch.yaml 文件。
  3. 在登录到集群的终端中运行以下命令:
```
oc create -f wd-aux-br-patch.yaml
```
此问题已随 4.0.8 发行版一起解决。 (您仍无法使用 OADP 实用程序来备份发现服务，但 OADP 实用程序可以在安装发现时备份其他服务。)
完成 4.0.7 升级后，资源的 Deployed 状态会波动。
- 错误: 通过提交 oc get WatsonDiscovery 命令来检查状态时，资源的就绪状态会在显示 23/23 和 20/23 组件可供使用之间切换。
- 原因: 迁移后未一致报告资源的就绪状态。
- 解决方案: 通常，尽管就绪状态不稳定，但实例已准备就绪可供使用。要手动刷新状态信息，请在登录到集群的终端中运行以下命令:
```
oc proxy &
curl -ksS -X PATCH -H "Accept: application/json, */*" -H "Content-Type: application/merge-patch+json" http://127.0.0.1:8001/apis/discovery.watson.ibm.com/v1/namespaces/<namespace>/watsondiscoveries/wd/status --data '{"status": null}'
```
此问题已随 4.0.8 发行版一起解决。
如果系统管理员以外的任何人执行升级，那么 wd-discovery-multi-tenant-migration 作业将失败。
- 错误: 使用除 admin 以外的用户标识进行升级时，迁移作业失败。
- 原因: 迁移脚本假定脚本由具有 admin 用户标识的用户运行。
- 解决方案: 应用允许迁移成功的补丁。完成以下步骤：
  1. 从 Cloud Pak for Data Web 客户机中，获取要升级的实例的所有者的用户标识。
  2. 从 Watson Developer Cloud GitHub 存储库下载 wd-migration-uid-patch.zip 补丁文件。
  3. 从归档文件中抽取 wd-migration-uid-patch.yaml 文件，然后在文本编辑器中打开该文件。
  4. 将 <user_id> 变量替换为要升级的实例的所有者的用户标识。
  5. 在登录到集群的终端中运行以下命令:
```
oc create -f wd-migration-uid-patch.yaml
```
  6. 使用以下命令删除之前的迁移任务：
```
oc delete job wd-discovery-multi-tenant-migration
```
删除作业后，迁移作业将重新启动并恢复迁移。

此问题已随 4.0.9 发行版一起解决。

4.0.6，1 2022 年 3 月

如果在开始升级过程之前没有在现有集群中供应 Discovery 实例，那么升级到 4.0.6 将失败。
- 错误: 4.0.6 升级过程假定在现有集群中供应了 Discovery 实例。例如，如果要从 4.0.5 升级到 4.0.6，那么必须先在 4.0.5 集群中供应实例，然后才能开始迁移。
- 原因: 当前代码在不存在实例时返回错误，因为它找不到要迁移的文档索引。
- 解决方案: 在开始升级到 4.0.6之前，请验证 Discovery 的实例是否已在现有 IBM Cloud Pak for Data 集群中供应。如果尝试升级到 4.0.6，但未供应任何实例，并且迁移失败，请除去现有安装并从头开始安装 4.0.6。
完成 4.0.6 升级后，资源的 Deployed 状态会波动。
- 错误: 通过提交 oc get WatsonDiscovery 命令来检查状态时，资源的就绪状态会在显示 23/23 和 20/23 组件可供使用之间切换。
- 原因: 迁移后未一致报告资源的就绪状态。
- 解决方案: 通常，尽管就绪状态不稳定，但实例已准备就绪可供使用。就绪状态将在大约 5 小时后进行设置。您可以等待就绪状态一致显示 23/23，也可以通过在登录到集群的终端中运行以下命令来手动刷新状态信息:
```
oc proxy &
curl -ksS -X PATCH -H "Accept: application/json, */*" -H "Content-Type: application/merge-patch+json" http://127.0.0.1:8001/apis/discovery.watson.ibm.com/v1/namespaces/<namespace>/watsondiscoveries/wd/status --data '{"status": null}'
```
此问题已随 4.0.8 发行版一起解决。
Discovery 在 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序中生成错误。
- 错误: 实用程序未成功完成，并将以下消息写入日志: preBackupViaConfigHookRule on backupconfig/watson-discovery in namespace cpd (status=error)
- 原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。当 Discovery 服务存在，并且管理员尝试备份整个 IBM Cloud Pak for Data 实例时，Discovery 会阻止该实用程序成功完成。
- 解决方案: 应用用于阻止 Discovery 阻止实用程序成功完成的补丁。
  1. 从 Watson Developer Cloud Github 存储库下载 wd-aux-br-patch.zip 文件。
  2. 从 ZIP 文件中抽取 wd-aux-br-patch.yaml 文件。
  3. 在登录到集群的终端中运行以下命令:
```
oc create -f wd-aux-br-patch.yaml
```
此问题已随 4.0.8 发行版一起解决。 (您仍无法使用 OADP 实用程序来备份发现服务，但 OADP 实用程序可以在安装发现时备份其他服务。)
如果系统管理员以外的任何人执行升级，那么 wd-discovery-multi-tenant-migration 作业将失败。
- 错误: 使用除 admin 以外的用户标识进行升级时，迁移作业失败。
- 原因: 迁移脚本假定脚本由具有 admin 用户标识的用户运行。
- 解决方案: 应用允许迁移成功的补丁。完成以下步骤：
  1. 从 Cloud Pak for Data Web 客户机中，获取要升级的实例的所有者的用户标识。
  2. 从 Watson Developer Cloud GitHub 存储库下载 wd-migration-uid-patch.zip 补丁文件。
  3. 从归档文件中抽取 wd-migration-uid-patch.yaml 文件，然后在文本编辑器中打开该文件。
  4. 将 <user_id> 变量替换为要升级的实例的所有者的用户标识。
  5. 在登录到集群的终端中运行以下命令:
```
oc create -f wd-migration-uid-patch.yaml
```
  6. 使用以下命令删除之前的迁移任务：
```
oc delete job wd-discovery-multi-tenant-migration
```
删除作业后，迁移作业将重新启动并恢复迁移。

此问题已随 4.0.9 发行版一起解决。

4.0.5，2022 年 1 月 26 日

Discovery 在 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序中生成错误。
- 错误: 实用程序未成功完成，并将以下消息写入日志: preBackupViaConfigHookRule on backupconfig/watson-discovery in namespace cpd (status=error)
- 原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。当 Discovery 服务存在，并且管理员尝试备份整个 IBM Cloud Pak for Data 实例时，Discovery 会阻止该实用程序成功完成。
- 解决方案: 应用用于阻止 Discovery 阻止实用程序成功完成的补丁。
  1. 从 Watson Developer Cloud Github 存储库下载 wd-aux-br-patch.zip 文件。
  2. 从 ZIP 文件中抽取 wd-aux-br-patch.yaml 文件。
  3. 在登录到集群的终端中运行以下命令:
```
oc create -f wd-aux-br-patch.yaml
```
此问题已随 4.0.8 发行版一起解决。 (您仍无法使用 OADP 实用程序来备份发现服务，但 OADP 实用程序可以在安装发现时备份其他服务。)

4.0.4，2021 年 12 月 20 日

Discovery 在 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序中生成错误。
- 错误: 实用程序未成功完成，并将以下消息写入日志: preBackupViaConfigHookRule on backupconfig/watson-discovery in namespace cpd (status=error)
- 原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。当 Discovery 服务存在，并且管理员尝试备份整个 IBM Cloud Pak for Data 实例时，Discovery 会阻止该实用程序成功完成。
- 解决方案: 应用用于阻止 Discovery 阻止实用程序成功完成的补丁。
  1. 从 Watson Developer Cloud Github 存储库下载 wd-aux-br-patch.zip 文件。
  2. 从 ZIP 文件中抽取 wd-aux-br-patch.yaml 文件。
  3. 在登录到集群的终端中运行以下命令:
```
oc create -f wd-aux-br-patch.yaml
```
此问题已随 4.0.8 发行版一起解决。 (您仍无法使用 OADP 实用程序来备份发现服务，但 OADP 实用程序可以在安装发现时备份其他服务。)

4.0.3，2021 年 11 月 18 日

此发行版中未提供引导式教程。
Discovery 在 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序中生成错误。
- 错误: 实用程序未成功完成，并将以下消息写入日志: preBackupViaConfigHookRule on backupconfig/watson-discovery in namespace cpd (status=error)
- 原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。当 Discovery 服务存在，并且管理员尝试备份整个 IBM Cloud Pak for Data 实例时，Discovery 会阻止该实用程序成功完成。
- 解决方案: 应用用于阻止 Discovery 阻止实用程序成功完成的补丁。
  1. 从 Watson Developer Cloud Github 存储库下载 wd-aux-br-patch.zip 文件。
  2. 从 ZIP 文件中抽取 wd-aux-br-patch.yaml 文件。
  3. 在登录到集群的终端中运行以下命令:
```
oc create -f wd-aux-br-patch.yaml
```
此问题已随 4.0.8 发行版一起解决。 (您仍无法使用 OADP 实用程序来备份发现服务，但 OADP 实用程序可以在安装发现时备份其他服务。)

4.0.0，2021 年 7 月 13 日

使用 Analyze API 应用的机器学习模型扩充项可能会失败。
- 错误: [WKSML_MODEL_NAME]: Enrichment of a document failed
- 原因: Watson Knowledge Studio 中存在已知问题，可能会导致扩充处理超时。
- 解决方案: 使用 Analyze API 将 Watson Knowledge Studio 模型扩充项应用于集合时，请将输入文档的大小保持在 50 KB 以下。

在后续发行版中修正的 2.2.1 问题

[已在第 4 版中修正]如果向数据集中添加 IBM Watson® Knowledge Studio 机器学习增益，摄取过程可能会运行得很慢，但最终会完成。如果摄入过程很慢，那么在警告和错误中可能会看到以下错误消息：
```
[WKSML_MODEL_NAME]: Document analysis timed out
```
有关其他超时详细信息，可查看 Knowledge Studio 机器学习日志，这可能类似于以下内容：
```
{
  "message": "Analysis failed due to:
    org.apache.uima.analysis_engine.AnalysisEngineProcessException
    at c.i.n.b.SIREAnnotator.process(_:454)
  ... ",
  "level": "SEVERE",
}
```
对于在处理期间超时的文档，会对其建立索引，但不会有 Knowledge Studio 扩充项结果。

2.2.1 2021 年 2 月 26 日

部署计时问题:
- 错误: 安装补丁 7 后，当您尝试供应服务实例时，将显示 404 Not Found 错误。可能会针对 nginx pod 记录以下消息: open() "/usr/local/openresty/nginx/html/watson/common/discovery/auth" failed (2: No such file or directory)
- 解决方案: 重新启动 zen-watcher pod。
如果执行从外部容器注册表拉取容器映像的气郄式安装，那么可能会迂到以下问题:
- 错误: 某些 Discovery pod 可能会报告 ImagePullBackoff 错误。
- 原因: 正在使用错误的映像拉取私钥。
- 解决方案: 在安装期间完成以下步骤:
  - 开始安装 Watson Discovery。
  - 在 watson-discovery-operator 模块完成后，通过运行以下命令来检查是否创建了 WatsonDiscovery 定制资源:
```
oc get WatsonDiscovery wd
```
  - 创建定制资源后，运行以下命令以指向正确的映像拉取私钥以从外部注册表拉取映像:
```
pull_secret=$(oc get secrets | grep 'docker-pull-.*-watson-discovery-registry-registry' | cut -d ' ' -f 1)
cat << EOS > discovery-patch.yaml
spec:
  shared:
    imagePullSecret: $pull_secret
EOS
oc patch wd wd --type=merge --patch "$(cat discovery-patch.yaml)"
```
  - 如果 RabbitMQ 容器仍处于 ImagePullBackoff 状态，请删除 RabbitMQ CR，以便让rabbitmq-operator能够重新创建 RabbitMQ 集群。您可以使用以下命令：
```
oc delete IbmRabbitmq wd-rabbitmq
```
在 IBM Watson® Discovery 中，Content Mining项目仅支持每个项目一个集合。如果创建多个Content Mining集合，可能会遇到错误。如果遇到错误，请删除额外的Content Mining集合，以使每个Content Mining项目只有一个关联集合。
如果您正在准备由 Discovery for Cloud Pak for Data 集群来执行实例从 2.2.0 到 2.2.1 的就地升级，那么有时 cpd-cli adm 命令会失败，并显示以下错误消息：Error from server (UnsupportedMediaType): error when applying patch。如果收到此错误消息，请输入 oc delete scc cpd-zensys-scc cpd-user-scc cpd-noperm-scc edb-operator-scc admin-discovery-scc 以删除相关资源，然后重新输入 cpd-cli adm 命令。
如果正在将 Discovery for Cloud Pak for Data 实例从 2.2.0 升级到 2.2.1，有时 cpd-cli upgrade 命令会在滚动更新完成之前完成。有关验证升级是否成功完成的信息，请参阅验证升级是否成功完成。
从 Discovery 2.2.0 升级到 2.2.1 后，模型-列车图像不会更新。要解决此问题，请删除模型训练操作员创建的部署，并等待操作员重新创建这些部署。输入以下命令以删除部署：
```
oc delete deploy -l 'app.kubernetes.io/managed-by=ibm-modeltrain'
```
运行此命令后，模型训练操作员将创建新的部署。

如果将 Discovery for Cloud Pak for Data 从 2.2.0 升级到 2.2.1，那么可能会收到以下错误消息:

[ERROR] [2021-03-04 05:12:44-0657] Exiting due to error (Storage class is immutable. Module ibm-watson-gateway-operator x86_64 from Assembly portworx-shared-gp3 was installed with ibm-watson-gateway-operator x86_64, but new install/upgrade command is requesting portworx-db-gp3-sc. If you installed the assembly with a different storage class, please upgrade it individually.). Please check /ibm/cpd-cli-workspace/logs/CPD-2021-03-04T05-12-04.log for details
[ERROR] 2021-03-04T05:12:44.659615Z Execution error:  exit status 1

生成此错误消息是因为用于安装的存储类与升级期间使用的存储类不同。由于不同附加组件的存储类依赖关系操作程序记录为用于安装的存储类依赖关系操作程序，因此安装依赖关系操作程序的不同附加组件产生此差异。要解决此问题，必须分别升级以下子组合件:

升级 Watson 网关操作程序:

./cpd-cli upgrade \
--repo ./repo.yaml \
--assembly ibm-watson-gateway-operator \
--arch Cluster_architecture \
--namespace <Project> \
--transfer-image-to <Registry_location> \
--cluster-pull-prefix <Registry_from_cluster> \
--ask-pull-registry-credentials \
--ask-push-registry-credentials

升级 Minio 操作程序:

./cpd-cli upgrade \
--repo ./repo.yaml \
--assembly ibm-minio-operator \
--namespace <Project> \
--transfer-image-to <Registry_location> \
--cluster-pull-prefix <Registry_from_cluster> \
--ask-pull-registry-credentials \
--ask-push-registry-credentials

升级 RabbitMQ 操作程序:

./cpd-cli upgrade \
--repo ./repo.yaml \
--assembly ibm-rabbitmq-operator \
--namespace <Project> \
--transfer-image-to <Registry_location> \
--cluster-pull-prefix <Registry_from_cluster> \
--ask-pull-registry-credentials \
--ask-push-registry-credentials

升级 etcd 操作程序:

./cpd-cli upgrade \
--repo ./repo.yaml \
--assembly ibm-etcd-operator \
--namespace <Project> \
--transfer-image-to <Registry_location> \
--cluster-pull-prefix <Registry_from_cluster> \
--ask-pull-registry-credentials \
--ask-push-registry-credentials

升级模型训练经典操作程序:

./cpd-cli upgrade \
--repo ./repo.yaml \
--assembly modeltrain-classic \
--arch Cluster_architecture \
--namespace <Project> \
--transfer-image-to <Registry_location> \
--cluster-pull-prefix <Registry_from_cluster> \
--ask-pull-registry-credentials \
--ask-push-registry-credentials

升级 Elasticsearch 操作程序:

./cpd-cli upgrade \
--repo ./repo.yaml \
--assembly ibm-cloudpakopen-elasticsearch-operator \
--namespace <Project> \
--transfer-image-to <Registry_location> \
--cluster-pull-prefix <Registry_from_cluster> \
--ask-pull-registry-credentials \
--ask-push-registry-credentials

其中 <Project> 是安装 Discovery for Cloud Pak for Data 2.2.0 实例的命名空间，<Registry_location> 是推送到注册服务器的映像的位置，<Registry_from_cluster> 是群集上的 pod 可以从中提取映像的位置。

在 IBM Cloud Pak for Data 3.5上安装时，可能会迂到以下问题:
- 错误: 如果尝试在运行 Planning Analytics 的集群上供应 Discovery 服务，那么某些 Discovery pod 不会启动且安装失败。 Pod 的日志显示诸如 java.lang.NumberFormatException: For input string 的消息。
- 原因: 随 Planning Analytics一起安装的 couchdb 服务将名为 COUCHDB_PORT 的环境变量添加到 Kubernetes 集群。Discovery 不使用 couchdb，因此未指定此环境变量的值。但是，某些 pod 尝试解析变量，这会导致错误。
- 解决方案: 安装补丁 cpd-watson-discovery-2.2.1-patch-1，这将解决此问题。

另请参阅所有前发行版中的问题。

2.2，8 2020 年 12 月

在上传较小的 CSV 文件（通常为 99 行或更少的 CSV 文件）时，可能未正确摄入头和/或第一行。如果发生这种情况，请在工具中导航至“CSV 设置”选项卡并更新设置。重新处理后，导航至管理字段选项卡，并根据需要更新字段类型。
如果使用使用 IBM Cloud Pak for Data 自定义连接器构建的自定义爬虫设置了收藏集，然后删除了自定义爬虫部署，则“处理设置”页面将不会显示爬虫配置。这是因为底层搜寻器不可用。要解决此问题，请在集合使用了定制搜寻器时确认已部署定制搜寻器。
将 IBM Cloud Pak for Data 定制连接器与 Discovery 用于 IBM Cloud Pak for Data 2.2时，用于部署和除去定制搜寻器的部署的脚本 scripts/manage_custom_crawler.sh 失败。要解决此问题，请将 podname="gateway" 中的第 37 行 podname="wd-discovery-gateway" 替换为 scripts/manage_custom_crawler.sh，然后重新运行部署命令。
在工具中创建定制扩充项时，必须选择要应用扩充项的字段，然后单击应用。如果未选择任何字段，那么将禁用应用并重新处理按钮（该按钮用于更改扩充项），直到新的扩充项具有字段为止。
如果将合同扩充项或了解表扩充项应用于集合，那么当该集合正在摄入文档时，可能会收到以下错误消息: The number of nested documents has exceeded the allowed limit of [X]. 请联系IBM 支持中心以调整限制。

使用定制字典扩充文本时，entities.type 的输出应该是“字典”扩充项的完整构面路径。但是，在此发行版中，将不显示完整的构面路径。要解决此问题，请重新处理集合。例如，如果构面路径为 sample1.sample2，那么在重新处理之前，它将类似于以下内容：

{
  "result" : {
    "enriched_text" : [
      {
        "entities" : [
          {
            "text" : "capital",
            "type" : "sample2",
            ...
            "model_name" : "Dictionary:.sample1.sample2"}
            ...

在重新处理之后，它将类似于以下内容：

{
  "result" : {
    "enriched_text" : [
      {
        "entities" : [
          {
            "text" : "capital",
            "type" : "sample1.sample2",
            ...
            "model_name" : "Dictionary:.sample1.sample2"}
            ...

在转换器设置为 auto_detection=true 的情况下上传 CSV 文件时，工具中的 CSV 设置选项卡将显示不正确的设置。如果更新 CSV 设置选项卡上的设置，那么 auto_detection 设置将不再为 true。
在使用“智能文档理解”(SDU) 定制模型转换的 Office 文档（.doc、.docx、.odf、.xls、.xlsx、.ods、.ppt、.pptx、.odp）中，publicationdate 可能不会显示在 JSON 响应的 extracted_metadata 字段中。它将显示在 JSON 响应的 html 字段中。 publicationdate 字段中的 html 将是文档的摄入日期，而不是文档的原始发布日期。
“分析”API 使用内存内部高速缓存来保存与用于运行文档的集合相关联的扩充模型。如果集合包含许多大型扩充项，或者同时使用多个这样的集合，那么高速缓存可能会耗尽内存资源。发生这种情况时，“分析”API 会返回空结果（请参阅示例），而无状态 API REST 代理将在其日志中显示以下消息：RESOURCE_EXHAUSTED: stateless.Analysis/analyze: RESOURCE_EXHAUSTED。
```
{
  "result": null,
  "notices": null
}
```
要解决此问题，请执行以下操作：
1. 查看集合中使用的扩充项，并除去应用程序不需要的扩充项。特别是删除“*语篇 *”的丰富内容。
2. 减少与“分析”API 同时使用的集合数。
3. 增大高速缓存内存：
  - 将 container model-runtime 中 deployment core-discovery-stateless-api-model-runtime 的内存限制增大到 10 GB 或更多
  - 编辑 CAPACITY_MB 中的环境变量 deployment core-discovery-stateless-api-model-runtime，将其设置为 10240 或更多
如果重新启动模型运行时容器，但未重新启动模型网格运行时容器，那么 Analyze API 可能会迂到问题。
- 错误:Analzye API 调用在特定集合上返回 500 错误，并且日志包含以下条目:
```
"message": "error occurred in analyzer
  java.lang.NullPointerException
  at c.i.e.a.a.s.r.ModelManager$2.analyze(ModelManager.java:112)
```
- 原因: 模型运行时容器与模型网格运行时容器不同步。
- 解决方案: 删除 wd-stateless-api-model-runtime pod 以重新启动模型网格和模型运行时容器。

另请参阅所有前发行版中确定的问题。

2.1.4，2020 年 9 月 2 日：

使用 FORM 认证配置 Web 搜寻时，如果指定的 URL 不带尾部斜杠（例如：https://webcrawlurl.com），那么 Web 搜寻将仅搜寻登录页面。要解决这个问题，可在 URL 后加上斜线，例如：https://webcrawlurl.com/。
指导教程不会在 Firefox 上运行。有关其他支持的浏览器列表，请参阅浏览器支持。
如果模型中的多个提取器在内部对一个或多个输出视图使用相同的名称，则将文档输入到使用 Watson Knowledge Studio 中内置的自定义高级规则模型的集合中可能会失败。
如果删除大量文档，然后再立即摄入大量文档，那么可能需要更长的时间，所有文档才能变得可用。
启用 FIPS (联邦信息处理标准) 时，分类器扩充项不起作用。

另请参阅所有前发行版中确定的问题。

在后续发行版中修正的 2.1.4 问题

[在 V 2.2] 在已部署的“内容挖掘”应用程序中，如果在搜索查询中包含波浪号 (~) 以启用模糊匹配或包含星号 (*) 以表示通配符，那么搜索定制将正常工作，但匹配字符串不会在查询结果中突出显示。

[已在 2.2 版本中修正]更改工具中“管理字段”选项卡上的“包含在索引中”字段时，可能会出现转换错误。如果发生此错误，那么将不会为文档建立索引。要解决此问题，请执行以下操作：

oc edit sts core-discovery-converter

按如下所示编辑 containers 和 - name: INGESTION_POD_NAME 之间的内容：

containers:
  - command:
    - bash
    - -c
    - |
      FILE=/opt/ibm/wex/zing/bin/converter.sh &&
      sed -i "/choreo_2.11-9.1.1.jar/d" $FILE &&
      sed -i "/disco-doc-conversion-commons_2.11-1.0.4.jar/d" $FILE &&
      sed -i "/jackson-module-scala_2.11-2.10.4.jar/d" $FILE &&
      sed -i "/macro-compat_2.11-1.1.1.jar/d" $FILE &&
      sed -i "/pureconfig-core_2.11-0.12.2.jar/d" $FILE &&
      sed -i "/pureconfig-generic-base_2.11-0.12.2.jar/d" $FILE &&
      sed -i "/pureconfig-generic_2.11-0.12.2.jar/d" $FILE &&
      sed -i "/pureconfig-macros_2.11-0.12.2.jar/d" $FILE &&
      sed -i "/pureconfig_2.11-0.12.2.jar/d" $FILE &&
      sed -i "/scala-guice_2.11-4.1.1.jar/d" $FILE &&
      sed -i "/scala-logging_2.11-3.7.2.jar/d" $FILE &&
      sed -i "/scalactic_2.11-3.0.5.jar/d" $FILE &&
      sed -i "/scalaj-http_2.11-2.3.0.jar/d" $FILE &&
      sed -i "/service-commons_2.11-22.1.0.jar/d" $FILE &&
      sed -i "/shapeless_2.11-2.3.3.jar/d" $FILE &&
      /opt/ibm/wex/zing/bin/entrypoint.sh /opt/ibm/wex/zing/bin/controller.sh
    env:
    - name: INGESTION_POD_NAME

添加了 - command: 至 /opt/ibm/wex/zing/bin/entrypoint.sh /opt/ibm/wex/zing/bin/controller.sh 的行，并删除了 - 之前的行。env:

保存更改。它将重新启动 converter pod。

2.1.3，2020 年 6 月 19 日：

IBM Watson® Knowledge Studio 2.1.3 或更高版本中不支持 Discovery for Cloud Pak for Data 机器学习模型中的Entity Subtypes。有关转换现有型号的说明，请联系支持中心。
无法将文件名中包含空格的 CSV 文件（例如：file 1.csv）上传到内容挖掘项目中。请重命名该文件来解决此问题。
执行项目级别相关性训练时，如果您有多个集合，并且其中两个或更多集合包含重复的 document_id，那么项目级别相关性训练会失败。重复的 document_ids 示例：Collection A 包含标识为 1234 的文档，Collection B 也包含标识为 1234 的文档。
创建构面后，仅正确保存了使用前缀为 extracted_metadata 的字段的第一个构面。具有该前缀的其他构面会显示，但在屏幕刷新之后将消失。这种情况针对每个项目只会发生一次，因此变通方法是刷新并重新添加构面。
IBM Cloud Pak for Data 在安装过程中，某些作业可能会错误地将状态报告为，从而导致安装超时。IBM Cloud Pak® for Data 2.5.0.0 Kubernetes OOMKilled 要解决此问题，在作业返回 OOMKilled 后，请验证与该作业关联的 pod 的日志。日志中应该没有明显的错误消息，并且资源在日志中报告为已创建。请手动验证这些资源在名称空间中是否存在，然后删除该作业。这将导致安装继续。
应用扩充项时，某些文档可能会显示两个 html 字段。显示的两个 html 字段相同，并且操作方式相同。
在 Firefox 中创建数据源时，您可能看不到整个选项列表，包括更多处理设置设置。要解决此问题，请缩小，增大浏览器高度，或使用其他支持的浏览器。
定制搜索结果的显示时，在单击Apply按钮后，有时不会保存所做的更改。要解决此问题，请刷新浏览器，然后重试进行更改。
为集合设置数据源或 Web 搜寻器时，如果输入的配置不正确，然后在处理设置页面上尝试更新该配置，那么在单击Apply changes and reprocess按钮时，数据源更新或搜寻可能不会启动。您可以通过打开集合的活动页面来了解处理是否已启动，从而确认此问题。如果您看到针对数据源的处理尚未启动，请单击Recrawl按钮，然后单击Apply changes and reprocess按钮。如果您看到针对 Web 搜寻的处理尚未启动，请单击Stop按钮，然后单击Recrawl按钮。
IBM Cloud Pak for Data 使用在部署上运行测试时，将返回状态。helm test core core Helm core-discovery-api-post-install-test FAILED 这是由于 test pod 图像中的一个错误造成的。可以忽略该测试结果，因为失败与部署中的任何内容都无关。
缺省情况下，在使用工具创建任何off项目类型时，“光学字符识别 (OCR)”均设置为。但是，如果使用 API 创建项目，那么 OCR 会设置为on。要解决此问题，请打开工具并将项目设置更改为off。
针对集合将“光学字符识别 (OCR)”设置为 on 且未应用经过训练的智能文档理解 (SDU) 模型时，不会处理 PNG、TIFF 和 JPG 文件以进行文本识别。也不会处理 PDF、Word、PowerPoint 和 Excel 文档中嵌入的图像 - 仅会处理这些文档中的非图像部分以进行文本识别。要解决此问题，请导入或训练 SDU 模型，并重新处理集合。这将允许从图像中抽取文本。
您在 Watson Assistant 中创建搜索技能并被定向到 Watson Discovery 工具后，屏幕是空白的。由于 URL 缺少 Discovery 实例标识，才会发生这种情况。要解决此问题，请执行以下操作：
1. 从 IBM Cloud Pak for Data Web 客户机菜单中，选择我的实例。例如：https://mycluster.com/zen/#/myInstances。
2. 选择正在使用的 Discovery 实例，然后单击“启动工具”。
3. 工具装入后，URL 应该具有以下结构：https://mycluster.com/discovery/core/instances/00000000-0000-0000-0001-597165341876/projects
4. 复制除 /projects 之外的整个路径。例如： https://mycluster.com/discovery/core/instances/00000000-0000-0000-0001-597165341876
5. 返回显示空白 Discovery 屏幕的浏览器选项卡。 URL 结构将是这样的：https://mycluster.com/discovery/core/collections/new?redirect_uri=...
6. 用之前复制的 URL 替换 https://mycluster.com/discovery/core，因此新的 URL 应该是这样的：https://mycluster.com/discovery/core/instances/00000000-0000-0000-0001-597165341876/collections/new?redirect_uri=...
7. 按 Enter 键以打开更新的 URL。您现在应该位于 Watson Discovery 管理集合页面上。

另请参阅所有前发行版中确定的问题。

2.1.2 2020 年 3 月 31 日

使用包含韩语、波兰语、日语、斯洛伐克语或中文的段落检索时，此版本中的响应时间可能会较缓慢。要解决此问题，请禁用段落检索或上传定制的非索引字列表，其中包含文档中常用的词（例如，介词和代词）。有关多个语言的非索引字列表的示例，请参阅定义非索引字。另请参阅 GitHub上的 Stopwords ISO。
[更新：已在 2.1.3 版本中修复]在 2.1.2、2.1.1 和 2.1.0 版本中，PNG、TIFF 和 JPG 单个图像文件不会被扫描，也不会从这些文件中提取任何文本。此外，还不扫描 PDF、Word、PowerPoint 和 Excel 文件中嵌入的 PNG、TIFF 和 JPEG 图像，也不会从这些图像文件中抽取任何文本。
启用 FIPS（联邦信息处理标准）时，智能文档理解不支持 .doc、.docx、.odf、.xls、.xlsx、.ods、.ppt、.pptx 和 .odp 转换。
在内容挖掘应用程序中，如果为该集合重新构建索引，那么任何文档标志设置都将消失。
从 2.1.2 发行版开始，使用 V1 API 上传和管理相关性训练数据，将不会训练相关性训练模型。 v1 API 已被项目相关性培训 v2 API 所取代。如果需要保留训练数据，可以使用 V1 API 列出这些数据，然后使用 V2 API 将其添加到项目。
多个正则表达式不能同时应用于一个集合。
IBM Cloud Pak for Data 下载时附带的安装说明README有两处小改动。IBM Watson® Discovery for IBM Cloud Pak® for Data 有关 README 的更新版本，请参见 Discovery Helm 图 README.md。
- 对 --cluster-pull-prefix PREFIX 自变量的描述进行了更改。
- 语言扩展包名称已从 ibm-watson-discovery-pack1-2.1.2.tar.xz. 更新为 ibm-wat-dis-pack1-prod-2.1.2.tar.xz。

另请参阅所有前发行版中确定的问题。

2.1.1 2020年1月24日

创建字典时，建议的字典术语默认归一化为小写（例如，Watson Assistant 将归一化为 watson assistant）。为确保匹配大写术语，应明确将其作为 Other terms 列表的一部分或作为 Base term。
备份和复原数据时，训练数据未成功复原。如果通过使用连接器的搜寻或 Web 搜寻添加了集合中的文档，那么可以从现有项目中单独检索训练数据进行备份，并将其上传到新复原的项目中。更多信息，请参阅 API 参考中的“列出培训查询”和“ 创建培训查询”。
搜寻 SharePoint Online 或 SharePoint OnPrem 文档时，JSON 文档可能未正确建立索引，并且返回的 title 可能为 errored。这是因为 SharePoint Web Service 使用 ows_FileRef 属性来检索 JSON 文件，这将返回错误页面。要解决此问题，请联系 SharePoint 管理员和 Microsoft 支持人员。
如果将 V2.0.1 中创建的集合迁移到 V2.1.0 或 V2.1.1，那么不会为该集合分配项目类型，并且该集合不可供查询。要分配项目类型，请通过选择我的项目来打开项目页面。命名项目，然后选择以下“项目类型”之一：Document Retrieval、Conversational Search、Content Mining 或 Custom。

另请参阅所有前发行版中确定的问题。

在后续发行版中修正的 2.1.1 问题

[修正了版本 2.1.2 中的问题在] OpenShift, 上安装 Discovery for Cloud Pak for Data 时，由于 classpath.NET Framework 中的 jar 不兼容，ranker-rest 服务可能会间歇性启动失败。要修复此问题：

使用以下命令打开 ranker-rest 编辑器：kubectl edit deployment {release-name}-{watson-discovery}-ranker-rest
在编辑器中，搜索 ranker-rest image（例如：{docker-registry}/{namespace}/discovery-ranker-rest-service:20200113-150050-2-d1527c2）

在 {docker-registry}/{namespace}/discovery-ranker-rest-service:20200113-150050-2-d1527c2 下面添加以下命令：

command: ["/tini"]
args: ["-s", "-v", "--", "java", "-Dkaryon.ssl=true", "-Dkaryon.port=9081", "-Dkaryon.ssl.port=9090", "-Dkaryon.ssl.certificate=/opt/bluegoat/karyon/ssl/karyon-cert.pem", "-Dkaryon.ssl.privatekey=/opt/bluegoat/karyon/ssl/karyon-private-key.pem", "-Djavax.net.ssl.trustStore=/opt/bluegoat/karyon/ssl/keystore.jks", "-Djavax.net.ssl.keyStore=/opt/bluegoat/karyon/ssl/keystore.jks", "-Dlog4j.debug=false", "-Dlitelinks.threadcontexts=log4j_mdc", "-Dwatson.ssl.truststore.path=/opt/bluegoat/karyon/ssl/litelinks-truststore.jks", "-Dwatson.ssl.truststore.password=watson15qa", "-Dlitelinks.delay_client_close=false", "-Drxnetty.http.maxcontentlength=314572800", "-cp", "lib/logback-classic-1.2.3.jar:*:lib/*", "com.ibm.watson.raas.rest.Runner"]

2.1.0 2019 年 11 月 27 日

将扩充项应用于集合时，扩充项语言必须与集合语言相匹配，否则应用会失败。工具会显示所有集合，而不考虑语言。
在“管理字段”选项卡上，可以编辑系统生成的字段。不应通过更改字段类型或关闭索引来编辑以下字段：document_id、extracted_metadata 和 metadata。
删除集合并选择 Don't delete underlying data 选项时，任何未完成的文档摄入搜寻都会继续在后台运行，直到现有搜寻完成为止，这将影响新的搜寻开始时间。
IBM Cloud Pak for Data Discovery 由于组件进入锁定状态，可能无法正确启动。可能需要手动数据库干预来清除锁定。有关确定和解决此问题的更多信息，请参阅清除锁定状态。
如果使用“上传数据”功能上传了文档，然后删除该文档，接着尝试上传相同文档或具有相同文档标识的其他文档，那么上传会失败，并且会显示消息：Error during creating a document。
处理时生成 html 字段的文档不能与相关性训练配合使用。为使用 Smart Document Understanding 或 Content Intelligence处理的文档生成 HTML。必须先除去 html 字段，然后才能成功完成相关性训练。
如果未打开词性丰富功能：将不会创建动态方面，无法使用词典建议，也不会生成 Content Miner“提取的方面”。
[更新：已在 2.1.1 版]Discovery 中修复了 Content Intelligence 和表格理解的丰富功能，这些功能可开箱即用地应用于名为 html。当用户上传的 JSON 文档中没有名为 html 的根级字段时，索引中将不会出现这些增益结果。要对此类 JSON 文档运行扩充项，用户必须重新配置扩充项以对 JSON 文档中的现有字段运行。
查看 Content Miner 部署页面时，有时不会显示完整的应用程序 URL 供复制。要解决此问题，请刷新页面。
[更新：已在 2.1.2 版本中修正]删除 IBM Watson® Discovery for IBM Cloud Pak® for Data 实例不会删除基础数据。请手动删除集合和文档。
[更新：已在 2.1.3 版本中修复]在改进工具面板上，丰富 Sentiment of phrases 已列出，但当前不可用。
在“内容挖掘”项目中，dates 字段可能无法正确解析以显示在构面中。
“动态构面”切换控件不应显示在“内容挖掘”项目中。
应该至少摄入 50 到 100 个文档，才可看到生成的有效动态构面。
如果单击停止来停止了搜寻器，但转换器进程缓慢或发生错误，那么您可能会看到搜寻器的状态为“正在运行”。
已上传和搜寻的文档中所有非 HTML 字段的总大小限制为 1 MB，相当于 1,048,576 个字节，而这些文档中所有 HTML 字段的总大小限制为 5 MB。如果超出任何一个限制，都会收到错误消息，说明The document has fields/HTML fields that exceed the 1 MB/5 MB limit.，并且不会摄入该文档。如需提高大小限制的帮助，请联系 IBM 支持中心。

另请参阅所有前发行版中确定的问题。

2.0.1，2019 年 8 月 30 日

使用 IBM Watson® Knowledge Studio 模型创建“机器学习”扩充项后，可能会在扩充字段页面上显示两个同名的扩充项。这不会影响扩充项，但最好仅选择其中一个扩充项，并将该扩充项应用于一个或多个字段。
如果网络抓取似乎在处理固定数量的文档时被卡住，且日志页面上显示的信息为 The ingestion job <jobid> is terminated incorrectly，请联系 IBM 支持部门，请求帮助重启抓取。
如果训练了一个或多个集合，那么其中一个集合中的训练数据可能会显示在未训练的集合的训练页面上。请刷新页面以清除这些训练数据。
如果以下类型的文档没有正确的文件扩展名（.docx、.pptx 和 .xlsx），那么不会处理这些文档。

另请参阅前发行版中确定的问题。

在后续发行版中修正的 2.0.1 问题

已[在 2.1.2 版本中修正]当你上传文件到已有文件的文件集时，活动页面上会显示 Documents uploaded! 消息，但在文件数量增加之前不会显示进一步的处理状态。

一般可用性 (GA) 发布，2019 年 6 月 28 日

如果在 Discovery for Cloud Pak for Data 工具中工作，并且 IBM Cloud Pak® for Data 会话到期，那么您将收到空白页面。要返回到工具，请刷新浏览器并重新登录。
摄入到 Discovery 中的所有 JSON 文件都应包含 .json 文件扩展名。
在对已训练集合的 collection_id 进行查询时，training_status.notices 值有时可能会显示为 0，而不是显示正确的值。
并非所有查询限制均在此发行版中强制实施。有关禁止的字段的完整列表，请参阅查询限制。
在 JSON 源文档中，不应复制以下系统生成的字段：document_id、parent_document_id、filename 和 title。这将导致重复字段嵌套在数组中，并中断某些功能，例如排名器训练。
请勿在 JSON 文档中包含根级 metadata 属性。如果上传的 JSON 文档已包含根级 metadata 属性，那么索引文档的 metadata 属性将被转换为索引中的数组。
不要对 CSV 文件中的列名使用元数据。如果在所上传 CSV 文件的头中对列名使用了元数据，那么索引文档的 metadata 属性将转换为索引中的数组。
CSV 文件必须使用逗号 (,) 或分号 (;) 作为定界符；不支持其他定界符。如果 CSV 文件包含的值中含有逗号或分号，那么应该用双引号将这些值括起，以避免分隔这些值。如果存在标题行，那么这些行中的值的处理方式与其他所有行中的值相同。如果 CSV 文件的最后一行未后跟 CRLF（回车符），那么不会处理该行。
目前，并未强制实施非重复集合名称。不建议使用重复的集合名称，应避免使用