已知问题
已知问题在确定它们的发行版中列出。
IBM Cloud Pak for Data IBM Software Hub
本主题中描述的已知问题仅适用于已安装的部署。
5.1.x 发布
5.0.x 发行版
4.8.x 发行版
4.7.x 发行版
4.6.x 发行版
4.5.x 发行版
4.0.x 发行版
有关已知问题的更多信息,请参阅 IBM Cloud Pak for Data 文档。
4.0.9,2022 年 5 月 25 日
-
Discovery 为 IBM Cloud Pak for Data Red Hat OpenShift API for Data Protection (OADP) 备份和复原实用程序生成部分失败状态消息。
- 错误: 使用 OADP 备份实用程序来备份安装了 Discovery 的集群后,检查其状态时,将显示
Phase: PartiallyFailed
消息。 一个或多个 Discovery 组件包含在Failed
列表中。 - 原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。 当 Discovery 服务存在,并且管理员备份整个 IBM Cloud Pak for Data 实例时,将显示指示部分失败的状态消息。 显示此状态是因为未备份 Discovery 的持久卷声明 (PVC)。 但是,此消息不会影响其余服务的备份。
- 解决方案: 不需要执行任何操作来解析状态消息。 您可以单独除去与 Discovery 服务关联的持久卷声明。 在使用脚本来备份发现服务数据之后,可以遵循发现服务的卸载指示信息中记录的步骤来删除 PVC。 有关如何除去与 Discovery 关联的 PVC 的更多信息,请参阅 卸载 Discovery 服务。
- 错误: 使用 OADP 备份实用程序来备份安装了 Discovery 的集群后,检查其状态时,将显示
4.0.8,2022 年 4 月 27 日
-
如果系统管理员以外的任何人执行升级,那么 wd-discovery-multi-tenant-migration 作业将失败。
-
错误: 使用除 admin 以外的用户标识进行升级时,迁移作业失败。
-
原因: 迁移脚本假定脚本由具有 admin 用户标识的用户运行。
-
解决方案: 应用允许迁移成功的补丁。 完成以下步骤:
-
从 Cloud Pak for Data Web 客户机中,获取要升级的实例的所有者的用户标识。
-
从 Watson Developer Cloud GitHub 存储库下载
wd-migration-uid-patch.zip
补丁文件。 -
从归档文件中抽取 wd-migration-uid-patch.yaml 文件,然后在文本编辑器中打开该文件。
-
将
<user_id>
变量替换为要升级的实例的所有者的用户标识。 -
在登录到集群的终端中运行以下命令:
oc create -f wd-migration-uid-patch.yaml
-
使用以下命令删除之前的迁移作业:
oc delete job wd-discovery-multi-tenant-migration
-
删除作业后,迁移作业将重新启动并恢复迁移。
此问题已随 4.0.9 发行版一起解决。
-
-
Discovery 为 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序生成部分故障状态消息。
- 错误: 使用 OADP 备份实用程序来备份安装了 Discovery 的集群后,检查其状态时,将显示
Phase: PartiallyFailed
消息。 一个或多个 Discovery 组件包含在Failed
列表中。 - 原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。 当 Discovery 服务存在,并且管理员备份整个 IBM Cloud Pak for Data 实例时,将显示指示部分失败的状态消息。 显示此状态是因为未备份 Discovery 的持久卷声明 (PVC)。 但是,此消息不会影响其余服务的备份。
- 解决方案: 不需要执行任何操作来解析状态消息。 您可以单独除去与 Discovery 服务关联的持久卷声明。 在使用脚本来备份发现服务数据之后,可以遵循发现服务的卸载指示信息中记录的步骤来删除 PVC。 有关如何除去与 Discovery 关联的 PVC 的更多信息,请参阅 卸载 Discovery 服务。
- 错误: 使用 OADP 备份实用程序来备份安装了 Discovery 的集群后,检查其状态时,将显示
4.0.7,2022 年 3 月 30 日
-
Discovery 在 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序中生成错误。
-
错误: 实用程序未成功完成,并将以下消息写入日志:
preBackupViaConfigHookRule on backupconfig/watson-discovery in namespace cpd (status=error)
-
原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。 当 Discovery 服务存在,并且管理员尝试备份整个 IBM Cloud Pak for Data 实例时,Discovery 会阻止该实用程序成功完成。
-
解决方案: 应用用于阻止 Discovery 阻止实用程序成功完成的补丁。
-
从 Watson Developer Cloud Github 存储库下载
wd-aux-br-patch.zip
文件。 -
从 ZIP 文件中抽取
wd-aux-br-patch.yaml
文件。 -
在登录到集群的终端中运行以下命令:
oc create -f wd-aux-br-patch.yaml
-
此问题已随 4.0.8 发行版一起解决。 (您仍无法使用 OADP 实用程序来备份发现服务,但 OADP 实用程序可以在安装发现时备份其他服务。)
-
-
完成 4.0.7 升级后,资源的
Deployed
状态会波动。-
错误: 通过提交
oc get WatsonDiscovery
命令来检查状态时,资源的就绪状态会在显示23/23
和20/23
组件可供使用之间切换。 -
原因: 迁移后未一致报告资源的就绪状态。
-
解决方案: 通常,尽管就绪状态不稳定,但实例已准备就绪可供使用。 要手动刷新状态信息,请在登录到集群的终端中运行以下命令:
oc proxy & curl -ksS -X PATCH -H "Accept: application/json, */*" -H "Content-Type: application/merge-patch+json" http://127.0.0.1:8001/apis/discovery.watson.ibm.com/v1/namespaces/<namespace>/watsondiscoveries/wd/status --data '{"status": null}'
此问题已随 4.0.8 发行版一起解决。
-
-
如果系统管理员以外的任何人执行升级,那么 wd-discovery-multi-tenant-migration 作业将失败。
-
错误: 使用除 admin 以外的用户标识进行升级时,迁移作业失败。
-
原因: 迁移脚本假定脚本由具有 admin 用户标识的用户运行。
-
解决方案: 应用允许迁移成功的补丁。 完成以下步骤:
-
从 Cloud Pak for Data Web 客户机中,获取要升级的实例的所有者的用户标识。
-
从 Watson Developer Cloud GitHub 存储库下载
wd-migration-uid-patch.zip
补丁文件。 -
从归档文件中抽取 wd-migration-uid-patch.yaml 文件,然后在文本编辑器中打开该文件。
-
将
<user_id>
变量替换为要升级的实例的所有者的用户标识。 -
在登录到集群的终端中运行以下命令:
oc create -f wd-migration-uid-patch.yaml
-
使用以下命令删除之前的迁移作业:
oc delete job wd-discovery-multi-tenant-migration
-
删除作业后,迁移作业将重新启动并恢复迁移。
此问题已随 4.0.9 发行版一起解决。
-
4.0.6,1 2022 年 3 月
-
如果在开始升级过程之前没有在现有集群中供应 Discovery 实例,那么升级到 4.0.6 将失败。
- 错误: 4.0.6 升级过程假定在现有集群中供应了 Discovery 实例。 例如,如果要从 4.0.5 升级到 4.0.6,那么必须先在 4.0.5 集群中供应实例,然后才能开始迁移。
- 原因: 当前代码在不存在实例时返回错误,因为它找不到要迁移的文档索引。
- 解决方案: 在开始升级到 4.0.6之前,请验证 Discovery 的实例是否已在现有 IBM Cloud Pak for Data 集群中供应。 如果尝试升级到 4.0.6,但未供应任何实例,并且迁移失败,请除去现有安装并从头开始安装 4.0.6。
-
完成 4.0.6 升级后,资源的
Deployed
状态会波动。-
错误: 通过提交
oc get WatsonDiscovery
命令来检查状态时,资源的就绪状态会在显示23/23
和20/23
组件可供使用之间切换。 -
原因: 迁移后未一致报告资源的就绪状态。
-
解决方案: 通常,尽管就绪状态不稳定,但实例已准备就绪可供使用。 就绪状态将在大约 5 小时后进行设置。 您可以等待就绪状态一致显示
23/23
,也可以通过在登录到集群的终端中运行以下命令来手动刷新状态信息:oc proxy & curl -ksS -X PATCH -H "Accept: application/json, */*" -H "Content-Type: application/merge-patch+json" http://127.0.0.1:8001/apis/discovery.watson.ibm.com/v1/namespaces/<namespace>/watsondiscoveries/wd/status --data '{"status": null}'
此问题已随 4.0.8 发行版一起解决。
-
-
Discovery 在 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序中生成错误。
-
错误: 实用程序未成功完成,并将以下消息写入日志:
preBackupViaConfigHookRule on backupconfig/watson-discovery in namespace cpd (status=error)
-
原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。 当 Discovery 服务存在,并且管理员尝试备份整个 IBM Cloud Pak for Data 实例时,Discovery 会阻止该实用程序成功完成。
-
解决方案: 应用用于阻止 Discovery 阻止实用程序成功完成的补丁。
-
从 Watson Developer Cloud Github 存储库下载
wd-aux-br-patch.zip
文件。 -
从 ZIP 文件中抽取
wd-aux-br-patch.yaml
文件。 -
在登录到集群的终端中运行以下命令:
oc create -f wd-aux-br-patch.yaml
-
此问题已随 4.0.8 发行版一起解决。 (您仍无法使用 OADP 实用程序来备份发现服务,但 OADP 实用程序可以在安装发现时备份其他服务。)
-
-
如果系统管理员以外的任何人执行升级,那么 wd-discovery-multi-tenant-migration 作业将失败。
-
错误: 使用除 admin 以外的用户标识进行升级时,迁移作业失败。
-
原因: 迁移脚本假定脚本由具有 admin 用户标识的用户运行。
-
解决方案: 应用允许迁移成功的补丁。 完成以下步骤:
-
从 Cloud Pak for Data Web 客户机中,获取要升级的实例的所有者的用户标识。
-
从 Watson Developer Cloud GitHub 存储库下载
wd-migration-uid-patch.zip
补丁文件。 -
从归档文件中抽取 wd-migration-uid-patch.yaml 文件,然后在文本编辑器中打开该文件。
-
将
<user_id>
变量替换为要升级的实例的所有者的用户标识。 -
在登录到集群的终端中运行以下命令:
oc create -f wd-migration-uid-patch.yaml
-
使用以下命令删除之前的迁移作业:
oc delete job wd-discovery-multi-tenant-migration
-
删除作业后,迁移作业将重新启动并恢复迁移。
此问题已随 4.0.9 发行版一起解决。
-
4.0.5,2022 年 1 月 26 日
-
Discovery 在 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序中生成错误。
-
错误: 实用程序未成功完成,并将以下消息写入日志:
preBackupViaConfigHookRule on backupconfig/watson-discovery in namespace cpd (status=error)
-
原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。 当 Discovery 服务存在,并且管理员尝试备份整个 IBM Cloud Pak for Data 实例时,Discovery 会阻止该实用程序成功完成。
-
解决方案: 应用用于阻止 Discovery 阻止实用程序成功完成的补丁。
-
从 Watson Developer Cloud Github 存储库下载
wd-aux-br-patch.zip
文件。 -
从 ZIP 文件中抽取
wd-aux-br-patch.yaml
文件。 -
在登录到集群的终端中运行以下命令:
oc create -f wd-aux-br-patch.yaml
-
此问题已随 4.0.8 发行版一起解决。 (您仍无法使用 OADP 实用程序来备份发现服务,但 OADP 实用程序可以在安装发现时备份其他服务。)
-
4.0.4,2021 年 12 月 20 日
-
Discovery 在 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序中生成错误。
-
错误: 实用程序未成功完成,并将以下消息写入日志:
preBackupViaConfigHookRule on backupconfig/watson-discovery in namespace cpd (status=error)
-
原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。 当 Discovery 服务存在,并且管理员尝试备份整个 IBM Cloud Pak for Data 实例时,Discovery 会阻止该实用程序成功完成。
-
解决方案: 应用用于阻止 Discovery 阻止实用程序成功完成的补丁。
-
从 Watson Developer Cloud Github 存储库下载
wd-aux-br-patch.zip
文件。 -
从 ZIP 文件中抽取
wd-aux-br-patch.yaml
文件。 -
在登录到集群的终端中运行以下命令:
oc create -f wd-aux-br-patch.yaml
-
此问题已随 4.0.8 发行版一起解决。 (您仍无法使用 OADP 实用程序来备份发现服务,但 OADP 实用程序可以在安装发现时备份其他服务。)
-
4.0.3,2021 年 11 月 18 日
-
此发行版中未提供引导式教程。
-
Discovery 在 IBM Cloud Pak for Data OpenShift® API for Data Protection (OADP) 备份和复原实用程序中生成错误。
-
错误: 实用程序未成功完成,并将以下消息写入日志:
preBackupViaConfigHookRule on backupconfig/watson-discovery in namespace cpd (status=error)
-
原因: 无法使用 OADP 备份和复原实用程序来备份和复原 Discovery。 当 Discovery 服务存在,并且管理员尝试备份整个 IBM Cloud Pak for Data 实例时,Discovery 会阻止该实用程序成功完成。
-
解决方案: 应用用于阻止 Discovery 阻止实用程序成功完成的补丁。
-
从 Watson Developer Cloud Github 存储库下载
wd-aux-br-patch.zip
文件。 -
从 ZIP 文件中抽取
wd-aux-br-patch.yaml
文件。 -
在登录到集群的终端中运行以下命令:
oc create -f wd-aux-br-patch.yaml
-
此问题已随 4.0.8 发行版一起解决。 (您仍无法使用 OADP 实用程序来备份发现服务,但 OADP 实用程序可以在安装发现时备份其他服务。)
-
4.0.0,2021 年 7 月 13 日
-
使用 Analyze API 应用的机器学习模型扩充项可能会失败。
- 错误:
[WKSML_MODEL_NAME]: Enrichment of a document failed
- 原因: Watson Knowledge Studio 中存在已知问题,可能会导致扩充处理超时。
- 解决方案: 使用 Analyze API 将 Watson Knowledge Studio 模型扩充项应用于集合时,请将输入文档的大小保持在 50 KB 以下。
- 错误:
在后续发行版中修正的 2.2.1 问题
-
[版本4已修复]如果您向收藏中添加 IBM Watson® Knowledge Studio 机器学习增强功能,则提取过程可能会非常缓慢,但最终会完成。 如果摄入过程很慢,那么在警告和错误中可能会看到以下错误消息:
[WKSML_MODEL_NAME]: Document analysis timed out
有关其他超时详细信息,可查看 Knowledge Studio 机器学习日志,这可能类似于以下内容:
{ "message": "Analysis failed due to: org.apache.uima.analysis_engine.AnalysisEngineProcessException at c.i.n.b.SIREAnnotator.process(_:454) ... ", "level": "SEVERE", }
对于在处理期间超时的文档,会对其建立索引,但不会有 Knowledge Studio 扩充项结果。
2.2.1,2021年2月26日
-
部署计时问题:
- 错误: 安装补丁 7 后,当您尝试供应服务实例时,将显示
404 Not Found
错误。 可能会针对nginx
pod 记录以下消息:open() "/usr/local/openresty/nginx/html/watson/common/discovery/auth" failed (2: No such file or directory)
- 解决方案: 重新启动
zen-watcher
pod。
- 错误: 安装补丁 7 后,当您尝试供应服务实例时,将显示
-
如果执行从外部容器注册表拉取容器映像的气郄式安装,那么可能会迂到以下问题:
-
错误: 某些 Discovery pod 可能会报告
ImagePullBackoff
错误。 -
原因: 正在使用错误的映像拉取私钥。
-
解决方案: 在安装期间完成以下步骤:
-
开始安装 Watson Discovery。
-
在 watson-discovery-operator 模块完成后,通过运行以下命令来检查是否创建了 WatsonDiscovery 定制资源:
oc get WatsonDiscovery wd
-
创建定制资源后,运行以下命令以指向正确的映像拉取私钥以从外部注册表拉取映像:
pull_secret=$(oc get secrets | grep 'docker-pull-.*-watson-discovery-registry-registry' | cut -d ' ' -f 1) cat << EOS > discovery-patch.yaml spec: shared: imagePullSecret: $pull_secret EOS oc patch wd wd --type=merge --patch "$(cat discovery-patch.yaml)"
-
如果
RabbitMQ
容器仍处于 ImagePullBackoff 状态,请删除 RabbitMQ CR,以便让rabbitmq-operator能够重新创建 RabbitMQ 集群。 您可以使用以下命令:oc delete IbmRabbitmq wd-rabbitmq
-
-
-
在 IBM Watson® Discovery 中,
Content Mining
项目仅支持每个项目一个集合。 如果创建多个Content Mining
集合,可能会遇到错误。 如果遇到错误,请删除额外的Content Mining
集合,以使每个Content Mining
项目只有一个关联集合。 -
如果您正在准备由 Discovery for Cloud Pak for Data 集群来执行实例从 2.2.0 到 2.2.1 的就地升级,那么有时
cpd-cli adm
命令会失败,并显示以下错误消息:Error from server (UnsupportedMediaType): error when applying patch
。 如果收到此错误消息,请输入oc delete scc cpd-zensys-scc cpd-user-scc cpd-noperm-scc edb-operator-scc admin-discovery-scc
以删除相关资源,然后重新输入cpd-cli adm
命令。 -
如果正在将 Discovery for Cloud Pak for Data 实例从 2.2.0 升级到 2.2.1,有时
cpd-cli upgrade
命令会在滚动更新完成之前完成。 有关验证升级是否成功完成的信息,请参阅验证升级是否成功完成。 -
从 Discovery 2.2.0 升级到 2.2.1 后,模型火车图片未更新。 要解决此问题,请删除模型训练操作员创建的部署,并等待操作员重新创建这些部署。 输入以下命令以删除部署:
oc delete deploy -l 'app.kubernetes.io/managed-by=ibm-modeltrain'
运行此命令后,模型训练操作员将创建新的部署。
-
如果将 Discovery for Cloud Pak for Data 从 2.2.0 升级到 2.2.1,那么可能会收到以下错误消息:
[ERROR] [2021-03-04 05:12:44-0657] Exiting due to error (Storage class is immutable. Module ibm-watson-gateway-operator x86_64 from Assembly portworx-shared-gp3 was installed with ibm-watson-gateway-operator x86_64, but new install/upgrade command is requesting portworx-db-gp3-sc. If you installed the assembly with a different storage class, please upgrade it individually.). Please check /ibm/cpd-cli-workspace/logs/CPD-2021-03-04T05-12-04.log for details [ERROR] 2021-03-04T05:12:44.659615Z Execution error: exit status 1
生成此错误消息是因为用于安装的存储类与升级期间使用的存储类不同。 由于不同附加组件的存储类依赖关系操作程序记录为用于安装的存储类依赖关系操作程序,因此安装依赖关系操作程序的不同附加组件产生此差异。 要解决此问题,必须分别升级以下子组合件:
-
升级 Watson 网关操作程序:
./cpd-cli upgrade \ --repo ./repo.yaml \ --assembly ibm-watson-gateway-operator \ --arch Cluster_architecture \ --namespace <Project> \ --transfer-image-to <Registry_location> \ --cluster-pull-prefix <Registry_from_cluster> \ --ask-pull-registry-credentials \ --ask-push-registry-credentials
-
升级 Minio 操作程序:
./cpd-cli upgrade \ --repo ./repo.yaml \ --assembly ibm-minio-operator \ --namespace <Project> \ --transfer-image-to <Registry_location> \ --cluster-pull-prefix <Registry_from_cluster> \ --ask-pull-registry-credentials \ --ask-push-registry-credentials
-
升级 RabbitMQ 操作程序:
./cpd-cli upgrade \ --repo ./repo.yaml \ --assembly ibm-rabbitmq-operator \ --namespace <Project> \ --transfer-image-to <Registry_location> \ --cluster-pull-prefix <Registry_from_cluster> \ --ask-pull-registry-credentials \ --ask-push-registry-credentials
-
升级 etcd 操作程序:
./cpd-cli upgrade \ --repo ./repo.yaml \ --assembly ibm-etcd-operator \ --namespace <Project> \ --transfer-image-to <Registry_location> \ --cluster-pull-prefix <Registry_from_cluster> \ --ask-pull-registry-credentials \ --ask-push-registry-credentials
-
升级模型训练经典操作程序:
./cpd-cli upgrade \ --repo ./repo.yaml \ --assembly modeltrain-classic \ --arch Cluster_architecture \ --namespace <Project> \ --transfer-image-to <Registry_location> \ --cluster-pull-prefix <Registry_from_cluster> \ --ask-pull-registry-credentials \ --ask-push-registry-credentials
-
升级 Elasticsearch 操作程序:
./cpd-cli upgrade \ --repo ./repo.yaml \ --assembly ibm-cloudpakopen-elasticsearch-operator \ --namespace <Project> \ --transfer-image-to <Registry_location> \ --cluster-pull-prefix <Registry_from_cluster> \ --ask-pull-registry-credentials \ --ask-push-registry-credentials
其中,
<Project>
是安装您的 Discovery for Cloud Pak for Data 2.2.0 实例的命名空间,<Registry_location>
是您推送至注册表服务器的图像的位置,<Registry_from_cluster>
是集群中的 Pod 从中提取图像的位置。
-
-
在 IBM Cloud Pak for Data 3.5上安装时,可能会迂到以下问题:
- 错误: 如果尝试在运行 Planning Analytics 的集群上供应 Discovery 服务,那么某些 Discovery pod 不会启动且安装失败。 Pod 的日志显示诸如
java.lang.NumberFormatException: For input string
的消息。 - 原因: 随 Planning Analytics一起安装的 couchdb 服务将名为
COUCHDB_PORT
的环境变量添加到 Kubernetes 集群。Discovery 不使用 couchdb,因此未指定此环境变量的值。 但是,某些 pod 尝试解析变量,这会导致错误。 - 解决方案: 安装补丁 cpd-watson-discovery-2.2.1-patch-1,这将解决此问题。
- 错误: 如果尝试在运行 Planning Analytics 的集群上供应 Discovery 服务,那么某些 Discovery pod 不会启动且安装失败。 Pod 的日志显示诸如
另请参阅所有前发行版中的问题。
2.2,8 2020 年 12 月
-
在上传较小的 CSV 文件(通常为 99 行或更少的 CSV 文件)时,可能未正确摄入头和/或第一行。 如果发生这种情况,请在工具中导航至“CSV 设置”选项卡并更新设置。 重新处理后,导航至管理字段选项卡,并根据需要更新字段类型。
-
如果您使用 IBM Cloud Pak for Data 自定义连接器 构建的自定义爬虫程序来设置您的收藏,然后删除自定义爬虫程序部署,则“处理设置”页面将不会显示爬虫程序配置。 这是因为底层搜寻器不可用。 要解决此问题,请在集合使用了定制搜寻器时确认已部署定制搜寻器。
-
将 IBM Cloud Pak for Data 定制连接器 与 Discovery 用于 IBM Cloud Pak for Data 2.2时,用于部署和除去定制搜寻器的部署的脚本
scripts/manage_custom_crawler.sh
失败。 要解决此问题,请将podname="gateway"
中的第 37 行podname="wd-discovery-gateway"
替换为scripts/manage_custom_crawler.sh
,然后重新运行部署命令。 -
在工具中创建定制扩充项时,必须选择要应用扩充项的字段,然后单击应用。 如果未选择任何字段,那么将禁用应用并重新处理按钮(该按钮用于更改扩充项),直到新的扩充项具有字段为止。
-
如果将 合同 扩充项或 了解表 扩充项应用于集合,那么当该集合正在摄入文档时,可能会收到以下错误消息:
The number of nested documents has exceeded the allowed limit of [X].
请联系IBM 支持中心 以调整限制。 -
使用定制字典扩充文本时,
entities.type
的输出应该是“字典”扩充项的完整构面路径。 但是,在此发行版中,将不显示完整的构面路径。 要解决此问题,请重新处理集合。 例如,如果构面路径为sample1.sample2
,那么在重新处理之前,它将类似于以下内容:{ "result" : { "enriched_text" : [ { "entities" : [ { "text" : "capital", "type" : "sample2", ... "model_name" : "Dictionary:.sample1.sample2"} ...
在重新处理之后,它将类似于以下内容:
{ "result" : { "enriched_text" : [ { "entities" : [ { "text" : "capital", "type" : "sample1.sample2", ... "model_name" : "Dictionary:.sample1.sample2"} ...
-
在转换器设置为
auto_detection=true
的情况下上传 CSV 文件时,工具中的 CSV 设置选项卡将显示不正确的设置。 如果更新 CSV 设置选项卡上的设置,那么auto_detection
设置将不再为true
。 -
在使用“智能文档理解”(SDU) 定制模型转换的 Office 文档(.doc、.docx、.odf、.xls、.xlsx、.ods、.ppt、.pptx、.odp)中,
publicationdate
可能不会显示在 JSON 响应的extracted_metadata
字段中。 它将显示在 JSON 响应的html
字段中。publicationdate
字段中的html
将是文档的摄入日期,而不是文档的原始发布日期。 -
“分析”API 使用内存内部高速缓存来保存与用于运行文档的集合相关联的扩充模型。 如果集合包含许多大型扩充项,或者同时使用多个这样的集合,那么高速缓存可能会耗尽内存资源。 发生这种情况时,“分析”API 会返回空结果(请参阅示例),而无状态 API REST 代理将在其日志中显示以下消息:
RESOURCE_EXHAUSTED: stateless.Analysis/analyze: RESOURCE_EXHAUSTED
。{ "result": null, "notices": null }
要解决此问题,请执行以下操作:
-
查看集合中使用的扩充项,并除去应用程序不需要的扩充项。 特别是,删除词性增强功能。
-
减少与“分析”API 同时使用的集合数。
-
增大高速缓存内存:
- 将
container model-runtime
中deployment core-discovery-stateless-api-model-runtime
的内存限制增大到10
GB 或更多 - 编辑
CAPACITY_MB
中的环境变量deployment core-discovery-stateless-api-model-runtime
,将其设置为 10240
或更多
- 将
-
-
如果重新启动模型运行时容器,但未重新启动模型网格运行时容器,那么 Analyze API 可能会迂到问题。
-
错误:Analzye API 调用在特定集合上返回 500 错误,并且日志包含以下条目:
"message": "error occurred in analyzer java.lang.NullPointerException at c.i.e.a.a.s.r.ModelManager$2.analyze(ModelManager.java:112)
-
原因: 模型运行时容器与模型网格运行时容器不同步。
-
解决方案: 删除
wd-stateless-api-model-runtime
pod 以重新启动模型网格和模型运行时容器。
-
另请参阅所有前发行版中确定的问题。
2.1.4 2020年9月2日:
- 使用 FORM 认证配置 Web 搜寻时,如果指定的 URL 不带尾部斜杠(例如:
https://webcrawlurl.com
),那么 Web 搜寻将仅搜寻登录页面。 为了解决这个问题,请在 URL 后面添加一个斜线,例如:https://webcrawlurl.com/
。 - 指导教程不会在 Firefox 上运行。 有关其他支持的浏览器列表,请参阅浏览器支持。
- 如果模型中的多个提取器在内部为一个或多个输出视图使用相同的名称,则使用 Watson Knowledge Studio 中内置的自定义 高级规则模型 将文档纳入集合可能会失败。
- 如果删除大量文档,然后再立即摄入大量文档,那么可能需要更长的时间,所有文档才能变得可用。
- 启用 FIPS (联邦信息处理标准) 时,分类器 扩充项不起作用。
另请参阅所有前发行版中确定的问题。
在后续发行版中修正的 2.1.4 问题
- [在 V 2.2] 在已部署的“内容挖掘”应用程序中,如果在搜索查询中包含波浪号 (~) 以启用模糊匹配或包含星号 (*) 以表示通配符,那么搜索定制将正常工作,但匹配字符串不会在查询结果中突出显示。
- [版本 2.2 中已修复]更改工具栏中 “管理字段”选项卡上的 “包含在索引中”字段时,可能会发生转换错误。 如果发生此错误,那么将不会为文档建立索引。 要解决此问题,请执行以下操作:
-
oc edit sts core-discovery-converter
-
按如下所示编辑
containers
和- name: INGESTION_POD_NAME
之间的内容:containers: - command: - bash - -c - | FILE=/opt/ibm/wex/zing/bin/converter.sh && sed -i "/choreo_2.11-9.1.1.jar/d" $FILE && sed -i "/disco-doc-conversion-commons_2.11-1.0.4.jar/d" $FILE && sed -i "/jackson-module-scala_2.11-2.10.4.jar/d" $FILE && sed -i "/macro-compat_2.11-1.1.1.jar/d" $FILE && sed -i "/pureconfig-core_2.11-0.12.2.jar/d" $FILE && sed -i "/pureconfig-generic-base_2.11-0.12.2.jar/d" $FILE && sed -i "/pureconfig-generic_2.11-0.12.2.jar/d" $FILE && sed -i "/pureconfig-macros_2.11-0.12.2.jar/d" $FILE && sed -i "/pureconfig_2.11-0.12.2.jar/d" $FILE && sed -i "/scala-guice_2.11-4.1.1.jar/d" $FILE && sed -i "/scala-logging_2.11-3.7.2.jar/d" $FILE && sed -i "/scalactic_2.11-3.0.5.jar/d" $FILE && sed -i "/scalaj-http_2.11-2.3.0.jar/d" $FILE && sed -i "/service-commons_2.11-22.1.0.jar/d" $FILE && sed -i "/shapeless_2.11-2.3.3.jar/d" $FILE && /opt/ibm/wex/zing/bin/entrypoint.sh /opt/ibm/wex/zing/bin/controller.sh env: - name: INGESTION_POD_NAME
添加了从
- command:
到/opt/ibm/wex/zing/bin/entrypoint.sh
/opt/ibm/wex/zing/bin/controller.sh
的行,删除了之前的-
env:
-
保存更改。 它将重启
converter
。
-
2.1.3 2020年6月19日:
-
IBM Watson® Knowledge Studio 2.1.3 或更高版本中不支持 Discovery for Cloud Pak for Data 机器学习模型中的
Entity Subtypes
。 如需了解现有车型改装说明,请联系 支持中心。 -
无法将文件名中包含空格的 CSV 文件(例如:
file 1.csv
)上传到内容挖掘项目中。 请重命名该文件来解决此问题。 -
执行项目级别相关性训练时,如果您有多个集合,并且其中两个或更多集合包含重复的
document_id
,那么项目级别相关性训练会失败。 重复的document_ids
示例:Collection A
包含标识为1234
的文档,Collection B
也包含标识为1234
的文档。 -
创建构面后,仅正确保存了使用前缀为
extracted_metadata
的字段的第一个构面。 具有该前缀的其他构面会显示,但在屏幕刷新之后将消失。 这种情况针对每个项目只会发生一次,因此变通方法是刷新并重新添加构面。 -
IBM Cloud Pak for Data 在 安装过程中,某些 作业可能会错误地将状态报告为,从而导致安装超时。IBM Cloud Pak® for Data 2.5.0.0 Kubernetes
OOMKilled
要解决此问题,在作业返回OOMKilled
后,请验证与该作业关联的 pod 的日志。 日志中应该没有明显的错误消息,并且资源在日志中报告为已创建。 请手动验证这些资源在名称空间中是否存在,然后删除该作业。 这将导致安装继续。 -
应用扩充项时,某些文档可能会显示两个
html
字段。 显示的两个html
字段相同,并且操作方式相同。 -
在 Firefox 中创建数据源时,您可能看不到整个选项列表,包括更多处理设置设置。 要解决此问题,请缩小,增大浏览器高度,或使用其他支持的浏览器。
-
定制搜索结果的显示时,在单击
Apply
按钮后,有时不会保存所做的更改。 要解决此问题,请刷新浏览器,然后重试进行更改。 -
为集合设置数据源或 Web 搜寻器时,如果输入的配置不正确,然后在处理设置页面上尝试更新该配置,那么在单击
Apply changes and reprocess
按钮时,数据源更新或搜寻可能不会启动。 您可以通过打开集合的活动页面来了解处理是否已启动,从而确认此问题。 如果您看到针对数据源的处理尚未启动,请单击Recrawl
按钮,然后单击Apply changes and reprocess
按钮。 如果您看到针对 Web 搜寻的处理尚未启动,请单击Stop
按钮,然后单击Recrawl
按钮。 -
IBM Cloud Pak for Data 当使用 在 部署上运行 测试时,将返回 状态。
helm test core
core
Helmcore-discovery-api-post-install-test
FAILED
这是由于test
pod的图像中存在一个错误。 可以忽略该测试结果,因为失败与部署中的任何内容都无关。 -
缺省情况下,在使用工具创建任何
off
项目类型时,“光学字符识别 (OCR)”均设置为。 但是,如果使用 API 创建项目,那么 OCR 会设置为on
。 要解决此问题,请打开工具并将项目设置更改为off
。 -
针对集合将“光学字符识别 (OCR)”设置为
on
且未应用经过训练的智能文档理解 (SDU) 模型时,不会处理 PNG、TIFF 和 JPG 文件以进行文本识别。 也不会处理 PDF、Word、PowerPoint 和 Excel 文档中嵌入的图像 - 仅会处理这些文档中的非图像部分以进行文本识别。 要解决此问题,请导入或训练 SDU 模型,并重新处理集合。 这将允许从图像中抽取文本。 -
您在 Watson Assistant 中创建搜索技能并被定向到 Watson Discovery 工具后,屏幕是空白的。 由于 URL 缺少 Discovery 实例标识,才会发生这种情况。 要解决此问题,请执行以下操作:
- 从 IBM Cloud Pak for Data Web 客户机菜单中,选择我的实例。 例如:
https://mycluster.com/zen/#/myInstances
。 - 选择您正在使用的 Discovery 实例,然后点击启动工具。
- 工具装入后,URL 应该具有以下结构:
https://mycluster.com/discovery/core/instances/00000000-0000-0000-0001-597165341876/projects
- 复制除
/projects
之外的整个路径。 例如:https://mycluster.com/discovery/core/instances/00000000-0000-0000-0001-597165341876
- 返回显示空白 Discovery 页面的浏览器标签页。 URL 的结构如下:
https://mycluster.com/discovery/core/collections/new?redirect_uri=...
- 将
https://mycluster.com/discovery/core
替换为您之前复制的 URL,新的 URL 应如下所示:https://mycluster.com/discovery/core/instances/00000000-0000-0000-0001-597165341876/collections/new?redirect_uri=...
- 按 Enter 键以打开更新的 URL。 您现在应该位于 Watson Discovery 管理集合页面上。
- 从 IBM Cloud Pak for Data Web 客户机菜单中,选择我的实例。 例如:
另请参阅所有前发行版中确定的问题。
2.1.2,2020年3月31日
-
使用包含韩语、波兰语、日语、斯洛伐克语或中文的段落检索时,此版本中的响应时间可能会较缓慢。 要解决此问题,请禁用段落检索或上传定制的非索引字列表,其中包含文档中常用的词(例如,介词和代词)。 有关多个语言的非索引字列表的示例,请参阅定义非索引字。 另请参阅 GitHub上的 Stopwords ISO。
-
[更新:版本 2.1.3 中已修复]。在版本 2.1.2、2.1.1 和 2.1.0 中,PNG、TIFF 和 JPG 单个图像文件不会被扫描,也不会从这些文件中提取文本。 此外,还不扫描 PDF、Word、PowerPoint 和 Excel 文件中嵌入的 PNG、TIFF 和 JPEG 图像,也不会从这些图像文件中抽取任何文本。
-
启用 FIPS(联邦信息处理标准)时,智能文档理解不支持
.doc
、.docx
、.odf
、.xls
、.xlsx
、.ods
、.ppt
、.pptx
和.odp
转换。 -
在内容挖掘应用程序中,如果为该集合重新构建索引,那么任何文档标志设置都将消失。
-
从 2.1.2 发行版开始,使用 V1 API 上传和管理相关性训练数据,将不会训练相关性训练模型。 v1 应用程序接口已被 项目相关性培训 v2 应用程序接口取代。 如果需要保留训练数据,可以使用 V1 API 列出这些数据,然后使用 V2 API 将其添加到项目。
-
多个 正则表达式 不能同时应用于集合。
-
IBM Cloud Pak for Data 下载 时附带的安装说明README有两处小改动。IBM Watson® Discovery for IBM Cloud Pak® for Data 如需了解自述文件的更新版本,请参阅 Discovery Helm 图表 README.md。
- 对
--cluster-pull-prefix PREFIX
自变量的描述进行了更改。 - 语言扩展包名称已从
ibm-watson-discovery-pack1-2.1.2.tar.xz.
更新为ibm-wat-dis-pack1-prod-2.1.2.tar.xz
。
- 对
另请参阅所有前发行版中确定的问题。
2.1.1,2020年1月24日
- 创建 词典 时,建议的词典词条默认情况下会标准化为小写(例如,Watson Assistant 会被标准化为 watson assistant)。 为了确保大写术语的匹配,应将其明确纳入
Other terms
列表或Base term
。 - 备份和复原数据时,训练数据未成功复原。 如果通过使用连接器的搜寻或 Web 搜寻添加了集合中的文档,那么可以从现有项目中单独检索训练数据进行备份,并将其上传到新复原的项目中。 更多信息,请参阅API参考中的 “列出培训查询”和 “创建培训查询”)。
- 搜寻 SharePoint Online 或 SharePoint OnPrem 文档时,JSON 文档可能未正确建立索引,并且返回的
title
可能为errored
。 这是因为 SharePoint Web Service 使用ows_FileRef
属性来检索 JSON 文件,这将返回错误页面。 要解决此问题,请联系 SharePoint 管理员和 Microsoft 支持人员。 - 如果将 V2.0.1 中创建的集合迁移到 V2.1.0 或 V2.1.1,那么不会为该集合分配项目类型,并且该集合不可供查询。 要分配项目类型,请通过选择我的项目来打开项目页面。 命名项目,然后选择以下“项目类型”之一:
Document Retrieval
、Conversational Search
、Content Mining
或Custom
。
另请参阅所有前发行版中确定的问题。
在后续发行版中修正的 2.1.1 问题
-
[版本 2.1.2 中已修复]。在 OpenShift, 上安装 Discovery for Cloud Pak for Data 时,由于
classpath
中存在不兼容的jar文件,ranker-rest
服务可能会间歇性启动失败。 要修复此问题:-
使用以下命令打开
ranker-rest
编辑器:kubectl edit deployment {release-name}-{watson-discovery}-ranker-rest
-
在编辑器中,搜索
ranker-rest image
(例如:{docker-registry}/{namespace}/discovery-ranker-rest-service:20200113-150050-2-d1527c2
) -
在
{docker-registry}/{namespace}/discovery-ranker-rest-service:20200113-150050-2-d1527c2
下面添加以下命令:command: ["/tini"] args: ["-s", "-v", "--", "java", "-Dkaryon.ssl=true", "-Dkaryon.port=9081", "-Dkaryon.ssl.port=9090", "-Dkaryon.ssl.certificate=/opt/bluegoat/karyon/ssl/karyon-cert.pem", "-Dkaryon.ssl.privatekey=/opt/bluegoat/karyon/ssl/karyon-private-key.pem", "-Djavax.net.ssl.trustStore=/opt/bluegoat/karyon/ssl/keystore.jks", "-Djavax.net.ssl.keyStore=/opt/bluegoat/karyon/ssl/keystore.jks", "-Dlog4j.debug=false", "-Dlitelinks.threadcontexts=log4j_mdc", "-Dwatson.ssl.truststore.path=/opt/bluegoat/karyon/ssl/litelinks-truststore.jks", "-Dwatson.ssl.truststore.password=watson15qa", "-Dlitelinks.delay_client_close=false", "-Drxnetty.http.maxcontentlength=314572800", "-cp", "lib/logback-classic-1.2.3.jar:*:lib/*", "com.ibm.watson.raas.rest.Runner"]
-
2.1.0,2019年11月27日
- 将扩充项应用于集合时,扩充项语言必须与集合语言相匹配,否则应用会失败。 工具会显示所有集合,而不考虑语言。
- 在“管理字段”选项卡上,可以编辑系统生成的字段。 不应通过更改字段类型或关闭索引来编辑以下字段:
document_id
、extracted_metadata
和metadata
。 - 删除集合并选择
Don't delete underlying data
选项时,任何未完成的文档摄入搜寻都会继续在后台运行,直到现有搜寻完成为止,这将影响新的搜寻开始时间。 - IBM Cloud Pak for Data Discovery 由于组件进入锁定状态,可能无法正确启动。 可能需要手动数据库干预来清除锁定。 有关确定和解决此问题的更多信息,请参阅清除锁定状态。
- 如果使用“上传数据”功能上传了文档,然后删除该文档,接着尝试上传相同文档或具有相同文档标识的其他文档,那么上传会失败,并且会显示消息:
Error during creating a document
。 - 处理时生成
html
字段的文档不能与相关性训练配合使用。为使用 Smart Document Understanding 或 Content Intelligence处理的文档生成 HTML。 必须先除去html
字段,然后才能成功完成相关性训练。 - 如果词性扩展功能未开启:动态面不会创建,词典建议无法使用,Content Miner“提取的面”不会生成。
- [更新:版本 2.1.1] Discovery 针对 Content Intelligence 和表格的理解功能已配置,可立即应用于名为
html
的字段。 当用户上传的JSON文档中没有名为html
的根级字段时,这些丰富信息将不会在索引中产生结果。 要对此类 JSON 文档运行扩充项,用户必须重新配置扩充项以对 JSON 文档中的现有字段运行。 - 查看 Content Miner 部署页面时,有时不会显示完整的应用程序 URL 供复制。 要解决此问题,请刷新页面。
- [更新:版本 2.1.2 中已修复]。取消 IBM Watson® Discovery for IBM Cloud Pak® for Data 实例的配置不会删除基础数据。 请手动删除集合和文档。
- [更新:版本 2.1.3 中已修复]。在“改进工具”面板中,丰富了
Sentiment of phrases
,但目前不可用。 - 在“内容挖掘”项目中,
dates
字段可能无法正确解析以显示在构面中。 - “动态构面”切换控件不应显示在“内容挖掘”项目中。
- 应该至少摄入 50 到 100 个文档,才可看到生成的有效动态构面。
- 如果单击停止来停止了搜寻器,但转换器进程缓慢或发生错误,那么您可能会看到搜寻器的状态为“正在运行”。
- 已上传和搜寻的文档中所有非 HTML 字段的总大小限制为 1 MB,相当于 1,048,576 个字节,而这些文档中所有 HTML 字段的总大小限制为 5 MB。 如果超出任何一个限制,都会收到错误消息,说明
The document has fields/HTML fields that exceed the 1 MB/5 MB limit.
,并且不会摄入该文档。 如需帮助提高尺寸限制,请联系 IBM 支持中心。
另请参阅所有前发行版中确定的问题。
2.0.1,2019 年 8 月 30 日
- 使用 IBM Watson® Knowledge Studio 模型创建“机器学习”扩充项后,可能会在扩充字段页面上显示两个同名的扩充项。 这不会影响扩充项,但最好仅选择其中一个扩充项,并将该扩充项应用于一个或多个字段。
- 如果网络爬虫在处理固定数量的文档时出现卡顿,且日志页面显示的信息为
The ingestion job <jobid> is terminated incorrectly
,请联系 IBM 支持人员,请求协助重启爬虫。 - 如果训练了一个或多个集合,那么其中一个集合中的训练数据可能会显示在未训练的集合的训练页面上。 请刷新页面以清除这些训练数据。
- 如果以下类型的文档没有正确的文件扩展名(.docx、.pptx 和 .xlsx),那么不会处理这些文档。
另请参阅前发行版中确定的问题。
在后续发行版中修正的 2.0.1 问题
- [版本 2.1.2 中已修复]当您将文件上传到已有文件的文件夹时,活动页面上会显示一条
Documents uploaded!
消息,但不会显示进一步的处理状态,直到文件数量增加。
2019年6月28日,正式发布
- 如果在 Discovery for Cloud Pak for Data 工具中工作,并且 IBM Cloud Pak® for Data 会话到期,那么您将收到空白页面。 要返回到工具,请刷新浏览器并重新登录。
- 摄入到 Discovery 中的所有 JSON 文件都应包含 .json 文件扩展名。
- 在对已训练集合的
collection_id
进行查询时,training_status.notices
值有时可能会显示为0
,而不是显示正确的值。 - 并非所有查询限制均在此发行版中强制实施。 有关禁止的字段的完整列表,请参阅查询限制。
- 在 JSON 源文档中,不应复制以下系统生成的字段:
document_id
、parent_document_id
、filename
和title
。 这将导致重复字段嵌套在数组中,并中断某些功能,例如排名器训练。 - 请勿在JSON文档中包含根级
metadata
属性。 如果您上传的JSON文档已经包含根级metadata
属性,则索引文档中的metadata
属性将在索引中转换为数组。 - 不要对 CSV 文件中的列名使用元数据。 如果在所上传 CSV 文件的头中对列名使用了元数据,那么索引文档的
metadata
属性将转换为索引中的数组。 - CSV 文件必须使用逗号 (
,
) 或分号 (;
) 作为定界符;不支持其他定界符。 如果 CSV 文件包含的值中含有逗号或分号,那么应该用双引号将这些值括起,以避免分隔这些值。 如果存在标题行,那么这些行中的值的处理方式与其他所有行中的值相同。 如果 CSV 文件的最后一行未后跟 CRLF(回车符),那么不会处理该行。 - 目前,并未强制实施非重复集合名称。 不建议使用重复的收藏名称,应尽量避免