Discovery for IBM Cloud 的发行说明

了解针对产品软件的每个发行版和更新包含的功能和更改。

IBM Cloud

此信息仅适用于托管在 IBM Cloud 上的 IBM Watson® Discovery 实例，或配置了 IBM Cloud Pak for Data as a Service。有关已安装部署的版本和更新信息，请参阅 IBM Watson® Discovery 盒式磁带 IBM Cloud Pak® for Data 的版本说明。

动态网站网络抓取功能停用公告

动态网站网络抓取功能由抓取设置中的抓取切换器在抓取过程中执行 JavaScript 控制，该功能已被弃用，并将于 2025 年 9 月移除。

保留任何现有索引所需的行动

为防止丢失现有索引，必须：

禁用爬行切换器期间执行 JavaScript。要禁用切换器，请转到“管理收藏”页面，打开使用动态网站网络抓取的收藏，然后单击“处理设置”选项卡。在 “指定要抓取的位置” 下，单击每个 URL 的编辑图标，然后禁用 “抓取期间执行 JavaScript 切换器。
暂停任何使用动态网站网络抓取功能的计划抓取

一旦禁用抓取切换器期间执行 JavaScript，就无法再次启用。

不禁用切换器的后果

如果您不禁用切换器，它将在 2025 年 9 月前自动禁用，并暂停以下计划的网络抓取。该操作可防止现有索引被缩减索引取代，缩减索引取决于 JavaScript 在抓取网站中的使用方式。只有在用户界面中重新配置后，暂停的抓取才会恢复。

对计划网络抓取的影响

不使用动态网站网络抓取功能的预定网络抓取将照常运行，不会出现任何中断。

2024 年 2 月 29 日

新建 Intelligent Document Processing (IDP) 项目类型: IDP 项目类型是 Discovery中的新缺省项目类型。使用 IDP 项目类型可快速了解在丰富文档预览中从文档中抽取的数据，还可通过应用扩充项来改进数据。有关更多信息，请参阅 Intelligent Document Processing。

2024 年 1 月 29 日

在创建集合时启用词干提取而不是词元化以进行规范化: 现在，您可以选择“词干提取”而不是“词元化”来规范化索引和查询中的词。有关更多信息，请参阅对未整理的数据启用词干提取。

2023 年 11 月 16 日

现在，在 IBM-Cloud 受管实例的高级套餐中支持用于获取集合详细信息，列表文档和获取文档详细信息的 API: 在 Premium 套餐中，针对 2023 年 11 月 16 日之后创建的集合支持 API。如果要获取有关先前创建的集合的信息，请触发在文档上运行采集转换步骤的进程。例如，您可以通过在 标识字段，管理字段，CSV 设置或 处理设置 (例如 OCR 设置) 页面中进行更改，或者通过将“智能文档理解”模型应用于较旧的集合来启用 API。

有关新 API 的更多信息，请参阅 API 参考文档。

7 2023 年 11 月

预览集合的数据: 您可以预览集合中的文档。要在高级文档视图中预览数据，请浏览至“管理集合”页面，然后单击集合磁贴中的 预览数据。或者，可以打开要预览的集合，然后单击 预览数据。

4 2023 年 10 月

图像中希伯来语文本的光学字符识别 (OCR) 功能是 Discovery 中的 Beta 功能

启用 OCR 时，文本抽取和 OCR 标识的文本抽取对希伯来语有限制。这些限制可能包括以下内容:

纯文本抽取的词顺序不准确
以文本和 html 格式抽取的内容以不同的单词顺序呈现文本
标点符号和换行符在文本中的位置不正确
根据集合设置，单词中的文本顺序将反转
当页面包含纯文本和图像文本时，可能会出现缺少文本和/或文本顺序不正确的情况。

导出实体抽取器的带标签数据

您可以导出实体抽取器的标签数据，以用于训练或构建大型语言模型 (LLM)。有关更多信息，请参阅导出实体抽取器的带标签数据。

在文档中查找要标记为实体示例的术语。

现在，您可以在文档中搜索要标记为实体示例的术语。您还可以找到已标记和未标记的实体示例，并更正任何标记不一致的情况。有关更多信息，请参阅使用关键字搜索示例。

外部扩充功能，用于使用您选择的模型对文档进行注释。

通过 Webhook 界面，您可以使用定制模型或高级基础模型以及其他第三方模型来丰富集合中的文档。有关更多信息，请参阅外部扩充 API。

词性扩充项不再可用于除内容挖掘以外的任何项目类型

词性扩充项已用于字典建议。但是，字典建议已更新，现在可以在不应用词性扩充项的情况下工作。对于内容挖掘项目，词性扩充项与以前一样可用。

2023 年 9 月 21 日

已更新所有语言的记号化器

更新的记号化器可能会影响某些查询的结果的排名顺序。如果您观察到查询结果中的任何排名差异，那么可以对集合中的文档重新建立索引。当发现摄入数据并将数据存储在索引中时，以及在运行时，当发现分析用户提交的查询时，发现都会对单词进行记号化。通过对集合重建索引，可确保使用用于匹配查询的同一记号化器对文档建立索引。

要对文档重建索引，请打开“管理集合”页面，选择集合，然后浏览至 扩充项 选项卡。选择要扩充的字段，然后清除该字段。接下来，单击 应用更改并重新处理，然后等待重新处理集合中的文档。

2023 年 8 月 15 日

用于应用或除去搜寻调度的选项: 此选项有助于轻松应用或除去搜寻调度，也有助于停止搜寻。有关更多信息，请参阅搜寻调度选项。

9 2023 年 8 月

现在，您可以指定从 UI 查询数据时要从中抽取内容的字段: 指定字段的功能允许您在缺省字段中未对内容建立索引时改进搜索结果。当您摄入结构化文件或应用“智能文档理解”模型时，可能不会在缺省字段中对内容建立索引。有关更多信息，请参阅摘录不可用。
PDF 的高级文档视图中的扩充项以不同颜色突出显示: 在 PDF 的高级文档视图中选择多个扩充项时，每种扩充项类型都会在具有不同颜色的文档中突出显示。重叠的扩充项也以不同的颜色突出显示。

2023 年 7 月 26 日

现在可以为搜寻调度指定定制日期和时间: 如果要避免在工作时间内在目标系统上负载过重，那么此选项很有用。有关更多信息，请参阅搜寻调度选项。

2023 年 6 月 10 日

所有实体扩充项都使用实体 v2 类型系统: 不再支持 Natural Language Understanding 实体 v1。IBM Cloud 在 2 2021 年 6 月之前创建的实例以及针对 IBM Cloud Pak for Data 2.x 部署使用的 Natural Language Understanding 实体类型系统的版本 1 用于英语和韩语集合。现在，所有集合仅使用 Natural Language Understanding 实体类型系统的 V 2。
更清晰地识别分类器: “扩充项”页面将分类器扩充项列示为 文本分类器 或 文档分类器 扩充项。

2023 年 5 月 16 日

用于创建用户训练的智能文档理解 (SDU) 模型的改进工具: 用于在创建用户训练的 SDU 模型时对文档进行注释的 SDU 工具现在使用 React UI 框架。此更新不会更改工具的行为，但会使其更灵敏。
现在，您可以使用集合 API 来定义 JSON 规范化: 创建集合 和 更新集合 方法现在支持添加 conversions 和 normalizations 对象，您可以指定这些对象以对集合中的文档应用规范化操作。例如，您可以定义用于在文档的 JSON 表示中将一个字段复制或合并到另一个字段的操作。 conversions 对象定义摄入期间发生的规范化操作，normalizations 对象定义应用扩充项后发生的规范化操作。有关更多信息，请参阅集合 API 参考。

2023 年 3 月 31 日

更新为 API 版本

当前 API 版本 (v2) 现在为 2023-03-31。该版本有一处改动。

已更改处理名为 document_id 的字段的方式

如果将包含名为 document_id 的字段的 JSON 文件添加到集合，那么将忽略该字段。将文档添加到索引时，系统会将新的唯一文档标识分配给该文档。要将文档标识分配给文档，而不考虑其文件类型，请使用 API 中的 更新文档 方法。

Previously, when you uploaded a JSON file with a field named document_id from the product user interface or by using the Add document API method, the document ID from the file was shown as the document_id value in query results. However, a different document ID was assigned to the document, and the assigned ID had to be used for certain other tasks, such as deleting the document. If your application relies on the previous behavior, specify a version number earlier than 2023-03-31, such as 2020-08-30, in your API calls.

2 2023 年 3 月

现在，您可以指定要添加到集合的文件类型: 连接到外部数据源时，可以限制要从外部数据源添加到集合的文件类型。例如，您可以选择仅从 Box 数据源添加 PDF 文件。

2023 年 2 月 21 日

使用光学字符识别 v2 技术

当您对所有 IBM Cloud 服务套餐中的英语，德语，法语，西班牙语，荷兰语，巴西葡萄牙语和希伯来语集合启用 OCR 时，将自动使用最新版本 (OCR v2)。

IBM Research 开发了新的光学字符识别模型，以更好地从具有以下限制的扫描文档和其他图像中抽取文本:

由于不正确的扫描仪设置，分辨率不足，照明不良 (如移动捕获)，失去焦点，未对齐的页面和打印不良的文档，导致低质量图像
具有不规则字体或各种颜色，字体大小和背景的文档

实体抽取器限制已更改

Plus 套餐的训练数据中允许的文档数从 100 增加到 200。

每个套餐可创建的实体类型数减少。

对于高端套餐，限制从 75 更改为 18。
对于企业套餐，限制从 50 更改为 18。
对于 Plus 套餐，限制从 20 更改为 12。

字符串变体运算符现在使用短语

当您将字符串变体运算符与包含短语的查询输入一起包含时，该变体将应用于短语中的每个词。例如，除 tom cat 外，"tom cat"~1 还与 top hat 匹配。有关发现查询语言运算符的更多信息，请参阅查询运算符。

2023 年 2 月 10 日

实体抽取器通常可用

抽取实体 丰富功能使您能够将定制类型系统构建到 Discovery中。使用此工具来标记行业数据中的实体示例，以构建机器学习模型，Discovery 可以使用此模型来识别有意义的业务术语。已在 Knowledge Studio中构建实体类型系统? 您可以使用 Knowledge Studio 中的语料库作为 Discovery 实体抽取器训练数据的起点。有关更多信息，请参阅实体抽取器。

如果在功能部件处于 Beta 发行版时为测试目的创建了实体抽取器扩充项，那么现在它已普遍可用，它将计入定制模型限制。无论实体抽取器扩充项是否应用于集合，都将产生费用。

7 2023 年 2 月

已除去对每小时搜寻的支持

您不能再选择每小时搜寻一次数据源。如果将现有集合配置为每小时搜寻一次，那么下次编辑连接器设置时将提示您更改调度的搜寻。

您无法再对集合启用常见问题及解答抽取

已除去用于启用或禁用 Beta 常见问题及解答抽取功能的复选框。常见问题解答抽取是一个 Beta 功能，用于在搜寻数据源时从数据源捕获问答对。常见问题解答抽取为每个对生成新的子文档，并将问题存储在 title 字段中，答案存储在 text 字段中。

不能将常见问题及解答抽取应用于新集合。

任何启用了 FAQ 抽取的现有集合都会在其索引中保留 FAQ 文档，直到重新处理该集合为止。当时，大部分问答对子文档都被删除了。但是，将保留从 HTML 或 TXT 源文件生成的任何常见问题及解答子文档。如果要除去这些子文档，请转至“管理数据”页面以将其删除。从一个父文档生成的子文档都具有相同的 metadata.parent_document_id 值。

如果需要从对问题和答案使用一致样式和格式的源文档中抽取问答对，那么可以使用“智能文档理解”工具来改为对这些对进行注释。有关更多信息，请参阅使用智能文档理解。

2023 年 1 月 25 日

设置具有读许可权的 Microsoft SharePoint Online 数据存储连接器

创建 Microsoft SharePoint Online 连接器以使用 Open Authentication v2来搜寻 SharePoint 数据源时，Discovery 创建的用于建立连接的企业应用程序仅需要读许可权。先前为您配置的企业应用程序需要写许可权。

如果要更新现有连接器以便可以使用新的读许可权配置，那么必须首先删除现有企业应用程序。

有关更多信息，请参阅 Microsoft SharePoint Online 连接器。

常见问题及解答抽取弃用声明

正在除去用于检测并从文档中抽取问答对的 Beta 常见问题及解答抽取功能。对该功能的支持将在 1Q 2023 中结束。

6 2022 年 12 月

现在，您可以停止数据源搜寻: 您可以停止正在进行或计划在将来进行的搜寻。有关更多信息，请参阅停止搜寻。

以下项是已知问题:

Box 数据源调度的搜寻未更新文档: 由于 Box Events API 中存在问题，在已调度的 recrawls 期间，未检测到“发现”集合在 Box 中存储的文档中的搜寻之间发生的更改。要确保集合是最新的，请停止并重新启动搜寻。

1 2022 年 12 月

Plus 套餐支持更少的实体抽取器: 可以使用 Plus 套餐创建的最大实体抽取器数从 6 减少到 3。

2022 年 11 月 12 日

在启用了 OCR 的集合中，发现用户可能会迂到在 11 月 1 和 11 月 11 日之间添加或处理的文档问题

在 1 2022 年 11 月至 11 月 11 日期间，一些启用了光学字符识别 (OCR) 的项目 (包括 "合同文档检索" 项目) 迂到了问题。这些问题与新版光学字符识别 (OCR v2) 功能有关，该功能在该时间范围内自动针对英语，德语，法语，西班牙语，荷兰语，巴西葡萄牙语和希伯来语集合启用。新版本以可能对其他功能产生负面影响的方式更改句子边界，包括合同中的元素标识和实体抽取器工具中的文档标注视图。

如果在此期间添加或处理的文档迂到任何这些问题，请还原应用于这些文档的 OCR 版本。从 2022 年 11 月 12 日开始，OCR v1 将应用于启用了 OCR 的所有集合。要返回到使用 OCR v1，请进行将重新处理受影响文档的更改。例如，您可以重新添加在时间范围内添加的文档以重新处理这些文档。或者，您可以重新处理整个集合。

要重新处理集合，请从“管理集合”页面打开该集合，然后转至 处理设置 选项卡。展开 更多处理设置 部分，将 OCR 开关设置为 Off，然后将其设置回 On。单击 应用更改并重新处理 以重新处理集合。

2022 年 11 月 2 日

一种新型改进的光学字符识别技术

现已推出新版光学字符识别技术。当您对所有 IBM Cloud 服务套餐中的英语，德语，法语，西班牙语，荷兰语，巴西葡萄牙语和希伯来语集合启用 OCR 时，将自动使用此最新版本 (OCR v2)。 IBM Research 开发了新的光学字符识别模型，以更好地从具有以下限制的扫描文档和其他图像中抽取文本:

由于不正确的扫描仪设置，分辨率不足，照明不良 (如移动捕获)，失去焦点，未对齐的页面和打印不良的文档，导致低质量图像
具有不规则字体或各种颜色，字体大小和背景的文档

1 2022 年 11 月

实体抽取器从训练数据文档装入前 40,000 个字符: 即使是用于定义定制实体示例的集合中的超长文档也会装入到工具的文档视图中。但是，仅显示前 40,000 个字符，即大约 15 到 20 个页面。文件内容的其余部分将被截断。您将知道您的文档是否被截断，因为文档视图中显示了通知。有关更多信息，请参阅实体抽取器。
您可以将每个文档设置的段落数设置为大于 1: 修复了阻止您使用产品用户界面中的搜索栏设置来增加每个文档要返回的最大段落数的错误。有关更多信息，请参阅如何派生段落。
改进了查询聚集文档: 更新了描述可在查询聚集参数中指定的聚集类型的文档。有关更多信息，请参阅查询聚集。

2022 年 9 月 30 日

伦敦数据中心不再提供 Lite 套餐: 轻量套餐已停用。不能在任何位置 (包括伦敦) 创建使用轻量套餐类型的新服务实例。使用新的 Plus 套餐及其关联的 30 天免费试用，探索最新版本产品提供的新功能和更简单的构建方法。

2022 年 9 月 22 日

Plus 套餐支持更多实体抽取器: 可以使用 Plus 套餐创建的最大实体抽取器数从 3 增加到 6。
无法将“智能文档理解”模型应用于 Microsoft Excel 文件: 可以为 Excel 文件生成的结构分析的质量不够。从 2022 年 9 月 22 日开始，无法将 SDU 模型应用于 Excel 文件。此更改不会影响在 2022 年 9 月 22 日前应用了 SDU 模型的集合中的 Excel 文件。

2022 年 9 月 16 日

现在，上下文中的文档预览可用于已搜寻的 PDF 文件: 当您单击以查看从 PDF 文档中抽取的搜索结果中的段落时，将显示一个文档预览页面，该页面在原始 PDF 页面的上下文中显示返回的段落。上下文视图可用于应用了“智能文档理解”模型的 PDF 文件。

2022 年 8 月 15 日

SDK 已更新以反映最新的 API 更改。

以下 Discovery v2 API 更改现在反映在 SDK 中:

Use the new document classifier API to get, add, update, or delete a document classifier.
A new document status API is available. You can use it to get a list of the documents in a collection and to get details about a single document.
You can now get, add, and remove a stop words or expansion list for a collection.
A smart_document_understanding field is returned with the Get collection method. This new field specifies whether an SDU model is enabled for the collection and indicates the model type.
A similar parameter is available from the Query method. Use it to find documents that are similar to documents of interest to you.
The suggested_refinements parameter of the Query method is deprecated. The suggested_refinements parameter was used to identify dynamic facets from Premium plan data.

8 2022 年 8 月

可以搜寻较大的文档: 针对高级套餐增加了已搜寻文档所允许的最大文件大小。盒式连接器、IBM Cloud Object Storage 和 Salesforce 连接器的数量也有所增加。有关更多信息，请参阅文件大小限制。

2 2022 年 8 月

IBM Cloud Object Storage 连接器新增了IAM身份验证支持: 现在您可以选择使用 IBM Cloud Identity and Access Management （IAM）服务进行身份验证。更多信息，请参阅 IBM Cloud Object Storage。

2022 年 7 月 28 日

API 更新

对 Discovery v2 API进行了以下更改。

新字段可用:

将使用 Get collection 方法返回 smart_document_understanding 字段。此新字段指定是否对集合启用 SDU 模型并指示模型类型。
可从 Query 方法获取 similar 参数。使用它来查找与您感兴趣的文档相似的文档。

不推荐使用 Query 方法的 suggested_refinements 参数。 suggested_refinements 参数用于标识 Premium 计划数据中的动态构面。

Discovery v1 废弃声明

不推荐使用 Watson Discovery v1。要求使用 Watson Discovery v1 的现有客户机在支持结束日期 2023 年 7 月 11 日之前迁移到 Watson Discovery v2。支持结束意味着没有 v1 实例将在 2023 年 7 月 11 日或之后工作。有关迁移的更多信息，请参阅从发现获取最大信息。

2022 年 7 月 11 日

高级文档视图突出显示了更多丰富内容

除了 Watson Natural Language Processing 模型可识别的内置实体和 关键字 扩充项外，高级文档视图现在突出显示以下类型的扩充项:

定制字典术语
与您定义的正则表达式模式匹配的术语或数字
由 Watson Knowledge Studio 机器学习和基于规则的模型定义的定制实体和关系
使用可用作 Beta 功能的实体抽取器工具定义的定制实体

有关可以添加到文档的扩充项的更多信息，请参阅添加特定于域的资源。

2022 年 6 月 30 日

Watson SDK 支持更改

Watson 开发者社区 (而不是 IBM) 提供了对以下 SDK 的支持:

转至
Ruby
Swift
尤尼蒂

有关更多信息，请参阅 Watson SDK。

1 2022 年 6 月

实体抽取器工具现在更易于使用: 重新设计了用户界面，以更好地支持添加实体类型及其标签示例的工作流程。作为新设计的一部分，缺省情况下现在已启用批量标记功能，文档视图更易于查找和使用，建议窗格更易于响应，并且您可以在多个训练运行中跟踪度量值分数。有关实体抽取器的更多信息，请参阅定制 Discovery 可识别的术语。
实体抽取器现在以更多套餐和语言提供: 除了 Premium 套餐外，实体抽取器 Beta 功能现在还可供 Plus 和 Enterprise 套餐的用户使用。除英语以外的其他语言的集合支持抽取器扩充项。
当您从网络抓取连接器中删除一个起始 URL 时，其关联的文件也会被删除: 已更新 Web 搜寻连接器。从2022年4月之后创建的收藏开始，如果您从网络抓取配置中删除一个起始 URL，则任何从该网页内容 URL 衍生的索引文件将在下一次抓取时删除。有关更多信息，请参阅 Web 搜寻。

2022 年 5 月 16 日

添加了用于处理停用词和扩展列表的 API 方法: 现在，您可以通过程序获取，添加和除去集合的停用词或扩展列表。有关更多信息，请参阅查询修改方法。

2022 年 5 月 13 日

提供了改进的 JSON 视图: 现在，您可以使用键盘键来制表视图中的元素。新的 JSON 视图还会对每个 JSON 对象中出现的元素进行编号，这样可以更轻松地跟踪信息并一目了然地读取总计。

2022 年 4 月 20 日

企业套餐部署中支持分析 API

使用 Analyze API 根据集合的配置设置来处理 JSON 文件，然后返回该文件以供实时使用，而不将其存储在集合中。仅在先前已安装的部署中支持分析 API。有关更多信息，请参阅分析 API。

提供了新的文档状态 API

使用新的文档状态 API 以编程方式获取集合中文档的列表，并获取有关单个文档的详细信息。以下说明适用于本版本：

在 2022 年 3 月 23 日之后创建的集合支持此 API。

如果要获取有关先前创建的集合的状态信息，请触发在文档上运行采集转换步骤的进程。例如，您可以通过在 标识字段，管理字段，CSV 设置或 处理设置 (例如 OCR 或常见问题解答抽取设置) 页面中进行更改，或者通过将“智能文档理解”模型应用于较旧的集合来启用 API。
API 仅可从 Plus 和 Enterprise 套餐实例获取。

有关新 API 的更多信息，请参阅 API 参考文档。

将显示更多消息，使您随时了解文档处理的状态

修复了先前阻止在采集过程中显示有关文档转换和建立索引状态的参考消息的问题。现在问题已解决，您在添加或重新处理文档时可能会看到比平常更多的消息。这一增长是预期的。您未执行任何操作导致消息数增加。

6 2022 年 4 月

项目磁贴具有更直观的菜单: 项目磁贴已更新为包含溢出菜单，您可以使用该菜单来执行诸如删除或重命名项目之类的操作。

2022 年 3 月 30 日

提供了新的文档分类器 API

使用新的文档分类器以编程方式获取，添加，更新或删除文档分类器。已安装的实例（ IBM Cloud Pak for Data ）或 IBM Cloud 管理的Premium或Enterprise计划实例支持文档分类方法。

有关新 API 的更多信息，请参阅 API 参考文档。有关使用产品用户界面添加文档分类器的更多信息，请参阅对文档进行分类。

2022 年 3 月 21 日

可视化在文档中找到的扩充项

单击以查看搜索结果中的段落时，将显示一个文档预览页面，其中显示在其中找到搜索结果的原始文档的表示。对于大多数文档类型，您可以打开文档的新 高级视图 以查看有用的摘要信息，例如在文档中检测到的任何扩充项的出现次数。您还可以选择其中一个扩充项，以突出显示文档文本中每次出现的元素。

目前，仅列出实体和 关键字 扩充项。

改进了 PDF 文档的搜索结果格式

当您单击以查看从 PDF 文档中抽取的搜索结果中的段落时，将显示一个文档预览页面，该页面在原始 PDF 页面的上下文中显示返回的段落。

上下文视图可用于应用了“智能文档理解”模型的 PDF 文件。丰富的预览无法处理图像，这意味着它无法处理扫描的 PDF 文档。上下文视图可用于所有语言的 PDF; 但是，扩充项突出显示在某些语言中可能不一致。

请告诉我们您的想法

通过单击产品用户界面页面标题中的 共享反馈 按钮，随时与我们分享您的意见和想法。

2022 年 3 月 10 日

从新的“管理数据”页面管理集合中的数据: 现在，您可以从 管理集合 导航窗格访问集合的“管理数据”页面。转至该位置以查看集合中的文档列表，并快速查看有关这些文档的信息。您还可以只需单击几次即可从集合中删除文档。有关更多信息，请参阅从查询结果中排除内容。

2022 年 2 月 15 日

可供 Microsoft Sharepoint Online 连接器使用的备用认证机制: 现在，当您配置新的 IBM Cloud 连接器时，可以使用 Open Authentication 直接登录到 Microsoft SharePoint。使用“开放式认证”向外部数据源认证的 使用 Microsoft 登录 选项是 Beta 功能。有关更多信息，请参阅 Microsoft SharePoint Online。

7 2022 年 1 月

从 Plus 升级到 Enterprise，无需帮助: 您可以执行从 Plus 套餐到 Enterprise 套餐的就地升级。有关更多信息，请参阅升级。

6 2021 年 12 月

搜寻具有动态内容的 Web 页面现在已普遍可用: 搜寻期间执行 JavaScript 功能已作为 Beta 功能引入，但现在已普遍可用。有关更多信息，请参阅 Web 搜寻。
从已搜寻文档捕获 SharePoint ACL 信息: 现在，您可以配置数据源搜寻，以将 ACL 信息作为元数据存储在添加到 SharePoint 联机集合的文档中。有关更多信息，请参阅 Microsoft SharePoint Online。
您可以向 Beta 实体抽取器模型的训练数据添加更多文档: 如果您添加并标注了 20 个文档以训练模型，并且现在想要继续提高模型的性能，那么可以添加更多文档。将其他文档添加到用于训练模型的集合。在对前 20 个文档进行标签，并且模型是最新的且有任何更改后，您可以选择继续对文档进行标签。将装入您添加到集合的新文档。您可以对它们添加标签以扩充训练数据，然后重新训练模型。有关更多信息，请参阅定制 Discovery 可识别的术语。
注销 Discovery: 您可以随时通过从产品用户界面的页眉中提供的用户概要文件菜单中单击注销来注销 Discovery 服务实例。

2021 年 11 月 18 日

企业套餐现在随时随地都可用: 企业套餐可从所有数据中心位置获取。利用企业级支持和性能来扩展和保护您的 Discovery 应用程序，并处理更多用例，包括合同分析和内容挖掘，以探索跨文档的洞察力。有关更多信息，请参阅 Discovery 价格套餐。

2021 年 11 月 11 日

企业套餐的新位置现在可用: Enterprise 套餐可从法兰克福，伦敦，悉尼和东京位置以及达拉斯位置获取。

3 2021 年 11 月

新建企业套餐: 利用企业级支持和性能来扩展和保护您的 Discovery 应用程序，并处理更多用例，包括合同分析和内容挖掘，以探索跨文档的洞察力。目前，企业套餐仅从达拉斯位置可用。有关更多信息，请参阅 Discovery 价格套餐。
新建 Beta 实体抽取器扩充项: 抽取实体 丰富功能使您能够将定制类型系统构建到 Discovery中。使用此工具来标记行业数据中的实体示例，以构建机器学习模型，Discovery 可以使用此模型来识别有意义的业务术语。目前，此 Beta 功能仅可用于在 Premium 套餐服务实例中创建的英语项目。有关更多信息，请参阅定制 Discovery 可识别的术语。
新建 有帮助的链接 选项卡: 主页包含 有用链接 选项卡，其中包含指向文档，社区站点和其他资源的快速链接。
改进了字段选择选项: 当您将扩充应用于某个字段或选择要用作构面源的字段时，现在显示的供您选择的字段仅包含作为有效选项的字段。先前，该列表包含不是有效选项的字段。

2021 年 10 月 14 日

新增 Discovery 主页: 当您启动 Discovery 并使您能够快速访问产品概述视频和教程时，将显示新的主页。您可以折叠主页欢迎条幅以查看更多项目。
“新建套餐使用情况”部分: 随时了解套餐使用情况，并从“套餐限制和使用情况”页面根据套餐类型的限制来检查使用情况。从产品页面标题中，单击用户图标。 使用情况 部分显示简短摘要。单击 查看全部 以查看所有套餐限制类别的使用情况信息。
更改“搜索”中的拼写设置: 缺省情况下，拼写更正设置已从在新项目中自动启用更改为禁用。如果要在用户在其查询中拼写错误时提醒用户，请开启 拼写建议。有关更多信息，请参阅定制搜索栏。
改进了 指导式教程 可用性: 现在，产品页面标题中提供了 引导式导览 按钮，这使它们可以从任何位置进行访问。先前，仅可从“我的项目”页面获取此信息。

1 2021 年 10 月

在所有位置更改为轻量套餐和高级套餐: 轻量套餐和高级套餐已停用。无法在达拉斯，法兰克福，伦敦，悉尼，东京和华盛顿特区位置创建使用 Lite 或 Advanced 套餐类型的新服务实例。任何现有轻量套餐和高级套餐都将继续正常运行并继续受支持。您可以从轻量套餐升级到高级套餐。使用新的 Plus 套餐及其关联的 30 天免费试用，探索最新版本产品提供的新功能和更简单的构建方法。

2021 年 9 月 24 日

NLU 扩充项的新评分: 对于搜索返回的 NLU 扩充项，将显示相关性和置信度分数。例如，从查询结果打开文档预览的 JSON 视图时，可以看到“实体”提及项的置信度分数和“关键字”提及项的相关性分数。

2021 年 9 月 9 日

Plus 套餐的新位置: 现在可从悉尼位置获取 Plus 套餐。使用新的 Plus 套餐及其关联的 30 天免费试用，探索最新版本产品提供的新功能和更简单的构建方法。有关更多信息，请参阅从 Discovery 获取最大。
在大多数位置更改为轻量套餐和高级套餐: 轻量套餐和高级套餐已停用。无法在达拉斯，法兰克福，伦敦，悉尼，东京或华盛顿特区位置创建使用轻量或高级套餐类型的新服务实例。任何现有轻量套餐和高级套餐都将继续正常运行并继续受支持。您可以从轻量套餐升级到高级套餐。

2021 年 8 月 26 日

Plus 套餐的新位置: 现在，除了达拉斯，法兰克福和东京外，还可以从伦敦和华盛顿特区获得 Plus 套餐。
在某些位置更改为轻量套餐和高级套餐: 无法在达拉斯，法兰克福，伦敦，东京或华盛顿特区位置创建使用轻量或高级套餐类型的新服务实例。任何现有轻量套餐和高级套餐都将继续正常运行并继续受支持。您可以从轻量套餐升级到高级套餐。
新的答案发现功能: 现在，答案结果通常可用于受管部署。如果要返回问题的简明答案，请使用答案查找。有关更多信息，请参阅 Answer 查找。

2021 年 8 月 16 日

Plus 套餐的新位置: 现在，除了达拉斯外，法兰克福和东京也提供 Plus 套餐。
在某些位置更改为轻量套餐和高级套餐: 不再提供轻量套餐和高级套餐。无法在达拉斯，法兰克福或东京位置创建使用轻量或高级套餐类型的新服务实例。任何现有轻量套餐和高级套餐都将继续正常运行并继续受支持。您可以从轻量套餐升级到高级套餐。

2021 年 7 月 27 日

改进了文档大小限制: 文档大小限制已增大。对于高级套餐集合，您现在可以上载最大大小为 50 MB 而不是 32 MB 的文件。有关更多信息，请参阅文档限制。

2021 年 7 月 23 日

改进的 SharePoint 联机连接器: Microsoft SharePoint Online 数据源连接器现在接受任何有效的 Azure Active Directory 用户标识语法; 用户标识的格式不需要与 <admin_user>@.onmicrosoft.com 语法匹配。有关更多信息，请参阅 Microsoft SharePoint Online。

2021 年 7 月 16 日

新建 Beta 动态 Web 站点搜寻: 网络爬虫现在可以抓取使用 JavaScript 渲染内容的动态网站。如果启用此 Beta 功能，那么搜寻站点所需的时间会增加。有关更多信息，请参阅 Web 搜寻。

2021 年 6 月 23 日

新建 Plus 套餐: 使用新的 Plus 套餐及其关联的 30 天免费试用，探索最新版本产品提供的新功能和更简单的构建方法。目前，Plus 套餐可从达拉斯位置获取。有关更多信息，请参阅从 Discovery 获取最大。
更改为轻量套餐和高级套餐: 不再提供轻量套餐和高级套餐。无法在达拉斯位置创建使用轻量或高级套餐类型的新服务实例。任何现有轻量套餐和高级套餐都将继续正常运行并继续受支持。您可以从轻量套餐升级到高级套餐。

端点弃用提示

更改为 Discovery API 端点

作为完全支持 Identity and Access Management (IAM) 认证工作的一部分，用于以编程方式访问 Discovery 服务的端点正在更改。不推荐使用旧端点 URL，将于 2021 年 5 月 26 日引退。更新 API 调用以使用新 URL。

URL 的结尾模式从 gateway-{location}.watsonplatform.net/discovery/api/ 更改为 api.{location}.discovery.watson.cloud.ibm.com/。新端点中的域，位置和产品标识不同。更多信息，请参阅从 watsonplatform.net 更新终端URL。

如果服务实例 API 凭证使用旧端点，请创建新凭证并立即开始使用。更新定制应用程序以使用新凭证后，可以删除旧凭证。

2021 年 3 月 19 日

改进的 Web 搜寻连接器: 您可以使用 Web 搜寻集合类型来连接到内部公司 Web 站点上存储的内容。有关更多信息，请参阅 Web 搜寻。

2021 年 3 月 4 日

上载时新建拖放功能: 现在，上载集合支持在文档上载之前和期间拖放文档。有关更多信息，请参阅上载数据。

2020 年 12 月 17 日

改进了“活动”选项卡上的日期和时间显示: 现在，在管理集合页面的活动选项卡上，会为每个集合显示下次同步安排日期和时间。
新建 Beta 常见问题及解答抽取: 发布了常见问题抽取 Beta 功能。常见问题抽取功能会自动从常见问题文档和 Web 页面中抽取问答对，以便应用程序可以返回更精确的答案。有关更多信息，请参阅常见问题抽取。有关 Beta 功能的说明，请参阅 Beta 功能。

3 2020 年 12 月

新建 Content Intelligence: 现在，您可以在创建文档检索项目时将“丰富合同”应用于该项目。 “合同”扩充项可用于对文档中的合同期限、当事方、生效日期等进行分类。有关更多信息，请参阅针对合同的文档检索。

2020 年 11 月 10 日

新建 Box 连接器: 搜寻 Box 系统。有关更多信息，请参阅 Box。
新的 SharePoint 2016 内部部署连接器: 搜寻 SharePoint 2016 本地系统。如需了解更多信息，请参阅 SharePoint 2016 On-Premises。
方框连接器无法在 Safari 上运行: 有关更多信息，请参阅 Box 连接器。
元数据转换: 如果 metadata 属性在索引中被转换为数组，则无法使用 Delete labeled data API 方法删除文档。更多信息，请参阅 API 参考资料。

2020 年 10 月 30 日

新增对波斯尼亚语、克罗地亚语、印地语和塞尔维亚语的语言支持: 现在为波斯尼亚语，克罗地亚语，印地语和塞尔维亚语提供基本语言支持。有关更多信息，请参阅语言支持。
新的 Beta 模式扩充项: 模式丰富测试版使用模式归纳法来帮助您教会 Discovery 识别数据中的模式。模式归纳会基于指定的示例来生成抽取模式。指定少量示例后，Discovery 会建议一些额外的规则来供您验证以完成模式。您可以将模式归纳用作扩充项或用于创建构面。有关更多信息，请参阅模式和通过标识模式创建构面。有关 Beta 功能的说明，请参阅 Beta 功能。
对“文档检索”项目的更改: 现在，在新的文档检索项目中，suggested refinements 查询设置的缺省值为 false。以前，其缺省值为 true。

2020 年 9 月 14 日

针对 SDU 的新预训练模型: 在“文档检索”项目的“智能文档理解”中，提供了一个新的预训练模型。此模型非常适合从包含大量表的文档中抽取数据。有关更多信息，请参阅识别字段。

2020 年 8 月 30 日

更新为 API 版本: 当前 API 版本 (v2) 现在为 2020-08-30。此版本进行了以下更改：
更改为 "options" 对象: 对于每个扩充项，List 扩充项方法不再返回 options 对象。使用 Get 扩充项方法来返回单个扩充项的 options 对象。

2020 年 7 月 16 日

Premium 实例的新发行版: 此发行版可用于 Discovery 上 2020 年 7 月 16 日之后创建的 IBM Cloud 高端实例。对于在该日期之前创建的高级实例以及所有精简版和高级计划，请参阅 Discovery 开始使用。
切换到 IBM Cloud Premium: Premium 套餐现在已普遍可用。
新建基于项目的接口: 基于项目的用户界面包括针对三种常见用例进行优化的配置：文档检索、对话搜索和内容挖掘。有关更多信息，请参阅创建项目。
新建内容挖掘应用程序: Watson Discovery 的这一全新功能可让您在甚至不知道该问什么问题的情况下，从数据中发现洞察力。该强大的关联工具将帮助您释放大型非结构化数据集的价值。有关详细信息，请参阅使用 "内容挖掘" 应用程序分析数据。
新表作为答案: 如果在表格中找到文本片段，则不会有任何帮助，因此如果您的问题最好用表格来回答，Discovery 会返回一个格式化的表格作为答案。有关更多信息，请参阅表检索。
新的动态构面型搜索功能: 未指定的查询很常见。动态构面型搜索通过理解搜索结果在语句中的使用方式，无需训练就可自动将搜索结果分类为不同的智能构面。请参阅文档检索项目中的构面。
新的可复用组件: 您不再需要从头开始构建 Discovery 应用程序。现在，我们提供了现成的可复用开放式源代码 React 组件。在配置 Discovery 应用程序时，您使用的是真正的组件。从此处，只需部署即可获取定制 Discovery 应用程序。请参阅构建和部署组件。
新建域词汇表功能: 您可以在没有字典的情况下为用户创建一个面。使用“领域词汇”，在短短 5 分钟内，通过我们对数据使用方式的理解，建立一个强大的面。请参阅构面。
新建相关性训练: 您可以在项目级别进行训练。Discovery 对最佳答案进行排序，而不考虑数据源/集合。请参阅通过训练改进结果相关性。
新型内置拼写纠正器: Discovery 具有内置的拼写建议。请参阅参数描述。
改进的自动补全: Discovery 包括搜索的自动完成（超前键入）功能，以及向最终用户提供该功能的可重用组件。
对 12 种语言的新支持: Discovery 的语言支持现在以 12 种其他语言提供。有关完整列表，请参阅语言支持。
Cloud Object Storage 连接器限制: 当连接到 IBM Cloud® Object Storage 数据源时，仅显示给定凭证的前 75 个存储区。
当前 API 版本: API 版本 (v2) 为 2019-11-29。
对此发行版中的功能部件的更改: 去重在此发行版中不可用。; 未提供异常检测。; IBM Watson® Discovery 不再包含新闻。; 多个 Watson Natural Language Understanding 扩充项目前不可用（实体抽取、关系抽取、关键字抽取、类别分类、概念标记、语义角色抽取、观点分析和情绪分析）; SharePoint 2016 On-Premises 和 Box 数据源目前不可用。