常见问题及解答

常见问题解答。

有关特定于发现的概念 (例如项目或 扩充项) 的更多信息，请参阅词汇表。

如何搜索产品文档?

要搜索整个 IBM Cloud 文档站点，请在 IBM Cloud Web 站点条幅中的搜索字段中输入搜索项。要仅搜索有关 Discovery 服务的信息，请滚动到页面开头，并在页面标题中的搜索字段中输入搜索项。

{: caption="开头的位置本产品文档搜索栏与所有IBM Cloud " caption-side="bottom"}搜索栏对比

Watson Discovery 如何访问我的数据?

Discovery 具有内置连接器，可抓取各种数据源，包括网站、IBM Cloud Object Storage、Box、Microsoft SharePoint, 和 Salesforce 网站。它甚至支持您构建定制连接器。您可以调度搜寻，以便随着源数据的更改，集合会自动选取最新版本。Discovery 仅从外部数据源读取数据; 它从不写入，更新或删除原始数据源中的任何内容。有关更多信息，请参阅创建集合

我可以上传文档吗?

是，您可以将文档直接上载到项目中的集合。上载是可用于入门的一次性操作。另一种方法是连接到数据源并搜寻源以获取信息。当您搜寻数据源时，数据可以停留在它所在的位置，并且您可以设置一个调度，通过该调度来搜寻外部源以查找新的和已更改的信息。搜寻数据时，您知道集合中的信息始终是最新的。有关更多信息，请参阅创建集合。

我的所有文档都必须是英语吗?

否。Discovery 支持多种语言。有关每个功能部件的语言支持的更多信息，请参阅语言支持。

发现可以摄入哪些类型的文件?

Discovery 可以采集大多数标准业务文件类型，包括 PDF，Microsoft Word 文档，电子表格和演示文稿。有关完整列表，请参阅支持的文件类型。

如何知道我是具有 Discovery v1 还是 v2?

如果要在 IBM Cloud Pak® for Data上使用 Discovery，那么要使用 Discovery v2。

如果您具有由 IBM Cloud管理的服务实例，请检查您在启动产品时看到的内容。在 v2中打开产品用户界面时，将显示以下页面:

显示具有单个“样本项目”磁贴的“我的项目”主页面。 — Discovery v2 home page

我能否将 Watson Discovery 与 Watson Assistant集成?

您可以将 Discovery 与 watsonx Assistant 集成，以使存储在外部数据源中的信息可供虚拟助手使用。在 Discovery中创建 Conversational Search 项目，然后添加要向其提供的数据源。接下来，在 watsonx Assistant中创建 搜索集成，并将其连接到 Discovery 项目和集合。

我能否增加项目的收集限制?

如果要向项目添加多个 5 集合，并且您有 Premium 套餐，那么可以通过打开支持请求来请求增加集合限制。有关更多信息，请参阅获取帮助。

在将相关文档添加到集合之后，我能否找到这些文档

如果要保留有关两个或多个文档之间的关系的信息，那么可以这样做。例如，如果从同一文件夹上载 3 文档，并且这些文档在该文件夹中的位置对于其含义很重要，那么您可能希望保留父文件夹信息。

上载文档时，缺省情况下不会存储有关其与其他文档的关系的此类信息。要添加信息，可以使用 API 来添加文档。使用 API 添加文档时，可以指定元数据值。您可能想要为每个文档指定元数据值，例如 "foldername": "company_a"。

或者，您可以将每个文档的文档主体复制到 JSON 文件中，其中每个文档都是单个数组中的对象。摄入 JSON 文件时，会将数组中的每个项添加为具有 seprarate 文档标识的单独文档。每个文档共享相同的父标识，用于标识它们之间的关系。

您可以从“管理数据”页面快速查找共享相同父标识或其他公共元数据值的文档。定制视图以显示文档共有的字段 (例如 extracted_metadata.parent_document_id 或 extracted_metadata.foldername)。

我能否定制 Discovery 以了解我的数据

是。使用产品随附的直观工具，向 Discovery 传授域的唯一术语。例如，您可以教它识别模式 (例如您使用的 BOM 或部件号)，或者添加识别产品名称和其他特定于行业的词义的字典。有关更多信息，请参阅添加特定于域的资源。

智能文档理解工具如何工作?

您可以使用“智能文档理解”工具来指导 Discovery 了解文档中具有您希望 Discovery 建立索引的不同格式和结构的部分。您可以定义新字段，然后对文档进行注释以训练 Discovery，从而了解通常存储在该字段中的信息类型。有关更多信息，请参阅使用智能文档理解。

添加同义词的最佳方法是什么?

您可以使用两种不同的方法来定义同义词。

要定义在摄入文档时识别和标记的同义词以及可通过搜索检索的同义词，请创建字典并为字典术语条目添加同义词。字典定义要在文档中标记的特殊术语，例如产品名称或特定于行业的术语。以后可以使用字典术语来创建构面和过滤文档。有关更多信息，请参阅字典。
要定义应用于用户提交的查询文本以展开查询含义的同义词，请使用“改进并定制”页面的 改进相关性 部分上的同义词工具来添加同义词。有关更多信息，请参阅扩展查询的含义。

我能否使用 Discovery 来检测观点?

您可以使用 Discovery 来检测短语和文档观点。文档观点是可用于所有项目类型的内置 Natural Language Processing 扩充项。文档观点评估文档中所表达的整体观点，以确定它是正面的，中立的还是负面的。短语观点也一样。但是，短语观点可以在单个文档中检测和评估多种意见，而在英语和日语文档中，可以找到特定短语。有关文档观点的更多信息，请参阅观点。有关短语观点的更多信息，请参阅检测表达观点的短语。无法检测 v2中实体或关键字的观点。

什么是嵌套字段？

当您摄入文件或搜寻外部数据源时，您添加到 Discovery 的数据将作为文档处理并添加到集合中。原始文件中的字段将转换为文档字段并添加到集合的索引。某些内容将添加到根级别的索引字段中，而某些信息将存储在嵌套字段中。存储数据的位置因文件类型而异。来自结构化数据源的大部分字段都存储为根级别字段。对于具有非结构化数据的文件，该文件的大部分主体存储在索引中的 text 字段中。其他信息 (例如文件名) 存储在名称类似 extracted_metadata.filename 的嵌套字段中。您可以根据字段的名称来确定该字段是否为嵌套字段。如果字段名称包含句点，那么它是嵌套字段。有关如何处理不同文件类型的更多信息，请参阅如何处理数据源。

应该在定制应用程序中使用哪种类型的查询?

提交查询时，可以选择提交自然语言查询，或者使用“发现查询语言”来定制搜索以将索引中的特定字段作为目标，例如。有关不同类型的查询以及如何决定使用哪种查询的更多信息，请参阅选择正确的查询类型。