IBM Cloud Docs
使用 NeuralSeek 从现有帮助内容返回经过打磨的答案

使用 NeuralSeek 从现有帮助内容返回经过打磨的答案

在本教程中,您将使用 Watson Discovery,watsonx Assistant以及可从 IBM Cloud 目录获取的 NeuralSeek 服务来创建虚拟助手,以回答有关 Watson Discovery的问题。 助手将使用现有 Watson Discovery 产品文档作为其知识库来生成答案。

本教程显示了创建 Discovery的受管部署的步骤。 但是,您可以创建由 IBM Cloud 托管或安装在 IBM Cloud Pak for Data 中的 Discovery 服务实例,并将其连接到 NeuralSeek 服务实例。

学习目标

完成本教程后,您将了解如何执行以下操作:

  • 在 Discovery中创建文档检索项目。
  • 将 PDF 文档上载到项目,并将用户训练的“智能文档理解”模型应用于 PDF。
  • 将 Discovery 项目连接到 NeuralSeek 服务实例。 NeuralSeek 是 AI 支持的答案生成引擎。
  • 在 watsonx Assistant 中创建助手,并对其应用 NeuralSeek 集成。
  • 向连接到 NeuralSeek 以获取答案的 watsonx Assistant 添加操作。
  • 使用助手来回答有关 Discovery的问题。

NeuralSeek 是由 IBM 以外的供应商提供的第三方产品,如果您接受第三方的条款,则您与第三方之间需另行签订协议。 IBM 对产品不承担任何责任,并且不涉及产品的隐私、安全、性能、支持或其他承诺。

Duration

完成本教程大约需要 4 到 5 个小时。

先决条件

  1. 开始之前,必须使用 IBM Cloud设置付费帐户。

    您可以免费使用 Plus 套餐来完成本教程,该套餐提供 30 天免费试用。 但是,要创建服务的 Plus 套餐实例,您必须具有付费帐户 (在其中提供信用卡详细信息)。 有关创建付费帐户的更多信息,请参阅 升级帐户

  2. 创建 Plus 套餐 Discovery 服务实例。

    转至 IBM Cloud 目录中的 Discovery 资源页面,并创建 Plus 套餐服务实例。

    指定 Dallas 作为位置。

    在本教程中,您还将供应其他服务。 这些服务必须托管在同一数据位置,以便它们可以相互连接。 由于 NeuralSeek 服务仅在达拉斯可用,因此您将在达拉斯创建所有服务实例。

如果您决定停止使用 Plus 套餐并且不想为其付费,请在 30 天试用期结束之前删除 Plus 套餐服务实例。

获取产品文档

要使用 Discovery 产品文档作为知识库,我们将以 PDF 文件形式下载产品文档。

  1. 从 Web 浏览器,转至产品文档站点。

    https://cloud.ibm.com/docs/discovery-data
    
  2. 从目录面板中,单击 产品指南 部分中的溢出菜单图标,然后选择 以 PDF 格式查看

  3. 通过单击页面标题中的 保存 图标,将 PDF 文件保存到系统。

  4. 使用 PDF 文件编辑器将 PDF 文档拆分为两个大小相似的单独 PDF 文件。

    拆分 PDF 会创建两个较小的文件,可以在 Discovery中更快地扩充这些文件。

创建文档检索项目

现在,您具有产品文档的最新副本,请将其作为数据源添加到 Discovery 项目。

在 Discovery中,您将创建 文档检索 项目类型。 您添加到此类型的项目的文档将通过以下方式自动扩充:

  • 实体 (例如,适当的名词) 已识别并标记。
  • 识别并标记语音部分。

稍后在将自然语言短语作为搜索查询提交以返回准确响应时,将使用此标记信息。

  1. 打开新的 Web 浏览器页面。

  2. 从 Discovery IBM Cloud中的 Plus 套餐服务页面,单击 启动 Discovery

  3. “我的项目”页面,单击“新建项目”。

  4. 将项目命名为 Discovery documentation,然后单击 文档检索 磁贴。

    显示项目类型选项
    项目类型
    * 项目类型选项

  5. 单击下一步

您将在下一步中配置项目的数据源。

将数据上载到项目

将文档 PDF 添加到 Discovery 项目。

  1. 从“选择数据源”页面,单击 上载数据 磁贴,然后单击 下一步

    显示已从数据源
    选择上传数据选项* 从上传的数据创建集合* 从上传的数据创建集合* 从上传的数据创建集合* 从上传的
    创建集合

  2. 将集合命名为 Discovery docs part 1,然后单击 下一步

  3. 单击 将文件拖放到此处或上载,然后浏览以添加先前创建的第一个 PDF 文件。

  4. 单击完成

    将文件添加到集合时,将对其进行处理。

  5. 在导航面板中,单击 管理集合,然后单击 新建集合

    显示“管理集合”页面,您可以在其中向项目添加另一个集合。
    Adding a second collection

  6. 重复上述步骤以将第二个 PDF 文件添加为名为 Discovery docs part 2的集合。

上载数据后,将由 Discovery对其进行处理和建立索引。 在处理数据时,让我们创建我们的虚拟助手。

创建助手

对于本教程,您将创建具有单个操作的助手。 首先,必须创建 watsonx Assistant 服务实例。

Lite 和 Trial 套餐 watsonx Assistant 服务实例免费提供。 您将创建试用计划。

  1. 从新的 Web 浏览器选项卡,返回到 IBM Cloud 目录。

    保持 Discovery 页面在单独的选项卡中打开,以便您可以在两个应用程序之间切换。

  2. 从 IBM Cloud 目录中的 watsonx Assistant 资源页面,在达拉斯位置创建试用套餐 watsonx Assistant 服务实例。

  3. 从 IBM Cloud中的 watsonx Assistant 套餐服务页面,单击 启动 watsonx Assistant

    此时将显示 watsonx Assistant 产品用户界面,您可以在其中创建第一个助手。

  4. 添加 Discovery expert 作为助手名称,然后单击 下一步

  5. 如果要求您共享有关您和助手的信息,请填写必填字段,然后单击 下一步

    创建助手时,将自动为您创建 Web 聊天应用程序。

  6. 单击 创建 以创建助手和相应的 Web 聊天应用程序。

在贺信之后,将显示新助手的主页。

显示助手页面
助手主页* 显示助手

在向新助手添加任何内容之前,请先检查数据的状态。

准备数据以进行检索

为了提高 PDF 文件中信息的可检索性,您将把 PDF 文件拆分为许多较小的文档。 为此,您将首先向 Discovery 传授 PDF 文件的结构,以便了解如何格式化子节以及如何按子节拆分文档。

  1. 返回到显示 Discovery 项目的 Web 浏览器选项卡。

    将显示您上载的最后一个 PDF 文件的“改进和定制”页面。

  2. 从“改进工具”面板中,展开 定义结构,然后单击 新建字段

    在假网页中显示聊天机器人预览*
    定义
    的工具* 在假网页中显示聊天机器人预览

  3. 选择 Discovery docs part 1 集合。

    此时将显示“标识字段”选项卡,您可以在其中选择要使用的“智能文档理解”模型的类型。

  4. 单击 用户训练的模型,然后单击 提交

    在假网页中显示聊天机器人预览
    创建用户训练
    * 在假网页中显示聊天机器人预览

  5. 单击应用更改并重新处理

    发生某些处理后,将在“智能文档理解”工具中显示文档的表示。 该工具向您显示原始文档的视图以及文档的表示,其中文本将替换为块。 块表示字段类型。

    最初,这些块被标记为 text,因为缺省情况下所有文档内容都被视为标准文本,并在 text 字段中建立索引。

    我们希望将所有第一级和第二级标题都标记为字幕而不是文本。

  6. 在缩略图视图中,单击文档中第一个全文页面的缩略图,以打开具有实际内容的第一个页面。

    显示 "智能文档理解 "工具
    智能文档理解 "
    *“智能文档理解”工具

  7. 要对文档进行注释,请单击 字段标签 列表中的 subtitle 标签。 然后,单击表示标题的 PDF 页面表示中的每个块,以将其标签从 text 更改为 subtitle

    在 SDU 工具中显示带标签的字幕*{: caption="字幕标签* 在 SDU 工具中显示带标签的字幕应用字幕" caption-side="bottom"} 应用字幕标签

  8. 在标注当前页面上的每个子标题后,单击 提交页面

    将显示 PDF 文件的下一页。

    在 SDU
    中显示标注字幕*下一页显示标注字幕

  9. 重复此过程,直到工具能够在将新页面装入到工具中时以一致的方式为您正确标注标题。 此时,单击 应用更改并重新处理

    祝贺您! 您已成功训练可识别文档中的子标题的“智能文档理解”(SDU) 模型。 让我们将同一模型应用于您添加到项目的其他 PDF 文件。

  10. 从 SDU 编辑器工具栏中,单击页面标题中的溢出菜单图标 垂直溢出菜单图标,然后选择 导出模型

  11. .sdumodel 文件保存到系统中您可以立即再次访问该文件的位置。

  12. 在导航面板中,单击 管理集合,然后打开 发现文档部分 2 集合。

  13. 打开“识别字段”选项卡。

  14. 单击 用户训练的模型,然后单击 提交

  15. 单击应用更改并重新处理

  16. 从 SDU 编辑器工具栏中,单击溢出菜单图标 垂直溢出菜单图标,然后选择 导入模型,然后单击 选择模型

  17. 浏览以查找先前下载的 .sdumodel 文件,然后单击 打开

  18. 单击 应用更改并重新处理 以将同一 SDU 模型应用于第一个集合。

Discovery 重新处理其索引中的数据以识别文档中的子标题。 在重新处理数据时,让我们创建我们的答案生成器。

创建 NeuralSeek 服务实例

您可以使用 watsonx Assistant 中的搜索扩展将助手直接连接到 Discovery,并直接从数据源返回段落。 但是,我们将在本教程中的 watsonx Assistant 和 Discovery 之间添加 NeuralSeek 服务。 NeuralSeek 从 Discovery 检索段落,然后将其转换为听起来更对话的答案。

  1. 从新的 Web 浏览器选项卡,返回到 IBM Cloud 目录。

    在不同的选项卡中保持其他服务的页面处于打开状态,以便您可以在不同的服务实例之间进行切换。

  2. 从 IBM Cloud 目录中的 NeuralSeek 资源页面,创建 Lite 套餐服务实例。

  3. 在“配置”页面上,添加有关 Discovery 服务实例的详细信息并定制连接。

    • 您可以从 IBM Cloud 中的 Discovery 服务实例详情页面获取服务 URL 和 API 密钥。
    • 可从 IBM Cloud 用户界面获取项目标识。 要获取此信息,请从导航面板中单击 集成并部署。 打开“API 信息”页面,然后复制项目标识。
    • 将文档分数范围设置为 50%。
    • 将片段字符大小更改为 400。
    • 指定公司作为公司显示名称。
    • 将最小置信度百分比更改为 50。

    单击保存

拆分 PDF 文档

现在,已在 Discovery中正确对子标题建立索引,请将其用作将 PDF 文件分割为多个较小文档的基础。

  1. 返回到显示 Discovery 项目的 Web 浏览器选项卡。

  2. 打开当前集合的 管理字段 选项卡。

  3. 拆分每次出现的文档 字段中,选择 子标题,然后单击 应用更改并重新处理

    显示 "{: caption=""中的 "按字段分割 "选项分割" caption-side="bottom"}

  4. 在导航面板中,单击 管理集合,然后打开其他集合。

  5. 转至“管理字段”页面,然后在 拆分文档中的每次出现的 字段中选择 子标题

  6. 单击应用更改并重新处理

开始重新处理集合。 重建索引完成后,集合将各包含数百个文档,而不是各包含一个文档。

显示包含大量文件的收藏集
包含更多文件的收藏集* 显示包含大量文件的收藏集* 包含更
的收藏集

在重建索引时,让我们准备好我们的助手。

向助手添加扩展

将助手连接到 NeuralSeek 服务实例。

  1. 从 IBM Cloud重新打开 NeuralSeek 服务。 您可以在 资源列表AI 和 Machine Learning 部分中找到该实例。

  2. 单击 集成 选项卡,并遵循指示信息为助手设置 NeuralSeek 定制扩展。 准备好创建操作时返回到此过程。

    显示NeuralSeek实例的整合页面*
    NeuralSeek实例
    *

  3. 在 watsonx Assistant 导航面板中,单击 操作,然后单击 新建操作

  4. 选择 从模板快速启动,然后滚动以查找并单击 NeuralSeek 入门模板工具包

    显示从模板启动选项
    选择从
    快速启动*

  5. 单击 选择此入门模板工具包,然后单击 添加模板

  6. 单击以打开刚刚添加到助手的 NeuralSeek 搜索 操作。

  7. 将以下用户示例查询添加到操作中的第一步:

    What Watson Discovery project types are available and what do they do?
    
    What external data sources are supported by Watson Discovery?
    
    Can I add a custom dictionary to Watson Discovery?
    
    How do I use the Content Mining application?
    
    When should I add query expansions to my project?
    
    Which file types support Smart Document Understanding models?
    
    Can I enable optical character recognition for all file types?
    
    Does my data have to be written in English?
    

    watsonx Assistant 使用样本问题来识别其应路由到此操作的用户问题类型。

  8. 单击以打开步骤 3 进行编辑。

    然后 部分中,单击 编辑扩展

    选择 NeuralSeek,然后点击应用

    显示分机设置{: caption="设置NeuralSeek " caption-side="bottom"}

  9. 单击以打开步骤 6 进行编辑。

    此步骤显示用户可以单击以获取更多信息的链接。 我们希望此链接直接转至 IBM Cloud Docs 站点上的产品文档。

    更改锚 HTML 元素中的超文本引用,使其包含以下 URL:

    <a href="https://cloud.ibm.com/docs/discovery-data?topic=discovery-data-about" target="_blank">
    

    显示扩展设置页面{: caption="更改更多信息链接的 URL " caption-side="bottom"}

  10. 保存更改,然后单击 X 以关闭步骤。

祝贺您! 您已成功创建用于识别有关 Discovery的问题的操作,并从已连接的 NeuralSeek 扩展获取其答案。

为助手配置 Web 聊天

要预览助手,您将使用内置 Web 聊天作为与助手交互的聊天用户界面。

  1. 从 watsonx Assistant中的导航面板,单击 环境

    此时将显示草稿环境。 这将显示 Web 聊天已连接到助手。 您还可以看到 Web 聊天已连接到 NeuralSeek 扩展。

    显示 NeuralSeek 连接到助手的“环境”页面。
    Environment diagram

  2. 单击 Web 聊天 磁贴以编辑 Web 聊天。

    我们不想添加多个入门模板问题,因此我们将关闭主屏进行网络聊天。 单击主屏幕选项卡。 将切换器设置为 关闭,然后单击 保存并退出

    显示设置为“关闭”的 Web 聊天主屏。
    Web chat home screen disabled

您已准备好预览助手!

预览助手

要预览用于连接到存储在 Discovery中的数据的助手,必须从 环境 页面预览该助手。 独立预览 Web 聊天时,助手无法从 Discovery检索数据; 它需要环境资源才能连接到 Discovery。

  1. 从“环境”页面,单击 预览此环境

    将显示一个样本 Web 页面,其中包含“交谈”图标 "交谈" 图标

  2. 单击交谈图标以打开 Web 交谈窗口。

    显示网络聊天欢迎信息
    网络聊天欢迎
    *

  3. 输入以下文本问题:

    What project types are available?
    

    将返回正确的答案,并包含指向产品文档的链接。

    显示回答测试问题的助手预览
    网络聊天会返回搜索
    *

  4. 提交创建操作时没有用作查询示例的问题。

    How do you define synonyms in Watson Discovery?
    

    返回详细答案。

    显示回答测试问题的助手的另一个预览*
    聊天返回详细答案* 网络聊天返回详细

  5. (可选) 向助手提出其他问题。

    如果助手不知道答案,请重新写入问题以包含 "in Watson Discovery",从而使您更清楚地了解如何在 Discovery 中具体工作。

祝贺您! 您已成功创建了一个助手,可以通过 NeuralSeek 服务从产品文档中检索信息来回答有关 Discovery 的问题。

摘要

在本教程中,您创建了 Watson Discovery 文档检索项目,该项目包含包含 Discovery 产品文档的已上载 PDF 文件。 另外,您创建了具有单个操作的 watsonx Assistant 虚拟助手,该操作可识别有关 Discovery的用户问题。 您向助手添加了一个定制扩展,用于连接到名为 NeuralSeek 的第三方服务,该服务从 Discovery 获取正确的答案,并重新生成响应。 最后,您对虚拟助手进行了测试,提出了问题并获得了准确且书面的响应。

后续步骤

您创建的助手可从草稿环境中获取。 接下来,您可以将助手发布到生产环境并进行部署。 您可以通过多种方式部署助手。 有关更多信息,请参阅 概述: 预览和发布