IBM Watson® Discovery 搜索集成设置
另外 IBM Cloud Pak for Data IBM Software Hub
搜索整合功能可搜索您使用 Discovery 服务创建的数据集中的信息。
Discovery 是一种用于搜寻、转换和规范化非结构化数据的服务。 该产品会应用数据分析和认知直觉来扩充数据,以便您日后可以更轻松地在其中查找和检索有意义的信息。 要了解有关 Discovery的更多信息,请参阅 产品文档。
搜索集成需要 Discovery v2。 有关更多信息,请参阅 从 Discovery 获取最大。
通常,添加到 Discovery 以及通过助手访问的数据集合的类型包含您公司拥有的信息。 这些专有信息可能包括常见问题、销售宣传材料、技术手册或主题专家撰写的文章。 挖掘这种密集型专有信息集合,可快速找到客户问题的答案。
观看提供搜索集成概述的 4 分钟视频:
准备工作
开始之前,您必须:
- 在 IBM Cloud 上或安装在 IBM Cloud Pak for Data上设置 Discovery v2 实例。
- 至少具有针对 IBM Cloud的 Plus 套餐 Discovery 服务实例。 转至 IBM Cloud 目录中的 Discovery 页面,并创建 Plus 套餐服务实例。
- 使用公共端点。 watsonx Assistant 或经典体验当前不支持专用端点。
创建搜索集成或搜索技能
要创建搜索集成,请执行以下操作:
-
从要添加搜索的助手中,单击 集成。
如果您是具有付费套餐的用户,那么可以添加搜索。
-
在 扩展 部分中,找到“搜索”,单击 添加,然后单击 确认。
如果您正在使用经典体验,请添加搜索技能:
-
从要添加技能的助手中,单击 添加搜索技能。
-
请执行下列其中一项操作:
-
要创建新的搜索技能,请停留在 “创建技能”选项卡上。
-
如果已创建搜索技能,那么将显示 添加现有技能 选项卡,您可以单击以添加现有技能。
-
-
指定新技能的详细信息:
- 名称:长度不超过 64 个字符的名称。 名称是必填的。
- 描述:长度不超过 128 个字符的可选描述。
连接到现有 Discovery 实例
-
选择要从中抽取信息的 Discovery 服务实例。
如果您看到警告,提示您的某些 Discovery 服务实例没有设置凭据,这意味着您至少可以访问一个从未在 IBM Cloud 仪表板中打开过的实例。 您必须访问要为其创建的凭证的服务实例,并且凭证必须存在,watsonx Assistant 才能代表您与 Discovery 服务实例建立连接。 如果您认为列表中缺少某个 Discovery 服务实例,请直接在 IBM Cloud® 仪表板中打开该实例以生成其凭证。
-
通过执行下列其中一个操作,指示要使用的数据集合:
-
请选择现有的项目。
在决定使用哪个项目之前,您可以点击打开 Discovery 图标查看项目的配置。
转至配置搜索。
-
如果您没有项目或不想使用列出的任何项目,请单击创建新项目以添加项目。 遵循 创建项目 中的步骤。
如果已达到基于 Discovery 服务套餐的限制,那么不会显示 创建新项目。 请参阅 Discovery 定价套餐 以获取套餐限制详细信息。
-
创建项目
-
在“确定,数据在何处?”页面上,选择数据源,然后单击 下一步。 可供选择的例子包括Salesforce、SharePoint,Box、IBM Cloud Object Storage、网络抓取和上传数据。
-
在“让我们为数据创建集合”页面上,输入有关如何连接到数据和配置集合的信息。 您需要输入的信息因数据源而异。 例如,您需要输入 Salesforce,Sharepoint 和 Box 等服务的认证凭证。 对于 Web 搜寻,使用现有信息指定 Web 站点。
-
单击完成。 请给 Discovery 几分钟时间来创建文档。 您可以使用项目中的“管理集合”页面来查看进度。
-
等待完全采集集合,然后单击 返回到 watsonx Assistant。
配置搜索
-
在 watsonx Assistant 搜索集成页面上,验证是否选择了要使用的 Discovery 实例和项目,然后单击 下一步。
-
在 配置结果内容 部分中,查看在向客户显示的搜索结果中使用的 Discovery 字段和示例。 您可以接受缺省值,也可以根据需要定制缺省值。
哪些集合字段适合用来抽取数据,取决于集合的数据源以及数据源的扩充方式。 选择数据集合类型后,集合字段值会使用源字段预填充,这些源字段被视为最有可能包含给定集合数据源类型的有用信息。 但是,您比任何人都更了解您的数据。 因此,您可以将源字段更改为包含能满足您需求的最佳信息的字段。
要了解有关您收藏的文件结构的更多信息,包括包含您可能想要提取的信息的字段名称,请在 Discovery 中打开收藏,然后使用 “身份” 和 “管理”选项卡。
每个搜索结果可由以下各部分组成:
-
标题:搜索结果标题。 使用集合中字段的标题、名称或类似类型的字段作为搜索结果标题。
必须为标题选择某些内容,否则在 Facebook 和 Slack 集成中不会显示搜索结果响应。
-
主体:搜索结果描述。 使用集合中的梗概、摘要或要点字段作为搜索结果主体。
必须为主体选择某些内容,否则在 Facebook 和 Slack 集成中不会显示搜索结果响应。
-
URL:可以使用要包含在搜索结果末尾的任何页脚内容来填充此字段。
例如,您可能希望在数据源中包含指向原始数据对象的超文本链接。 大多数联机数据源提供了用于存储中对象的自引用公共 URL,以支持直接访问。 如果添加 URL,该 URL 必须有效且可访问。 如果不是,Slack集成在响应中不会包含 URL,而Facebook集成不会返回任何响应。
URL 字段为空时,Facebook 和 Slack 集成可以成功显示搜索结果响应。
必须对至少一个搜索结果使用字段。
如果下拉字段中没有可用的选项,请给 Discovery 更多时间来完成创建集合的操作。 如果未创建收藏,则您的收藏可能不包含任何文档,或者可能存在需要先解决的提取错误。
添加字段映射后,将显示搜索结果的预览,其中包含数据集合的相应字段中的信息。 此预览显示返回给用户的搜索结果响应中包含的内容。
要获取有关配置搜索的帮助,请参阅故障诊断。
-
-
使用 消息,找不到结果 和 连接问题 选项卡来定制不同的消息,以便根据搜索的成功程度与用户共享。
搜索结果消息 制表符 场景 示例消息 消息 返回了搜索结果 I found this information that might be helpful:
找不到结果 找不到任何搜索结果 I searched my knowledge base for information that might address your query, but did not find anything useful to share.
连接问题 由于某种原因,无法完成搜索 I might have information that could help address your query, but am unable to search my knowledge base at the moment.
-
选择是否启用 强调答案。
仅当 Discovery 实例使用 v2 Discovery API 时,此选项才可用。
启用此功能时,由 Discovery 确定为客户问题的准确答案的语句将突出显示在作为搜索结果向客户显示的文本块中。
-
在 调整结果数量 部分中,指定要返回的结果数。
将自动返回前三个结果。 您可以选择显示更少或更多(最多10个)结果。
缺省情况下,客户可以选择查看更多结果。 如果您不希望为客户提供此选项,请清除为客户提供链接来查看最多 10 个结果复选框。
-
在 设置结果选择性 部分中,决定是否对返回的答案进行更多选择性处理。 通过增加结果选择性,“搜索”返回更少但更准确的结果。 在大多数情况下,“搜索”足够准确,以至于缺省设置 (关闭) 足够。
-
使用 定制结果过滤器 为搜索集成中的定制文本字符串添加过滤器。 定制结果过滤器 字段可帮助您定义与主题,产品或文本字符串相关的搜索结果。 例如,如果您通过唱
enriched_text.entities.text:"Boston, MA"
来定义 定制结果过滤器 字段,那么将对助手中任何查询的搜索响应进行过滤,以使其与enriched_text.entities.text
文件中的"Boston, MA"
相关。 -
点击预览。 输入测试消息以查看将配置选项应用于搜索时会返回的结果。 根据需要进行调整。
-
单击创建。
编辑搜索集成配置
如果您想稍后更改搜索结果卡的配置,请再次打开搜索集成并进行编辑。 您无需边更改边保存;更改会自动应用。 当您对搜索结果满意时,请点击保存以完成搜索整合的配置。
如果您决定要连接到其他 Discovery 服务实例或项目,请打开搜索集成并单击 编辑发现设置。 您可以从同一实例中选择新项目,也可以选择新的实例和项目。
配置助手以使用 Discovery 搜索
配置 Discovery 搜索集成后,必须将助手配置为在客户响应未与任何操作匹配时使用 Discovery 搜索。 有关更新 无匹配 以使用搜索的更多信息,请参阅 无操作匹配时使用搜索。
故障诊断
查看此信息,了解常见任务的帮助。
-
创建 Web 搜寻数据集合:创建 Web 搜寻数据源时要了解的事项:
- 要增加可用于数据集合的文档数,请单击“添加 URL 组”,在其中会列出要搜寻但并未从初始种子 URL 链接到的页面的 URL。
- 要减少可用于数据集合的文档数,请指定基本 URL 的子域。 或者在网页抓取设置中,限制从原始网页跳转的次数。 您还可以指定要从搜寻中显式排除的子域。
- 如果等待了几分钟并刷新页面后仍未列出任何文档,请确保要摄入的内容可从 URL 的页面源中获取。 某些 Web 页面内容是动态生成的,因此无法进行搜寻。
-
为上传的文档配置搜索结果:如果使用的是已上传文档的集合,并且无法获取正确的搜索结果或结果不够简明,请考虑在创建数据集合时使用智能文档理解。
您可以根据文本格式对文档进行注释。 例如,可以指导 Discovery 学会任何 28 磅粗体字体的文本都是文档标题。 如果在摄入时将此信息应用于集合,那么日后可以使用 title 字段作为搜索结果的标题部分的源。
您还可以使用智能文档理解将大文档拆分成更易于搜索的分段。 有关更多信息,请参阅 Discovery 文档中的 智能文档理解 主题。
-
我的回复文本被括号括住:如果您在预览时注意到您的回复文本被括号和引号(
["My response text"]
)括住,例如,您可能需要更改配置中使用的源字段。 意外格式设置指示该值以数组形式存储在源文档中。 从中抽取文本的任何字段都必须包含 String 数据类型的值,而不是 Array 数据类型的值。 如果聊天集成显示的响应是从将数据存储为数组的字段中抽取的,那么聊天集成会直接将数组值转换为字符串,这将生成包含数组语法的响应。例如,源文档中的字段可能包含将单个文本值作为其唯一数组元素的数组:
"title": ["a single array element"]
该数组值由 watsonx Assistant 转换为以下字符串值:
"title": "[\"a single array element\"]"
因此,在聊天中字符串以下列格式返回;这将显示括起字符串的方括号和引号:
["a single array element"]
如果看到这种情况发生,请考虑选择其他集合字段来从中抽取搜索结果。
Discovery 文档的
highlight
字段以数组形式存储值。
后续步骤
首次添加搜索集成后,它将作为磁贴显示在“草稿环境”页面上。 单击磁贴以查看或编辑搜索配置。
准备就绪后,可以重复这些步骤以将搜索集成添加到 Live 环境 或其他环境 (如果您使用的是 多个环境)。
测试搜索集成
配置搜索后,可以使用“预览”页面发送测试查询以查看从 Discovery 返回的搜索结果。
要测试客户在提出由操作回答的问题或触发搜索时的完整体验,请对助手使用 预览。
在经典体验中测试搜索技能
如果在经典体验中使用搜索技能,那么可以使用搜索技能的“预览”窗格发送测试查询以查看从 Discovery 返回的搜索结果。
为了测试客户在对话框提问或触发搜索时所获得的完整体验,请使用助手的预览按钮。
无法在对话的“试用”窗格中测试完整的端到端用户体验。 搜索技能是单独配置并连接到助手的。 对话技能无法了解搜索的详细信息,因此无法在其“试用”窗格中显示搜索结果。
配置至少一个集成通道来测试搜索技能。 在通道中,输入用于触发搜索的查询。 如果从对话启动了任何类型的搜索,请测试对话以确保搜索按预期触发。 如果未使用搜索响应类型,请测试是否仅当没有现有对话节点可以处理用户输入时,才会触发搜索。 在任何时候触发搜索时,确保该搜索会返回有意义的结果。
向搜索技能发送更多请求
如果希望降低对话技能的响应频率,而改为向搜索技能发送更多查询,那么可以配置对话来实现这一点。
您必须向助手添加了对话技能和搜索技能,此方法才有效。
遵循以下过程,通过将置信度级别阈值从缺省设置 0.2 重置为 0.5,以降低对话的响应可能性。 将置信度级别阈值更改为 0.5,即指示助手不要使用对话中的回答进行响应,除非助手对于确信对话可以理解用户意向并可以进行处理的置信度超过 50%。
-
在对话技能的对话页面中,确保对话树中的最后一个节点具有
anything_else
条件。每当处理此节点时,都会触发该搜索技能。
-
向对话添加一个文件夹。 使该文件夹位于要取消强调的第一个对话节点之前。 向该文件夹添加以下条件:
intents[0].confidence > 0.5
此条件将应用于该文件夹中的所有节点。 仅当助手对于确信自己理解用户意向的置信度至少为 50% 时,此条件才会指示助手处理该文件夹中的节点。
-
将不希望助手经常处理的任何对话节点移入该文件夹中。
更改对话后,测试助手以确保搜索技能的触发频率与您希望的相符。
另一种方法是指导对话学习要忽略的主题。 为此,可以将希望助手立即发送到搜索技能的话语添加为对话技能的“试用”窗格中的测试话语。 然后,可以选择“试用”窗格中的标记为不相关选项,以指导对话学会不对此话语或类似的其他话语进行响应。 有关更多信息,请参阅指导助手学习要忽略的主题。
禁用搜索技能
可以禁止触发搜索技能。
设置集成时,您可能希望暂时禁止触发搜索技能。 或者,您可能希望仅针对可以在对话中识别到的特定用户查询触发搜索,并使用搜索技能响应类型进行回答。
要阻止触发搜索技能,请完成以下步骤:
- 在助手页面中,单击助手的菜单,然后选择设置。
- 打开“搜索技能”页面,然后将开关设置为 已禁用。