会话式搜索
另加 企业 IBM Cloud Pak for DataIBM Software Hub
从 2024 年 6 月 1 开始,除了您的 Plus 或 Enterprise 套餐外,附加组件费用适用于使用 Conversational search 功能。 有关定价套餐的更多信息,请参阅 定价套餐。 有关术语的更多信息,请参阅 术语。
此功能适用于数据隔离计划的企业版。
使用对话式搜索与搜索集成,IBM Watson® Discovery Elasticsearch、自定义搜索或 Milvus,帮助您的助手从排名最高的查询结果中提取答案,并返回文本响应给用户。
启用此功能时,将向 IBM watsonx 生成 AI 模型提供搜索结果,该模型生成对用户问题的会话式回复。
watsonx 生成式 AI 模型仅托管在达拉斯和法兰克福地区。 缺省情况下,除 Frankfurt
以外的所有区域中的助手都使用 Dallas
区域中的模型。 Frankfurt
区域中的助手使用在 Frankfurt
区域中托管的模型。
准备工作
您必须配置搜索集成以启用会话式搜索功能。 有关配置 IBM Watson® Discovery 搜索集成的更多信息,请参阅 Discovery 搜索集成设置。 有关配置 Elasticsearch 集成的更多信息,请参阅 Elasticsearch 搜索集成设置。
启用会话式搜索
您可以启用会话式搜索以提供对客户查询的准确响应。 此外,您可以通过放置引文标题来启用引文,该标题提供了助手从中拉取响应的源内容的引用列表。 您可以在对话式响应和引文之间查看引文标题。
要启用会话式搜索,请执行以下步骤:
-
进入搜索整合窗口。
-
将 对话式搜索 切换开关设置为
On
。 -
利用语境感知功能,根据语境选择会话搜索类型。
- 单轮对话式搜索
对于只需要当前输入即可检索搜索结果并生成答案的上下文,请选择 单次。
- 使用整个对话进行会话搜索
对于可能考虑先前输入内容的与上下文相关的问题,请选择 “整个对话”。
整个对话使用整个会话继续进行。 这可能会让人想起不再属于谈话范围的话题。
-
在 定义引文标题的文本中,输入
How do we know?
。仅当 对话式搜索 切换切换到
On
时,才会启用 定义引文标题的文本。Web 聊天集成不支持引文标题功能。
-
在 我不知道的趋势中,选择要使用的趋势。 缺省情况下,选择了
Less often
。 -
单击保存。
对话式搜索
调整会话式搜索的倾向,说“我不知道”
您可以在会话式搜索中调整助手的“我不知道”倾向,方法是在 我不知道的倾向 部分中选择下列其中一个选项:
Rarely
Less often
More often
Most often
当助手生成会话式搜索响应时,它会评估响应并计算响应置信度分数。 助手会将响应置信度分数与 我不知道的趋势 部分中的选择进行比较。 如果响应置信度分数相对较高,那么助手将使用生成的响应来响应用户查询。 如果响应置信度分数相对较低,那么助手将执行下列其中一项操作:
- 回复“我不知道”
- 根据助手中的 搜索路径配置,返回到“无匹配项”操作
Table 1. Tendency to say “I don’t know” options
显示了 "我不知道 "倾向部分的可用选项。
倾向说“我不知道” | 响应置信度阈值 | 助手行为 |
---|---|---|
Rarely |
最低 | 助手很少说“我不知道”,因为它将响应置信度分数与最低阈值进行比较。 因此,您的助手几乎总是对用户做出预设的回应。 然而,助手很可能向用户提供不准确或不相关的回复。 |
Less often |
下限 | 与 Rarely 选项相比,助手更常说“我不知道”。 |
More often |
更高 | 与 Less often 选项相比,助手更常说“我不知道”。 |
Most often |
最高 | 助手表示“我不知道”的频率高于 More often 选项,因为它将响应置信度分数与最高阈值进行比较。 然而,助手很可能会为用户提供准确或相关的答复。 此外,助手会向用户提供较少生成的响应,并且更经常使用“我不知道”消息进行响应,或者回退到“无匹配”操作。 |
在对话式搜索中调整生成回复的长度
IBM Watson Assistant 中生成的响应长度功能可自定义响应长度,以最大限度地满足您的需求。
您可以选择三种回复长度:简洁、适中和冗长。 该功能可调整助手回复的长度,以更好地满足您在对话搜索中的需求。 默认设置是中等,但您可以根据需要更改:
响应长度 | 描述 |
---|---|
Concise |
回复较短,直奔主题,非常适合直接询问。 |
Moderate |
答复既详细又简洁,适合大多数一般性询问。 |
Verbose |
答复可提供更详细、更全面的信息,适用于复杂的查询或需要详尽解释的情况。 |
回复长度功能会影响 watsonx Assistant 生成的平均回复长度。 虽然它的目标是与指定长度相匹配,但由于用户输入的复杂性和大语言模型(LLM)的固有局限性,实际响应会有所不同。
配置助手以使用会话式搜索
启用 对话式搜索后,必须配置 搜索路由 设置,以在没有任何操作与用户响应匹配时将助手响应路由到对话式搜索。 有关 搜索路由 配置的更多信息,请参阅 在没有操作匹配时配置搜索路由 主题。 要配置助手以路由到特定主题或操作的会话式搜索,您可以 将搜索作为新操作或现有操作中的步骤添加。
当助手未收到来自 Elasticsearch 或 Discovery 的搜索结果以响应用户查询时,或者当其与 Elasticsearch 或 Discovery 的连接失败时,助手会以失败消息响应用户。 您可以在 搜索集成 设置中为无搜索结果和失败连接配置故障消息。
测试会话式搜索
您可以在操作预览,预览页面或使用预览链接来测试会话式搜索。
在此示例中,用户询问 Tell me about a custom extension
。 当会话式搜索为 Off
时,将从知识库中提取搜索结果。 在这种情况下,答案将作为与定制扩展相关的卡的列表返回。

当会话式搜索为 On
时,将从知识库中拉取相同的搜索结果。 结果将传递到 IBM watsonx 生成 AI 模型。 此模型以有关定制扩展的文本响应的形式生成对用户问题的会话式回复。

调试对话式搜索中的故障
如果对话式搜索失败,您可能需要查看系统API发送和返回的详细信息,以调试问题。
更多信息,请参阅 对话式搜索故障排除
用于会话式搜索的流式响应
会话式搜索的流式响应使用 watsonx.ai 功能在助手中提供连续的实时响应。 缺省情况下,将对 Web 交谈和助手预览面板禁用流式响应。
通过使用流式响应支持功能,可以减少响应的等待时间。
启用流式响应:
- 转至 主页 > 预览 > 定制 Web 交谈。
- 点击 “样式”选项卡。
- 将流媒体切换到
On
。 - 单击保存并退出。