IBM Cloud Docs
扩展查询的含义

扩展查询的含义

您可以通过扩展客户提交的查询的含义来提高搜索结果的质量。

要将查询范围扩展到完全匹配之外,请向集合添加同义词列表。 定义同义词时,客户不需要提交训练您的项目以了解的准确短语或关键字。 即使是该术语的变体也会被识别并用于找到最佳结果。 例如,您可以展开 ibm 的查询以包含 international business machinesbig blue。 查询扩展词通常是同义词、反义词或常见拼写错误。

为改进搜索结果功能而添加的同义词与添加到字典的同义词不同。 在摄入文档时,将识别并标记字典同义词。 您定义的同义词将被识别并标记为出现关联的字典词汇,以便稍后可以通过搜索来检索这些同义词。 有关添加在处理文档时识别的同义词的更多信息,请参阅 字典

可以定义两种类型的扩展:

双向

expanded_terms 列表中的每个条目都将展开以包含所有展开的术语。 例如,查询 ibm 扩展为 ibm OR international business machines OR big blue

双向示例:

{
  "expansions": [
    {
      "expanded_terms": [
        "ibm",
        "international business machines",
        "big blue"
      ]
    }
  ]
}
单向

查询中的 input_terms 替换为 expanded_terms。 例如,banana 的查询将转换为 plantain OR fruit,并且不包含原始术语 banana。 如果要将输入词汇包含在查询中,请在展开的词汇列表中重复输入词汇。

单向示例:

{
  "expansions": [
    {
      "input_terms": [
        "banana"
      ],
      "expanded_terms": [
        "plantain",
        "fruit"
      ]
    },
    {
      "input_terms": [
        "car"
      ],
      "expanded_terms": [
        "car",
        "automobile",
        "vehicle"
      ]
    }
  ]
}

要启用查询扩展,请完成以下步骤:

  1. 创建同义词列表文件。 该文件必须是具有 json 文件扩展名的 JSON 文件。

    请遵循以下准则:

    • 以小写形式指定 input_termsexpanded_terms。 小写术语会扩展为大写。
    • 同义词文件不能包含指定为停用词的术语。 例如,如果您的停用词文件中包含 on,而在同义词文件中指定 rotfl 扩展为 rolling on the floor laughing,则扩展后的结果将不会符合预期。 检查缺省情况下集合所使用的停用词文件中的词,以确保不使用任何相同的词。 有关更多信息,请参阅 识别要忽略的词

    在构建查询扩展列表时,可以使用 expansions.json 文件作为起点。

  2. 从导航窗格中,打开“改进和定制”页面。

  3. 从“改进工具”窗格展开 改进相关性

  4. 单击 同义词,然后单击集合的 上载同义词

    将文档添加到集合时,请勿上载同义词文件。 添加文档时发生的摄入处理可能会导致索引不可用。

    每个集合只能上载一个同义词列表。 如果上载了第二个扩展列表,那么第二个列表将替换第一个扩展列表。

  5. 运行测试查询以验证查询扩展是否按预期工作。

    查询扩展在查询时应用,而不是在建立索引期间应用,因此您可以添加同义词,而无需重新处理集合。

要禁用查询扩展,请删除同义词文件。 但是,在处理新文档时,请勿删除同义词文件。