扩展查询的含义
您可以通过扩展客户提交的查询的含义来提高搜索结果的质量。
要将查询范围扩展到完全匹配之外,请向集合添加同义词列表。 定义同义词时,客户不需要提交训练您的项目以了解的准确短语或关键字。 即使是该术语的变体也会被识别并用于找到最佳结果。 例如,您可以展开 ibm
的查询以包含 international business machines
和 big blue
。 查询扩展词通常是同义词、反义词或常见拼写错误。
为改进搜索结果功能而添加的同义词与添加到字典的同义词不同。 在摄入文档时,将识别并标记字典同义词。 您定义的同义词将被识别并标记为出现关联的字典词汇,以便稍后可以通过搜索来检索这些同义词。 有关添加在处理文档时识别的同义词的更多信息,请参阅 字典。
可以定义两种类型的扩展:
- 双向
-
expanded_terms
列表中的每个条目都将展开以包含所有展开的术语。 例如,查询ibm
扩展为ibm OR international business machines OR big blue
。双向示例:
{ "expansions": [ { "expanded_terms": [ "ibm", "international business machines", "big blue" ] } ] }
- 单向
-
查询中的
input_terms
替换为expanded_terms
。 例如,banana
的查询将转换为plantain OR fruit
,并且不包含原始术语banana
。 如果要将输入词汇包含在查询中,请在展开的词汇列表中重复输入词汇。单向示例:
{ "expansions": [ { "input_terms": [ "banana" ], "expanded_terms": [ "plantain", "fruit" ] }, { "input_terms": [ "car" ], "expanded_terms": [ "car", "automobile", "vehicle" ] } ] }
要启用查询扩展,请完成以下步骤:
-
创建同义词列表文件。 该文件必须是具有
json
文件扩展名的 JSON 文件。请遵循以下准则:
- 以小写形式指定
input_terms
和expanded_terms
。 小写术语会扩展为大写。 - 同义词文件不能包含指定为停用词的术语。 例如,如果您的停用词文件中包含
on
,而在同义词文件中指定rotfl
扩展为rolling on the floor laughing
,则扩展后的结果将不会符合预期。 检查缺省情况下集合所使用的停用词文件中的词,以确保不使用任何相同的词。 有关更多信息,请参阅 识别要忽略的词。
在构建查询扩展列表时,可以使用 expansions.json 文件作为起点。
- 以小写形式指定
-
从导航窗格中,打开“改进和定制”页面。
-
从“改进工具”窗格展开 改进相关性。
-
单击 同义词,然后单击集合的 上载同义词。
将文档添加到集合时,请勿上载同义词文件。 添加文档时发生的摄入处理可能会导致索引不可用。
每个集合只能上载一个同义词列表。 如果上载了第二个扩展列表,那么第二个列表将替换第一个扩展列表。
-
运行测试查询以验证查询扩展是否按预期工作。
查询扩展在查询时应用,而不是在建立索引期间应用,因此您可以添加同义词,而无需重新处理集合。
要禁用查询扩展,请删除同义词文件。 但是,在处理新文档时,请勿删除同义词文件。