IBM Cloud Docs
照会の意味の拡張

照会の意味の拡張

顧客によって送信される照会の意味を拡張することで、検索結果の品質を向上させることができます。

完全一致を超えて照会の範囲を拡張するには、コレクションに同義語リストを追加します。 シノニムが定義されている場合、顧客は、プロジェクトが理解するようにトレーニングされている正確な語句またはキーワードを送信する必要はありません。 用語のバリエーションも認識され、最良の結果を見つけるために使用されます。 例えば、 ibm の照会を展開して、 international business machinesbig blue を含めることができます。 クエリ拡張用語は、通常、用語の同義語、反意語、または一般的なスペルミスです。

検索結果の機能を改善するために追加するシノニムは、辞書に追加するシノニムとは異なります。 辞書の同義語は、文書の取り込み時に認識され、タグ付けされます。 定義したシノニムは、関連する辞書用語のオカレンスとして認識され、タグ付けされるため、後で検索によって取得できます。 文書の処理時に認識される同義語の追加について詳しくは、「 辞書」を参照してください。

以下の 2 つのタイプの拡張を定義できます。

双方向

expanded_terms リストの各項目が展開され、展開されたすべての用語が含まれます。 例えば、 ibm へのクエリは ibm OR international business machines OR big blue に展開されます。

両方向の例:

{
  "expansions": [
    {
      "expanded_terms": [
        "ibm",
        "international business machines",
        "big blue"
      ]
    }
  ]
}
単一方向

クエリ内の input_termsexpanded_terms に置き換えられます。 例えば、 banana の照会は plantain OR fruit に変換され、元の用語 banana は含まれません。 入力用語を照会に含める場合は、拡張された用語リストで入力用語を繰り返します。

単一方向の例:

{
  "expansions": [
    {
      "input_terms": [
        "banana"
      ],
      "expanded_terms": [
        "plantain",
        "fruit"
      ]
    },
    {
      "input_terms": [
        "car"
      ],
      "expanded_terms": [
        "car",
        "automobile",
        "vehicle"
      ]
    }
  ]
}

クエリ拡張を有効にするには、以下の手順に従います

  1. シノニム・リスト・ファイルを作成します。 このファイルは、ファイル拡張子が json の JSON ファイルでなければなりません。

    以下のガイドラインに従ってください。

    • input_terms および expanded_terms は小文字で指定します。 小文字の用語は大文字に拡張されます。
    • シノニム・ファイルには、ストップワードとして指定された用語を含めることはできません。 例えば、 on がストップワードファイルに含まれており、 rotflrolling on the floor laughing に展開されると類義語ファイルで指定されている場合、展開は期待通りの結果を返さないでしょう。 デフォルトでコレクションで使用されているストップワード・ファイル内のワードを調べて、同じワードを使用していないことを確認してください。 詳しくは、 無視する単語の識別 を参照してください。

    照会拡張リストを作成する際の開始点として、 expansions.json ファイルを使用できます。

  2. ナビゲーション・ペインで、 「改善とカスタマイズ (Improve and customize)」 ページを開きます。

  3. 「改善ツール」ペインから 「関連性の改善 (Improve relevance)」 を展開します。

  4. 「同義語」 をクリックしてから、コレクションの 「同義語のアップロード」 をクリックします。

    文書がコレクションに追加されている間は、シノニム・ファイルをアップロードしないでください。 文書の追加時に行われる取り込み処理により、索引が使用できなくなる可能性があります。

    コレクションごとにアップロードできるシノニム・リストは 1 つのみです。 2 番目の展開リストがアップロードされると、2 番目のリストが 1 番目のリストに置き換わります。

  5. テスト照会を実行して、照会拡張が予期したとおりに機能していることを確認します。

    照会拡張は索引付け時ではなく照会時に適用されるため、コレクションを再処理せずに同義語を追加できます。

クエリ展開を無効にするには、シノニムファイルを削除します。 ただし、新しい文書が処理されている間は、シノニム・ファイルを削除しないでください。