会話型検索 (Conversational search)

さらに企業 IBM Cloud Pak for Data IBM Software Hub

2024 年 6 月 1 日以降、プラス・プランまたはエンタープライズ・プランに加えて、会話型検索機能を使用するためのアドオン料金が適用されます。価格設定プランについて詳しくは、価格設定プランを参照してください。条件について詳しくは、条件を参照してください。

この機能は、データ分離プランのエンタープライズでご利用いただけます。

IBM Watson® Discovery、 Elasticsearch、カスタム検索、 Milvus などの検索統合を備えた会話型検索を使用すると、アシスタントが最高ランクのクエリ結果から回答を抽出し、ユーザーにテキスト応答を返すことができます。

この機能を有効にすると、ユーザーの質問に対する会話型応答を生成する IBM watsonx 生成 AI モデルに検索結果が提供されます。

watsonx 生成 AI モデルは、ダラスとフランクフルトの地域でのみホストされています。デフォルトでは、 Frankfurt 以外のすべての領域のアシスタントは、 Dallas 領域のモデルを使用します。 Frankfurt 領域のアシスタントは、 Frankfurt 領域でホストされているモデルを使用します。

開始前に

会話型検索機能を有効にするには、検索統合を構成する必要があります。 IBM Watson® Discovery 検索統合の構成について詳しくは、 Discovery 検索統合のセットアップを参照してください。 Elasticsearch 統合の構成について詳しくは、 Elasticsearch 検索統合のセットアップを参照してください。

会話型検索の有効化

会話型検索を有効にして、顧客の照会に対して正確な応答を提供することができます。また、アシスタントが応答をプルしたソース・コンテンツの参照のリストを示す引用タイトルを入力することで、引用を有効にすることもできます。会話型応答と引用の間に引用のタイトルが表示されます。

会話型検索を有効にするには、以下のステップを実行します。

検索統合ウィンドウに移動します。
「会話型検索 (Conversational search)」 トグルを On に設定します。
文脈認識を使って、文脈に基づいた会話型検索のタイプを選択する。
- シングルターンの会話型検索
検索結果の取得と回答の生成に現在の入力のみを必要とするコンテキストでは、シングルターンを選択してください。
- 会話全体を使った会話型検索
文脈に依存する質問（過去の入力内容を考慮する場合）については 、「会話全体」 を選択します。

会話全体がセッション全体を使って会話を続ける。もはや会話の範疇にない話題が甦るかもしれない。
「引用タイトルのテキストの定義」 に、 How do we know? と入力します。

「引用タイトルのテキストの定義」 は、 「会話型検索」 トグルが On に切り替えられた場合にのみ有効になります。

Web チャット統合は、引用タイトル機能をサポートしていません。
「わからないという傾向」 で、使用する傾向を選択します。デフォルトでは、 Less often が選択されています。
保存をクリックします。

会話型検索

「わからない」という会話型検索の傾向のチューニング

「わからないと言う傾向」 セクションで以下のいずれかのオプションを選択することにより、会話型検索でアシスタントが「わからない」と言う傾向を調整できます。

Rarely
Less often
More often
Most often

アシスタントが会話型検索応答を生成すると、その応答が評価され、応答信頼性スコアが計算されます。アシスタントは、 「わからないという傾向」 セクションで選択した回答の信頼性スコアと比較します。応答信頼性スコアが比較的高い場合、アシスタントは、生成された応答を使用してユーザー照会に応答します。応答信頼性スコアが比較的低い場合、アシスタントは以下のいずれかのアクションを実行します。

「わかりません」というメッセージで応答する
アシスタントの検索ルーティング構成に従って、「一致なし」アクションにフォールバックします

Table 1. Tendency to say “I don’t know” options は、 「わからない」と答える傾向のセクションで利用可能なオプションを示す。

「私は知らない」と言う傾向	応答信頼度しきい値	アシスタントの動作
`Rarely`	最低	アシスタントは、応答信頼性スコアを最低しきい値と比較するため、「I do n't know」ということはほとんどありません。そのため、アシスタントはほぼ常にユーザーに生成された応答を返します。しかし、アシスタントはユーザーに対して不正確または無関係な回答をする可能性が高い。
`Less often`	奥へ	アシスタントは、 `Rarely` オプションよりも頻繁に「I do n't know」と言います。
`More often`	高い	アシスタントは、 `Less often` オプションよりも頻繁に「I do n't know」と言います。
`Most often`	最高	アシスタントは、応答信頼性スコアを上限しきい値と比較するため、「I do n't know」の頻度が `More often` オプションよりも高いと言います。しかし、アシスタントはユーザーに対して、正確な回答または関連性の高い回答を提示している可能性が高い。さらに、アシスタントは、生成された応答をユーザーに表示する回数が少なく、「I do n't know」メッセージで応答したり、「No matches」アクションにフォールバックしたりする頻度が高くなります。

会話型検索における応答生成長の調整

IBM Watson Assistant の生成された応答長機能は、ニーズに合わせて応答長をカスタマイズします。

レスポンスの長さは、簡潔、中程度、冗長、の3種類から選ぶことができる。この機能は、会話型検索でよりニーズに合うように、アシスタントが返す返答の長さを調整します。デフォルト設定は「中程度」ですが、必要に応じて変更できます

応答の長さ	説明
`Concise`	回答は短く、要領を得たもので、率直な問い合わせに最適です。
`Moderate`	回答は詳細さと簡潔さのバランスが取れており、ほとんどの一般的な問い合わせに適している。
`Verbose`	回答は、より詳細で包括的な情報を提供し、複雑な問い合わせや徹底的な説明が必要な場合に適している。

レスポンスの長さの機能は watsonx Assistant が生成するレスポンスの平均の長さに影響します。指定された長さに合わせることを目的としているが、ユーザー入力の複雑さと大規模言語モデル（LLM）の固有の限界のため、実際の応答はさまざまである。

会話型検索を使用するためのアシスタントの構成

「会話型検索 (Conversational search)」 を有効にした後、ユーザー応答に一致するアクションがない場合にアシスタント応答を会話型検索にルーティングするように、 「検索ルーティング (Search routing)」 設定を構成する必要があります。 検索ルーティング 構成について詳しくは、「一致するアクションがない場合の検索ルーティングの構成」トピックを参照してください。特定のトピックまたはアクションの会話型検索にルーティングするようにアシスタントを構成するには、新規または既存のアクションのステップとして検索を追加します。

ユーザー照会への応答として、または Elasticsearch または Discovery への接続が失敗した場合に、アシスタントが Elasticsearch または Discovery から検索結果を受信しないと、アシスタントは失敗メッセージでユーザーに応答します。 「検索統合」 設定で、検索結果がなく、接続が失敗した場合の失敗メッセージを構成できます。

会話型検索のテスト

会話型検索は、アクション・プレビューまたはプレビュー・ページでテストすることも、プレビュー・リンクを使用してテストすることもできます。

この例では、ユーザーは Tell me about a custom extension と尋ねます。会話型検索が Off の場合、検索結果は知識ベースからプルされます。この場合、カスタム拡張に関連するカードのリストとして回答が返されます。

会話型検索が On の場合、同じ検索結果が知識ベースからプルされます。結果は、 IBM watsonx 生成 AI モデルに渡されます。このモデルは、カスタム拡張に関するテキスト応答の形式で、ユーザーの質問に対する会話型の応答を生成します。

会話型検索の障害のデバッグ

会話型検索への呼び出しが失敗した場合は、システム API に送信され、システム API から返される内容の詳細情報を確認することで、問題をデバッグできる可能性があります。

詳細については、会話型検索のデバッグエラーを参照してください

会話型検索のストリーミング応答

会話型検索のストリーミング応答では、 watsonx.ai の機能を使用して、アシスタントで継続的なリアルタイム応答を提供します。デフォルトでは、Web チャットおよびアシスタント・プレビュー・パネルのストリーミング応答は無効になっています。

ストリーミング応答サポート機能を使用すると、応答の待機時間を短縮できます。

ストリーミング応答を有効にするには：

「ホーム」 > 「プレビュー」 > 「Web チャットのカスタマイズ」 に移動します。
「スタイル」タブをクリックします。
ストリーミングのトグルを On に設定します。
**「保存して終了」**をクリックします。