IBM Cloud Docs
NeuralSeek を使用して、既存のヘルプ・コンテンツから洗練された回答を返します。

NeuralSeek を使用して、既存のヘルプ・コンテンツから洗練された回答を返します。

このチュートリアルでは、 Watson Discovery、 watsonx Assistant、および NeuralSeek サービスを使用して、 IBM Cloud の質問を作成します。 アシスタントは、知識ベースとして既存の Watson Discovery 製品資料を使用して回答を生成します。

このチュートリアルでは、 Discoveryの管理対象デプロイメントを作成するためのステップを示します。 ただし、 IBM Cloud によってホストされるか、 IBM Cloud Pak for Data にインストールされる Discovery サービス・インスタンスを作成して、それを NeuralSeek サービス・インスタンスに接続することができます。

学習目標

このチュートリアルを完了すると、以下の方法について理解できます。

  • Discoveryで文書の取得プロジェクトを作成します。
  • PDF 文書をプロジェクトにアップロードし、ユーザーがトレーニングした Smart Document Understanding モデルを PDF に適用します。
  • Discovery プロジェクトを NeuralSeek サービス・インスタンスに接続します。 NeuralSeek は、AI を活用した応答生成エンジンです。
  • watsonx Assistant でアシスタントを作成し、そのアシスタントに NeuralSeek 統合を適用します。
  • 回答のために NeuralSeek に接続するアクションを watsonx Assistant に追加します。
  • アシスタントを使用して、 Discoveryに関する質問に回答します。

NeuralSeek は、 IBM 以外のベンダーによって提供されるサード・パーティ製品であり、サード・パーティの条件に同意する場合は、お客様とサード・パーティとの間で別途契約が締結されます。 IBM は、製品に対して責任を負いません。また、製品に関してプライバシー、セキュリティー、パフォーマンス、またはその他の義務を負いません。

Duration

このチュートリアルの所要時間は約4〜5時間。

前提条件

  1. 始める前に、 IBM Cloudを使用して有料アカウントをセットアップする必要があります。

    プラス・プランを使用すると、このチュートリアルを無料で完了できます。プラス・プランでは、30 日間の試用版が無料で提供されます。 ただし、サービスのプラス・プラン・インスタンスを作成するには、有料アカウント (クレジット・カードの詳細を指定するアカウント) が必要です。 有料アカウントの作成について詳しくは、 アカウントのアップグレードを参照してください。

  2. プラス・プランの Discovery サービス・インスタンスを作成します。

    IBM Cloud カタログの Discovery リソース・ページにアクセスし、プラス・プラン・サービス・インスタンスを作成する。

    ロケーションとして 「ダラス」 を指定します。

    このチュートリアルの一部として、他のサービスもプロビジョンします。 サービスは、相互に接続できるように、同じデータ・ロケーションでホストされている必要があります。 NeuralSeek サービスはダラスからのみ使用できるため、ダラスにすべてのサービス・インスタンスを作成します。

Plusプランの使用を中止し、料金を支払いたくない場合は、30日間の試用期間が終了する前にPlusプランのサービス・インスタンスを削除してください。

製品資料を入手する

Discovery 製品資料を知識ベースとして使用するために、製品資料を PDF ファイルとしてダウンロードします。

  1. Web ブラウザーから、製品資料サイトにアクセスします。

    https://cloud.ibm.com/docs/discovery-data
    
  2. 目次パネルから、 「製品ガイド」 セクションのオーバーフロー・メニュー・アイコンをクリックし、 「PDF 形式で表示」 を選択します。

  3. ページ・ヘッダーの 「保存」 アイコンをクリックして、PDF ファイルをシステムに保存します。

  4. PDF ファイル・エディターを使用して、PDF 文書を同じサイズの 2 つの別個の PDF ファイルに分割します。

    PDF を分割すると、 Discoveryでより迅速にエンリッチできる 2 つの小さなファイルが作成されます。

文書の取得プロジェクトの作成

製品資料の最新コピーを入手したので、それをデータ・ソースとして Discovery プロジェクトに追加します。

Discoveryで、 「文書の取得 (Document Retrieval)」 プロジェクト・タイプを作成します。 このタイプのプロジェクトに追加した文書は、以下の方法で自動的にエンリッチされます。

  • 固有名詞などのエンティティーが識別され、タグ付けされます。
  • 品詞が識別され、タグ付けされます。

このタグ付き情報は、正確な応答を返すために、後で自然言語句が検索照会として送信されるときに使用されます。

  1. 新しい Web ブラウザー・ページを開きます。

  2. IBM Cloudの Discovery Plus プラン・サービス・ページで、 「 Discovery をクリックします。

  3. マイプロジェクト] ページから[ 新規プロジェクト] をクリックします。

  4. プロジェクトに Discovery documentation という名前を付け、 「文書の取得 (Document Retrieval)」 タイルをクリックします。

    プロジェクトタイプの" caption-side="bottom"}を表示します{: caption="

  5. 次へ をクリックします。

次のステップで、プロジェクトのデータ・ソースを構成します。

プロジェクトへのデータのアップロード

資料の PDF を Discovery プロジェクトに追加します。

  1. 「データ・ソースの選択」 ページで、 「データのアップロード」 タイルをクリックし、 「次へ」 をクリックします。

    からデータのアップロードオプションが選択されていることを示す

  2. コレクションに Discovery docs part 1という名前を付け、 「次へ」 をクリックします。

  3. 「ファイルをここにドラッグ・アンド・ドロップするかアップロードします」 をクリックし、先ほど作成した最初の PDF ファイルを参照して追加します。

  4. 「完了 (Finish)」 をクリックします。

    ファイルは、コレクションに追加されると処理されます。

  5. ナビゲーション・パネルで、 「コレクションの管理」 をクリックし、 「新規コレクション」 をクリックします。

    「コレクションの管理」ページを表示します。このページで、別のコレクションをプロジェクトに追加できます。
    Adding a second collection

  6. 上記のステップを繰り返して、2 番目の PDF ファイルを Discovery docs part 2という名前のコレクションとして追加します。

アップロードされたデータは、 Discoveryによって処理され、索引付けされます。 データの処理中に、仮想アシスタントを作成しましょう。

アシスタントの作成

このチュートリアルでは、単一のアクションでアシスタントを作成します。 最初に、 watsonx Assistant サービス・インスタンスを作成する必要があります。

ライト・プランとトライアル・プランの両方の watsonx Assistant サービス・インスタンスを無料で使用できます。 試行計画を作成します。

  1. 新しい Web ブラウザー・タブから、 IBM Cloud カタログに戻ります。

    Discovery ページを別のタブで開いたままにして、2 つのアプリケーションを切り替えることができるようにします。

  2. IBM Cloud カタログの watsonx Assistant リソース・ページから、ダラス・ロケーションにトライアル・プラン watsonx Assistant サービス・インスタンスを作成します。

  3. IBM Cloudの watsonx Assistant プラン・サービス・ページで、 「 watsonx Assistant をクリックします。

    watsonx Assistant 製品のユーザー・インターフェースが表示されます。ここで、最初のアシスタントを作成できます。

  4. アシスタント名として Discovery expert を追加し、 「次へ」 をクリックします。

  5. 自分とアシスタントに関する情報を共有するように求められた場合は、必須フィールドに入力して、 「次へ」 をクリックします。

    アシスタントを作成すると、自動的に Web チャット・アプリケーションが作成されます。

  6. 「作成」 をクリックして、アシスタントと対応する Web チャット・アプリを作成します。

お祝いのメッセージが表示されると、新しいアシスタントのホーム・ページが表示されます。

Shows the assistant page
Assistant home page

新しいアシスタントに何かを追加する前に、データの状況を確認しましょう。

取得のためのデータの準備

PDF ファイル内の情報を検索しやすくするために、PDF ファイルを多数の小さな文書に分割します。 これを行うには、まず Discovery に PDF ファイルの構造を学習させます。これにより、サブセクションのフォーマット設定方法を理解し、サブセクションごとに文書を分割することができます。

  1. Discovery プロジェクトが表示されている Web ブラウザー・タブに戻ります。

    最後にアップロードした PDF ファイルの 「改善とカスタマイズ (Improve and customize)」 ページが表示されます。

  2. 「改善ツール (Improvement tools)」 パネルで、 *「構造の定義 (Define structure)」*を展開し、 「新規フィールド (New fields)」 をクリックします。

    偽のウェブページでチャットボットのプレビューを表示する*" caption-side="bottom"}を定義するツールを{: caption="*

  3. 「Discovery docs part 1」 コレクションを選択します。

    「フィールドの識別」タブが表示され、使用する Smart Document Understanding モデルのタイプを選択できます。

  4. 「ユーザーがトレーニングしたモデル」 をクリックし、 「送信」 をクリックします。

    偽のウェブページでチャットボットのプレビューを表示する*ユーザー学習済み" caption-side="bottom"}を{: caption="する*

  5. **「変更を適用して再処理 (Apply changes and reprocess)」**をクリックします。

    何らかの処理が行われると、Smart Document Understanding ツールに文書の表現が表示されます。 このツールは、元の文書のビューと、文書の表現を表示します。ここで、テキストはブロックに置き換えられます。 ブロックはフィールド・タイプを表します。

    最初は、ブロックに text というラベルが付けられます。これは、すべての文書コンテンツがデフォルトで標準テキストと見なされ、 text フィールドで索引付けされるためです。

    すべての第 1 レベルおよび第 2 レベルの見出しに、テキストの代わりにサブタイトルのラベルを付けます。

  6. サムネール・ビューから、文書の最初のフルテキスト・ページのサムネールをクリックして、実際のコンテンツを含む最初のページを開きます。

    caption-side=bottom"
    スマート文書理解
    を表示します

  7. 文書にアノテーションを付けるには、 「フィールド・ラベル」 リストから subtitle ラベルをクリックします。 次に、見出しを表す PDF ページの各ブロックをクリックして、そのラベルを text から subtitle に変更します。

    SDUツールでラベル付き字幕を表示する*字幕" caption-side="bottom"}を{: caption="する*

  8. 現在のページのすべてのサブタイトルにラベルを付けた後、 「ページの送信」 をクリックします。

    PDF ファイルの次のページが表示されます。

    SDUツールにラベル付き" caption-side="bottom"}が表示されます{: caption="

  9. 新しいページがツールにロードされるときに、ツールが一貫性のある方法で見出しに正しくラベルを付けることができるようになるまで、このプロセスを繰り返します。 その時点で、 「変更を適用して再処理」 をクリックします。

    おめでとうございます! 文書内のサブタイトルを認識できる Smart Document Understanding (SDU) モデルのトレーニングが正常に完了しました。 プロジェクトに追加した他の PDF ファイルにも同じモデルを適用します。

  10. SDU エディターのツールバーから、ページ・ヘッダーのオーバーフロー・メニュー・アイコン 垂直オーバーフロー・メニュー・アイコン をクリックし、 「モデルのエクスポート」 を選択します。

  11. .sdumodel ファイルを、すぐに再度アクセスできる場所にシステムに保存します。

  12. ナビゲーション・パネルで、 「コレクションの管理 (Manage collections)」 をクリックし、 「ディスカバリー資料 (Discovery docs part 2)」 コレクションを開きます。

  13. Identify fields タブを開く。

  14. 「ユーザーがトレーニングしたモデル」 をクリックし、 「送信」 をクリックします。

  15. **「変更を適用して再処理 (Apply changes and reprocess)」**をクリックします。

  16. SDU エディターのツールバーから、オーバーフロー・メニュー・アイコン 垂直オーバーフロー・メニュー・アイコン をクリックし、 「モデルのインポート」 を選択して、 「モデルの選択」 をクリックします。

  17. 以前にダウンロードした .sdumodel ファイルを参照して見つけ、 「開く」 をクリックします。

  18. 最初のコレクションに同じ SDU モデルを適用するには、 「変更を適用して再処理 (Apply changes and reprocess)」 をクリックします。

Discovery は、索引内のデータを再処理して、文書内のサブタイトルを識別します。 データが再処理されている間に、回答生成プログラムを作成しましょう。

NeuralSeek サービスインスタンスの作成

watsonx Assistant で検索拡張を使用して、アシスタントを Discovery に直接接続し、データ・ソースから直接パッセージを返すことができます。 ただし、このチュートリアルでは、 NeuralSeek サービスを watsonx Assistant と Discovery の間に追加します。 NeuralSeek は、 Discovery からパッセージを取得し、より会話に聞こえる回答に変換します。

  1. 新しい Web ブラウザー・タブから、 IBM Cloud カタログに戻ります。

    他のサービスへのページを別々のタブで開いたままにして、異なるサービス・インスタンス間で切り替えることができるようにします。

  2. IBM Cloud カタログの NeuralSeek リソース・ページから、ライト・プラン・サービス・インスタンスを作成します。

  3. 「構成」 ページで、 Discovery サービス・インスタンスに関する詳細を追加し、接続をカスタマイズします。

    • サービスの URLと APIキーは、 Discovery IBM Cloud サービスインスタンス詳細ページから取得できます。
    • プロジェクト ID は、 IBM Cloud ユーザー・インターフェースから入手できます。 これを取得するには、ナビゲーション・パネルから 「統合とデプロイ」 をクリックします。 「API 情報」 ページを開き、プロジェクト ID をコピーします。
    • 文書スコア範囲を 50% に設定します。
    • スニペット文字サイズを 400 に変更します。
    • 会社の表示名として会社を指定します。
    • 最小信頼度を 50 に変更します。

    保存 をクリックします。

PDF 文書の分割

Discoveryでサブタイトルが適切に索引付けされたので、PDF ファイルを多数の小さい文書に分割するための基礎として使用します。

  1. Discovery プロジェクトが表示されている Web ブラウザー・タブに戻ります。

  2. 現在のコレクションの 「フィールドの管理」 タブを開きます。

  3. [文書の分割] フィールドで、 サブタイトルを選択し、 [変更を適用して再処理] をクリックします。

    a
    *のSplit by Fieldオプションを表示します

  4. ナビゲーション・パネルで、 「コレクションの管理」 をクリックし、もう一方のコレクションを開きます。

  5. [フィールドの管理] ページに移動し、 [文書の分割] フィールドで サブタイトル を選択します。

  6. **「変更を適用して再処理 (Apply changes and reprocess)」**をクリックします。

コレクションの再処理が開始されます。 再索引付けが完了すると、コレクションごとに 1 つの文書が含まれるのではなく、コレクションごとに数百個の文書が含まれるようになります。

文書の多いコレクション
文書の多いコレクション
を表示します

索引が再作成されている間に、アシスタントを準備しましょう。

アシスタントに拡張機能を追加する

アシスタントを NeuralSeek サービス・インスタンスに接続します。

  1. IBM Cloudから NeuralSeek サービスを再オープンします。 このインスタンスは、 リソース・リストAI および Machine Learning セクションにあります。

  2. 「統合 (Integrate)」 タブをクリックし、指示に従って、アシスタントの NeuralSeek カスタム拡張をセットアップします。 アクションを作成する準備ができたら、この手順に戻ります。

    Shows the Integrate page of the NeuralSeek instance
    Set up the NeuralSeek instance integration

  3. watsonx Assistant のナビゲーション・パネルで、 「アクション」 をクリックし、 「新規アクション」 をクリックします。

  4. 「テンプレートからのクイック・スタート」 を選択し、スクロールして NeuralSeek スターター・キットを見つけ、クリックします。

    " caption-side="bottom"}からの開始オプションを表示します{: caption="

  5. 「このスターター・キットを選択」 をクリックし、 「テンプレートの追加」 をクリックします。

  6. クリックすると、アシスタントに追加した NeuralSeek 検索 アクションが開きます。

  7. 以下のユーザー例の照会をアクションの最初のステップに追加します。

    What Watson Discovery project types are available and what do they do?
    
    What external data sources are supported by Watson Discovery?
    
    Can I add a custom dictionary to Watson Discovery?
    
    How do I use the Content Mining application?
    
    When should I add query expansions to my project?
    
    Which file types support Smart Document Understanding models?
    
    Can I enable optical character recognition for all file types?
    
    Does my data have to be written in English?
    

    watsonx Assistant は、サンプルの質問を使用して、このアクションにルーティングする必要があるユーザー質問のタイプを認識します。

  8. クリックすると、編集のためにステップ 3 が開きます。

    「AND」 セクションで、 「拡張の編集」 をクリックします。

    **NeuralSeek ** を選択し、**Apply ** をクリックします。

    Shows the extension setup page
    Set up the NeuralSeek extension

  9. クリックすると、編集のためにステップ 6 が開きます。

    このステップでは、ユーザーがクリックして詳細情報を取得できるリンクを示します。 このリンクは、 IBM Cloud 資料サイトの製品資料に直接移動する必要があります。

    アンカーHTML要素のハイパーテキスト参照を以下の URLに変更する:

    <a href="https://cloud.ibm.com/docs/discovery-data?topic=discovery-data-about" target="_blank">
    

    拡張機能の設定ページを表示します{: caption=" 詳細情報リンクの URLを変更する" caption-side="bottom"}

  10. 変更を保存し、「X」をクリックしてステップを閉じます。

おめでとうございます! Discoveryに関する質問を認識し、その回答を接続された NeuralSeek 拡張機能から取得するアクションが正常に作成されました。

アシスタントの Web チャットの構成

アシスタントをプレビューするには、アシスタントと対話するためのチャット・ユーザー・インターフェースとして、組み込みの Web チャットを使用します。

  1. watsonx Assistantのナビゲーション・パネルから、 「環境」 をクリックします。

    ドラフト環境が表示されます。 これは、Web チャットがアシスタントに接続されていることを示しています。 Web チャットが NeuralSeek 拡張機能に接続されていることも確認できます。

    アシスタントに NeuralSeek が接続されている「環境」ページを示します。
    Environment diagram

  2. 「Web チャット」 タイルをクリックして、Web チャットを編集します。

    複数のスターターの質問を追加する必要はないため、Web チャットのホーム画面をオフにします。 ホーム画面のタブをクリックします。 スイッチャーを 「オフ」 に設定し、 「保存して終了」 をクリックします。

    Web チャットのホーム画面がオフに設定されています。
    Web chat home screen disabled

アシスタントをプレビューする準備ができました。

アシスタントのプレビュー

Discoveryに保管されているデータに接続するアシスタントをプレビューするには、 「環境」 ページからアシスタントをプレビューする必要があります。 Web チャットを単独でプレビューする場合、アシスタントは Discoveryからデータを取得できません。 Discoveryに接続するには、環境リソースが必要です。

  1. 「環境」 ページで、 「この環境のプレビュー」 をクリックします。

    チャット・アイコン チャット・アイコン を含むサンプル Web ページが表示されます。

  2. チャットアイコンをクリックして、ウェブチャットウィンドウを開きます。

    ウェブチャットの" caption-side="bottom"}を表示します{: caption="

  3. 以下のテキスト質問を入力します。

    What project types are available?
    

    正しい回答が返され、製品資料へのリンクが含まれています。

    Shows a preview of the assistant where the test question is answered
    Web chat returns search response

  4. アクションの作成時にクエリーの例として使用されなかった質問を送信します。

    How do you define synonyms in Watson Discovery?
    

    詳細な回答が返されます。

    Shows another preview of the assistant where the test question is answered
    Web chat returns a detailed answer

  5. オプションで、アシスタントに他の質問をします。

    アシスタントが回答を認識しない場合は、特に Discovery で何かがどのように機能するかを尋ねていることを明確にするために、「 Watson Discovery」に含めるように質問を書き換えてください。

おめでとうございます! NeuralSeek サービスを介して製品資料から情報を取得することにより、 Discovery に関する質問に回答できるアシスタントが正常に作成されました。

要約

このチュートリアルでは、 Discovery 製品資料を含むアップロードされた PDF ファイルを使用して、 Watson Discovery 文書検索プロジェクトを作成しました。 個別に、 Discoveryに関するユーザーの質問を認識できる単一アクションを使用して watsonx Assistant 仮想アシスタントを作成しました。 Discovery から正しい回答を取得し、応答をリワードする NeuralSeek というサード・パーティー・サービスに接続するカスタム拡張をアシスタントに追加しました。 最後に、質問をして正確で適切に作成された応答を取得することで、仮想アシスタントをテストしました。

次のステップ

作成したアシスタントは、ドラフト環境から使用できます。 次に、アシスタントを実稼働環境に公開してデプロイすることができます。 様々な方法でアシスタントを配置することができる。 詳しくは、 概要: プレビューと公開を参照してください。