IBM Cloud Docs
顧客入力で検索する情報の定義

顧客入力で検索する情報の定義

エンティティは、ユーザーの目的に関連するユーザー入力内の情報を表します。

意図が動詞(ユーザーが実行したいタスク)を表す場合、エンティティは名詞(そのタスクの対象またはコンテクスト)を表します。 例えば、インテント が天気予報の取得のときは、アプリケーションで正確な予報が返されるようにするには、関連する場所と日付のエンティティー が必要です。

ユーザーの入力のエンティティーを認識すると、より有用なターゲット設定された応答を作成するのに役立ちます。 例えば、#buy_something インテントがあるとします。 ユーザーが #buy_something インテントをトリガーする要求を作成するときは、アシスタントの応答に、お客様が購入を希望するもの が何かについての認識が反映される必要があります。 @product エンティティーを追加して使用し、お客様の興味のある製品に関するユーザー入力から、情報を抽出できます。 ( @ 接頭部は、エンティティーとして明確に識別するのに役立ちます。)

ユーザーのリクエストで検出された @product の値に基づいて文言を変えながら、ダイアログツリーに複数の応答を追加することができます。

エンティティーの評価の概要

次のいずれかの評価メソッドを使用することで、アシスタントによってユーザー入力のエンティティーが検出されます。

辞書ベースのメソッド

アシスタントでは、エンティティーに定義した値、同義語、またはパターンに一致するユーザー入力内の用語が検索されます。

  • 同義語エンティティー: 用語のカテゴリーをエンティティー (color) として定義し、次にそのカテゴリーの 1 つ以上の値 (blue) を定義します。 それぞれの値に対して、同義語の集まり (aquanavy) を指定します。

    実行時には、アシスタントによって、そのエンティティーの言及としてエンティティーに定義した値または同義語に完全一致するユーザー入力内の用語が認識されます。

  • パターン・エンティティー: 用語のカテゴリーをエンティティー (contact_info) として定義し、そのカテゴリー (email) に 1 つ以上の値を定義します。値ごとに、その値タイプのメンションのテキスト・パターンを定義する正規表現を指定します。 email エンティティー値には、text@text.com パターンを定義する正規表現を指定できます。

    実行時、アシスタントはユーザー入力に含まれる正規表現に一致するパターンを探し、一致するものをすべてそのエンティティの言及として識別します。

  • システム・エンティティー: IBM によって事前作成されている同義語エンティティーです。 これらは、数値、日付、時刻などの一般的に使用されるカテゴリーをカバーします。 単純にシステム・エンティティーを有効にして、使用を開始します。

注釈ベースのメソッド

コンテキスト・エンティティーとも呼ばれる注釈ベースのエンティティーを定義すると、注釈付きの用語と、注釈を付けた文でその用語が使用されているコンテキストの両方でモデルがトレーニングされます。 この文脈上のエンティティモデルにより、ユーザー入力での使用状況に基づいて、単語やフレーズがエンティティのインスタンスである可能性を識別する信頼スコアをアシスタントが計算できるようになります。

  • コンテキスト・エンティティー: まず、用語のカテゴリーをエンティティーとして定義します (product)。次に、インテント ページに移動し、既存のインテント・ユーザー例をマイニングしてエンティティーの言及を見つけ、それらにそのようにラベルを付けます。 例えば、#buy_something インテントに移動し、I want to buy a Coach bag というユーザー例を見つけることができます。 Coach bag エンティティーの言及として @product のラベルを付けることができます。

    トレーニング目的で、 @product エンティティの値として Coach bag という用語が追加されています。

    実行時には、アシスタントによって、文で用語が使用されるコンテキストのみに基づいて用語が評価されます。 用語に言及するユーザー要求の構造が、言及がラベル付けされたインテントのユーザー例の構造と一致する場合、アシスタントによって、そのエンティティー・タイプの言及としてその用語が解釈されます。 例えば、ユーザー入力には I want to buy a Gucci bag という発話が含まれるかもしれません。 この文の構造は、注釈を付けたユーザー例 (I want to buy a Coach bag) に似ているため、アシスタントによって、Gucci bag@product エンティティーの言及として認識されます。

    エンティティーにコンテキスト・エンティティー・モデルが使用される場合、アシスタントによってユーザー入力のエンティティーに完全一致するテキストまたはパターンが検索されることはありません が、代わりにエンティティーが言及された文のコンテキストがフォーカスされます。

    注釈を使用してエンティティーの値を定義する場合は、エンティティーごとに少なくとも 10 個の注釈を追加して、信頼できるようにするための十分なデータをコンテキスト・エンティティー・モデルに付与します。

エンティティーの作成

  1. 「エンティティー」 をクリックします。

  2. **「エンティティーの作成 (Create entity)」**をクリックします。

    または、**「システム・エンティティー (System entities)」**をクリックして、IBM 提供の共通エンティティーのリストから選択することもできます。それらのエンティティーは、どのようなユース・ケースにも適用可能です。 詳しくは、システム・エンティティーの有効化を参照してください。

  3. **「エンティティー名 (Entity name)」**フィールドに、このエンティティーを表す名前を入力します。

    エンティティー名には、文字 (ユニコード)、数字、下線、ハイフンを使用できます。 以下に例を示します。

    • @location
    • @menu_item
    • @product

    名前にスペースを含めないでください。 64 文字を超える名前を指定することはできません。 名前の先頭にストリング sys- を付けることはできません。このストリングはシステム・エンティティー用に予約済みであるためです。

    エンティティ名には、自動的に「@」の接頭辞 @ が追加され、用語がエンティティであることを識別します。 それを手動で追加する必要はありません。

  4. **「エンティティーの作成 (Create entity)」**をクリックします。

    エンティティーの作成の画面キャプチャー
    エンティティーの作成

  5. このエンティティーに対して、アシスタントでそのエンティティーの言及を見つけるために辞書ベースの方法と注釈ベースの方法のどちらを使用するかを選択し、該当する手順に従います。

    作成するエンティティーごとに、使用するエンティティー・タイプを 1 つのみ選択します。 エンティティーに注釈を追加するとすぐにコンテキスト・モデルが初期化されて、コンテキスト・モデルが、そのエンティティーの言及を見つけるためにユーザー入力を分析する 1 次的な方法になります。 ユーザー入力で言及が使用されるコンテキストは、完全一致 (存在する場合) よりも優先されます。 詳しくは、 エンティティー評価の概要 を参照してください。

辞書ベースのエンティティーの追加

辞書ベースのエンティティーは、特定の用語、同義語、またはパターンを定義するために使用されます。 実行時には、ユーザー入力の用語が値またはそのいずれかの同義語に完全一致 (またはファジー・マッチングが有効の場合は近似一致) する場合にのみ、アシスタントによって、エンティティー言及が検索されます。

  1. **「値の名前 (Value name)」**フィールドに値を入力します。 例えば、@city エンティティーには、New York City と入力します。

    エンティティー値には、最大で 64 文字までの任意のストリングを使用できます。

    重要: エンティティーの名前と値には、機密情報や個人情報を含めないでください。 アプリのURLに名前と値を含めることができます。

  2. 値の同義語を追加します。 例えば、NYC の同義語として The Big AppleNew York City を追加できます。

    同義語として、最大で 64 文字までの任意のストリングを使用できます。

    製品の注文番号や E メール・アドレスなど、アシスタントがユーザー入力で検索するパターンを定義する場合は、代わりにパターン値を定義します。 詳しくは、パターンを認識するエンティティーの追加を参照してください。

    注: 1 つのエンティティー値に対して、同義語またはパターンのどちらか一方 を追加できます。両方を追加することはできません。

  3. 指定したエンティティーの値および同義語に類似した構文の用語をアシスタントで認識する必要があり、完全一致する必要がない場合は、**「あいまい一致 (Fuzzy Matching)」スイッチを「オン」**に設定します。

    例えば、 @fruit エンティティの値として apple を追加し、ユーザーが apples または appel を入力した場合、あいまい一致が有効になっていると、アシスタントはこれらの単語を @fruit の言及として認識します。 詳しくは、ファジー・マッチングの仕組みを参照してください。

  4. **「値の追加 (Add value)」**をクリックしてプロセスを繰り返すことで、さらにエンティティー値を追加します。

    多くの値を連続して追加する場合は、Shift + Enter を押して現行値の追加を終了すれば、次の値を追加できるように値フィールドにフォーカスが合ったままになります。

  5. エンティティー値を追加した後、「閉じる矢印」をクリックしてエンティティーの作成を終了します。

作成したエンティティが追加され、システムが新しいデータで自己学習します。

パターンを認識するエンティティーの追加

ユーザー入力のパターンを検索するエンティティーを作成できます。 例えば、{word}+@+{word}+.com のパターンの出現を検索することで、E メール・アドレスの言及を検索できます。 または、 TWEX3433JKL のように、特定のフォーマットに従う製品注文番号をお持ちかもしれません。 パターンを作成して、その構文を持つ文字列をユーザー発話の中から探すことができます。

パターンを認識するエンティティーを追加するには、以下のようにします。

  1. 辞書ベースのエンティティを作成するには、標準の手順に従いますが、 タイプメニューから 「類義語」 ではなく 「パターン」 を選択します。

    エンティティー作成時のパターン・タイプのピッキング
    パターン・タイプの選択

  2. 検索するパターンを定義する正規表現を追加します。

    • 各エンティティ値には、最大5パターンまであります。
    • 各パターン (正規表現) は 512 文字に制限されます。

    パターン・エンティティーの定義の画面キャプチャー
    パターン・エンティティー

    以下の構文規則に従ってください。

    • エンティティー・パターンに以下を含めることはできません。

      • 正の反復 (例: x*+)
      • 逆参照 (例: \g1)
      • 条件付きブランチ (例: (?(cond)true))
    • パターン・エンティティーの先頭または末尾が Unicode 文字で、ワード境界 (\bš\b など) が含まれている場合、パターン・マッチングはワード境界と正確に一致しません。 この例では、入力が š zkouška の場合、マッチングにより Group 0: 6-7 š (š zkouška) が返され、正しい結果である Group 0: 0-1 š (š zkouška) は返されません。

      正規表現エンジンは、Java 正規表現エンジンにおおまかに基づいています。 サポートされていないパターンをアップロードしようとすると、APIを使用するか Watson Assistantからアップロードしようとすると、エラーが表示されます。

    例えば、エンティティー ContactInfo について、電話番号、E メール、Web サイトの値のパターンを以下のように定義できます。

    • 電話番号
      • localPhone: (\d{3})-(\d{4})(例: 426-4968)
      • fullUSphone: (\d{3})-(\d{3})-(\d{4})(例: 800-426-4968)
      • internationalPhone: ^(\(?\+?[0-9]*\)?)?[0-9_\- \(\)]*$(例: +44 1962 815000)
    • E メール
      • email: \b[A-Za-z0-9._%+-]+@([A-Za-z0-9-]+\.)+[A-Za-z]{2,}\b(例: name@ibm.com )
    • Web サイト
      • website: (https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$(例: https://www.ibm.com )
  3. **「値の追加 (Add value)」**をクリックしてプロセスを繰り返すことで、さらにエンティティー値を追加します。

パターン・エンティティーを使用してユーザー入力のパターンを検索する場合は、パターンに一致するユーザー入力テキストの部分を保存する方法が必要になることがよくあります。 これを行うために、コンテキスト変数を使用できます。 詳しくは、コンテキスト変数の定義を参照してください。

例えば、ダイアログでユーザーにメールアドレスの入力を求めることができます。 ダイアログノードの条件には、 @contactInfo:email に似た条件が含まれています。 ダイアログ・ノードの応答セクションで、以下の構文を使用して、ユーザーの E メール・アドレスのテキストをキャプチャーして保管するコンテキスト変数を定義できます。

パターンの保存
変数
email <? @contactInfo.literal ?>

この構文は、E メール・パターンに一致するユーザー入力の部分を見つけ、その部分のテキストを email という名前のコンテキスト変数に保存することを示しています。

キャプチャー・グループ

正規表現では、通常の括弧で囲まれたパターン内の任意の部分はグループとして捕捉されます。 例えば、 @ContactInfo というエンティティには、3つのキャプチャグループを含む fullUSphone というパターンがあります

  • (\d{3}) - 米国の市外局番
  • (\d{3}) - 接頭部
  • (\d{4}) - 回線番号

グループ化は、例えばアシスタントに電話番号を尋ね、その回答では市外局番のみを使用したい場合などに便利です。

ユーザーが入力した市外局番をコンテキスト変数として割り当てるには、ダイアログ・ノードの応答セクションで、以下の構文を使用して、グループと一致するものをキャプチャーできます。

キャプチャー・グループの保存
変数
area_code <? @ContactInfo.groups[1] ?>

ダイアログのキャプチャー・グループの使用法について詳しくは、入力でのエンティティー・パターン・グループの格納および認識を参照してください。

ファジー・マッチングの仕組み

ファジー・マッチングは、特定の言語で使用できます。 詳しくは、サポートされる言語を参照してください。

ファジー・マッチングは、以下のコンポーネントで構成されています。

  • ステミング - 文法的にさまざまな語形を取るエンティティー値の、語幹の形式を識別します。 例えば、 bananas のステムは banana となり、 running のステムは run となります。

  • ミススペル - つづりの誤りや構文上の微妙な違いがあっても、対応する適切なエンティティーにユーザー入力をマップすることができます。 例えば、 giraffe を動物実体の同義語として定義し、ユーザー入力に giraffes または girafe の用語が含まれている場合、あいまい一致により用語をマッピングすることができます。

  • 部分一致 - 部分一致により、ユーザー定義エンティティーに存在する、サブストリングに基づいた同義語を自動的に提案します。そして、エンティティーの完全一致と比較して、それより低い信頼性スコアを割り当てます。

    部分一致コンポーネントは、英語のダイアログ・スキルでのみサポートされています。

英語の場合、あいまい一致により、一般的な有効な英単語がエンティティのあいまい一致として取得されないことがあります。 この機能は、標準的な英語の辞書の単語を使用します。 英語のエンティティー値と同義語を定義することもできます。ファジー・マッチングは、定義したエンティティー値または同義語のみに一致します。 例えば、あいまい一致では、 unsure という用語が insurance と一致する可能性があります。しかし、 unsure@option のような実体の値または同義語として定義した場合、 unsure は常に @option と一致し、 insurance とは一致しません。

ステミング機能とミススペル・ファジー・マッチング機能の間の相互作用は許可されません。 具体的には、エンティティーまたは入力のいずれかがステミングされている場合、ミススペル・ファジー・マッチングは機能しません。 例えば、エンティティーが @lending で、入力ワードが pending であるとします。 エンティティーのステミング中に、@lendinglend を生成します。 入力ステミング中に、pendingpend を生成します。 この場合、エンティティーと入力がステミングされているため、lendpend と一致しません。 この変更は、英語にのみ適用されます。

コンテキスト・エンティティーの追加

注釈ベースのエンティティを使用して、サンプル文におけるエンティティの出現箇所に注釈を付け、アシスタントにそのエンティティが通常使用される文脈を教えます。

文脈上のエンティティモデルを訓練するには、注釈を付けるための文を提供する意図の例を活用できます。

この機能は、英語のダイアログ・スキルでのみ一般提供されています。フランス語のダイアログ・スキルではベータ版機能として提供されています。 詳しくは、サポートされる言語を参照してください。

コンテキスト・エンティティーを定義するためにインテントのユーザー例を使用しても、そのインテントの分類には影響しません。 ただし、ラベルを付けたエンティティー言及もそのエンティティーに同義語として追加されます。 また、インテントの分類で、インテントのユーザー例の同義語の言及が使用されて、インテントとエンティティーの間に弱参照が確立されます。

  1. 「インテント」 をクリックします。

  2. インテントをクリックして開きます。

  3. **「エンティティーに注釈を付ける (Annotate entities)」**をクリックしてから、潜在的なエンティティーの言及がないか、インテントの例を確認します。

  4. インテントの例から、単一のエンティティーの言及を構成している任意の単語 (複数も可能) または句読点をクリックします。

    この例では、mobile phones がエンティティー言及です。

    インテントの例の確認
    インテントの例の確認

    検索ボックスが開きます。これを使用して、強調表示された単語または句が言及であるエンティティーを検索できます。

    検索パラメーターが prod の検索ボックス
    検索ボックス

  5. 検索するエンティティーの名前を入力します。 先頭の @ 記号を含める必要はありません。

    以下のいずれかを実行します。

    • エンティティーに既存のエンティティー値が含まれる場合は、それが通知の目的のみで表示されます。 注釈は、特定のエンティティー値ではなく、エンティティーに追加します。

    • 言及が既存のエンティティー値と同義であることをモデルに学習させる場合は、エンティティー名の後にコロン (:) を追加して、エンティティー値のリストを表示します。 表示されたリストからエンティティー値を選択します。 例えば、@product:device です。

      検索パラメーター prod を使用した検索ボックス
      エンティティー値のリストの表示

  6. 注釈を追加するエンティティー、またはエンティティーと値を選択します。

    この例では、mobile phones@product エンティティー値の注釈として追加され、@product:device エンティティー値の同義語として追加されます。

    コンテキスト・エンティティーごとに 少なくとも 10 個の注釈を作成します。 実動で使用する場合は、追加のアノテーションをお勧めします。

  7. 適切なエンティティーがない場合は、その名前を追加して、新しいエンティティーを作成できます。 次に、リストから {entity_name} (新しいエンティティの作成) オプションを選択します。

    注釈ページ
    「新規エンティティーの作成」
    から新規 @location エンティティーを追加する方法を示しています。

  8. 注釈を付けるエンティティー言及ごとにこのプロセスを繰り返します。

    編集するユーザー例に出現するエンティティー・タイプのすべての言及に注釈を付けてください。 詳しくは、注釈を付けないことによる問題を参照してください。

  9. 作成したアノテーションの 1 つをクリックします。 Go to: {entity-name} というボックスが表示されます。 このリンクをクリックすると、エンティティーに直接移動します。

    製品エンティティーの値コンピューターを確認
    エンティティーに移動

    注釈は関連付けたエンティティに追加され、システムは新しいデータで自らを訓練します。

    注釈を付けた用語は、新しい辞書値としてエンティティに追加されます。 注釈付きの用語を既存のエンティティー値に関連付けた場合、その用語は、独立したエンティティー値としてではなく、そのエンティティー値の同義語として追加されます。

    携帯電話がデバイス値の同義語として追加され、
    携帯電話が同義語として追加されました

  10. 特定のエンティティーの注釈を付けたすべての言及を表示するには、エンティティーの構成ページから、**「注釈 (Annotation)」**タブをクリックします。

    強調表示された注釈ビュー・セレクター
    すべての注釈を表示

    コンテキスト・エンティティーは、明示的に定義しなかった値を理解します。 このシステムは、ユーザーが提供した例の注釈に基づいて、より多くのエンティティ値を予測し、それらの値を使用して他のエンティティを学習します。 類似のユーザー例が*「注釈 (Annotation)」*ビューに追加されるため、このオプションがトレーニングにどのように影響するかを確認できます。

    この拡張されたエンティティー値の理解能力を使用するコンテキスト・エンティティーが不要な場合は、*「注釈 (Annotation)」*ビューでそのエンティティーについてのすべてのユーザー例を選択して、**「削除」**をクリックします。

注釈を付けないことによる問題

注釈を含むインテントの例があり、その例の別の単語が同じエンティティーの値または同義語と一致するが、その値に注釈が付けられていない 場合、注釈を付けなかったことによる影響が発生します。 モデルは、あなたが注釈を付けなかった用語の文脈からも学習します。 したがって、ある用語にユーザー例のエンティティーの言及としてラベルを付けた場合、その他の該当するすべての言及にもラベルを付けてください。

  1. #Customer_Care_Appointments インテントには、単語 visit を持つ 2 つのインテントの例が含まれています。

    アクセス例のインテント
    例 (
    を参照)

  2. この単語の 2 つ目の出現箇所では、単語 visit に、@meeting エンティティーのエンティティー値としての注釈を付ける必要があります。 この注釈により、 visit は、 @meeting の他のエンティティ値( appointment など)と同等になります。例えば 、「予約をしたい」「訪問の予定を立てたい」 などです。

    @meeting エンティティー
    @meeting エンティティーを使用して来院に注釈を付ける

  3. 1 番目の出現箇所では、単語 visit は動詞として使用されています。 この意味は、meeting とは違います。 この場合、インテントの例から単語 appointment を選択して、@meeting エンティティーのエンティティー値として注釈を付けることができます。 モデルは、同じ例の単語 visit に注釈が付けられていない事実から学習します。

    選択されていない訪問
    予約の選択

システム・エンティティーの有効化

Watson Assistant には、どのアプリケーションでも使用できる一般的なエンティティーである多数のシステム・エンティティー が用意されています。 システム・エンティティーを有効にすると、多くのユース・ケースに共通のトレーニング・データを、スキルに迅速に取り込むことができます。

システム・エンティティーを使用すると、それらのエンティティーが表すオブジェクト・タイプの、広範囲の値を認識することができます。 例えば、@sys-number システム・エンティティーは、単語として表記された数字も含め、整数、小数など、あらゆる数値と一致します。

システム・エンティティーは一元的に管理されているため、更新内容は自動的に使用できるようになります。 システム・エンティティーを変更することはできません。

  1. 「Entities」ページで**「System entities」**をクリックします。

  2. システム・エンティティーのリストを参照して、対象のアプリケーションで役立つものを選択します。

    • 一致する入力データの例を含め、システム・エンティティーに関する詳細情報を表示するには、リスト内のエンティティーをクリックします。
    • 使用できるシステム・エンティティーについて詳しくは、システム・エンティティーを参照してください。
  3. 使用する各システム・エンティティーのスイッチを**「オン」**に設定します。

システム・エンティティーを有効にすると、 Watson Assistant がリトレーニングされます。 トレーニングが完了したら、エンティティーを使用できるようになります。

エンティティーの制限

作成できるエンティティーの数、エンティティー値の数、同義語の数は、Watson Assistant のサービス・プランに応じて異なります。

計画の詳細
プラン 1 スキルあたりのエンティティーの数 1 スキルあたりのエンティティーの値 1 スキルあたりのエンティティーの同義語の数
Enterprise 1,000 100,000 100,000
プレミアム (レガシー) 1,000 100,000 100,000
プラス 1,000 100,000 100,000
ライト、トライアル 100 100,000 100,000

使用可能にしたシステム・エンティティーは、プラン使用量合計に加算されます。

プランの詳細 (続き)
プラン コンテキスト・エンティティーおよび注釈
Enterprise 150 個のコンテキスト・エンティティーと 3000 個の注釈
プレミアム (レガシー) 150 個のコンテキスト・エンティティーと 3000 個の注釈
プラス 100 個のコンテキスト・エンティティーと 2000 個の注釈
ライト、トライアル 10 個のコンテキスト・エンティティーと 1000 個の注釈

エンティティーの編集

リスト内の任意のエンティティーをクリックして開き、編集することができます。 エンティティーをリネームまたは削除したり、値、同義語、パターンを追加、編集、削除したりできます。

エンティティー・タイプを synonym から pattern に変更したりその逆に変更したりすると、既存の値は変換されますが、そのままでは役立たない可能性があります。

エンティティーのダウンロード

複数のエンティティをCSVファイルにダウンロードできるので、別のアシスタントにアップロードして再利用することができます。

  • パターン情報は、ダウンロードした CSV ファイルに含まれます。 / で囲まれた文字列はすべてパターンとみなされます(同義語とは異なります)。
  • コンテキスト・エンティティーに関連付けられたアノテーションはダウンロードされません。 ダイアログ全体をダウンロードしないと、エンティティの値と関連する注釈の両方を取得できません。
  1. **「エンティティー」**ページに移動します。

    • すべてのエンティティーをダウンロードするには、個々のエンティティーを選択しないでください。 代わりに、 「すべてのエンティティーをダウンロード」 アイコン 「すべてのエンティティーをダウンロード」アイコン をクリックします。

    • 現在のページにリストされているエンティティーのみをダウンロードするには、ヘッダーのチェック・ボックスを選択します。 このアクションにより、現在のページのすべてのエンティティーが選択されます。 次に 、「ダウンロード」ボタンをクリックします。

    • 特定のエンティティを1つ以上ダウンロードするには、ダウンロードするエンティティを選択し 、「ダウンロード」ボタンをクリックします。

  2. 生成される CSV ファイルを保管する名前と場所を指定し、「保存」をクリックします。

エンティティーのアップロード

多くのエンティティがある場合、一つ一つ定義するよりも、カンマ区切り(CSV)ファイルからアップロードする方が簡単かもしれません。

エンティティー注釈は、エンティティー CSV ファイルのアップロードには含まれません。 コンテキストエンティティに関連付けられた注釈を保持するには、ダイアログ全体をアップロードする必要があります。 エンティティーのみをダウンロードしてアップロードする場合、ダウンロードしたコンテキスト・エンティティーは、アップロード後に辞書ベースのエンティティーとして扱われます。

  1. エンティティーを CSV ファイルにまとめるか、またはスプレッドシート内のエンティティーを CSV ファイルにエクスポートします。 ファイルの各行のフォーマットは、以下のようにする必要があります。

    <entity>,<value>,<synonyms>
    

    ここで、 はエンティティーの名前、 はエンティティーの値、 はその値の同義語のコンマ区切りリストです。

    weekday,Monday,Mon
    weekday,Tuesday,Tue,Tues
    weekday,Wednesday,Wed
    weekday,Thursday,Thur,Thu,Thurs
    weekday,Friday,Fri
    weekday,Saturday,Sat
    weekday,Sunday,Sun
    month,January,Jan
    month,February,Feb
    month,March,Mar
    month,April,Apr
    month,May
    

    CSV ファイルをアップロードすると、パターンもサポートされます。 / で囲まれた文字列はすべてパターンとみなされます(同義語とは異なります)。

    ContactInfo,localPhone,/(\d{3})-(\d{4})/
    ContactInfo,fullUSphone,/(\d{3})-(\d{3})-(\d{4})/
    ContactInfo,internationalPhone,/^(\(?\+?[0-9]*\)?)?[0-9_\- \(\)]*$/
    ContactInfo,email,/\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b/
    ContactInfo,website,/(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/
    

    CSV ファイルは、バイト・オーダー・マーク (BOM) を付加せず、UTF-8 エンコードで保存します。 CSV ファイルの最大サイズは 10 MB です。 CSV ファイルが大きい場合は、複数のファイルに分割して個別にアップロードすることを検討してください。 ダイアログ・スキルを開き、**「Entities」**タブをクリックします。

  2. **「アップロード」**アイコン 「アップロード」アイコン をクリックします。

  3. ファイルをドラッグするか、またはコンピュータからファイルを選択して参照し、 [エンティティをアップロード] をクリックします。

    ファイルが検証され、アップロードされると、システムは新しいデータに基づいて自己学習します。 アップロードされたエンティティは、エンティティページで確認できます。

エンティティーの削除

複数のエンティティーを選択して、削除することができます。

エンティティーを削除すると、そのエンティティーに関連付けられている値、同義語、パターン、または注釈は除去されます。 削除したデータを、後から取得することはできません。 それらのエンティティーまたは値を参照しているすべての対話ノードについては、削除されたコンテンツを今後参照することがないように、手動で更新する必要があります。

  1. **「エンティティー」**ページに移動します。

    • すべてのエンティティーを削除するには、個々のエンティティーを選択しないでください。 代わりに、 「すべてのエンティティーを削除」 アイコン 「すべてのエンティティーを削除」アイコン をクリックします。

    • 現在のページに表示されているエンティティーのみを削除するには、ヘッダーのチェック・ボックスを選択します。 このアクションにより、現在のページに表示されているすべてのエンティティーが選択されます。 次に、 削除ボタンをクリックします。

    • 特定のエンティティを1つ以上削除するには、削除するエンティティを選択し 、「削除」ボタンをクリックします。