コレクションの編集
コレクションの特性は、コンテンツ・マイニング・アプリケーションから変更できます。
以下の特性を変更できます
- コレクションのタイム・ゾーンの変更
- コレクション内の関心のある文書にタグを付けるために使用できる文書フラグを追加する
- 文書のテキスト本文のソースとして指定されているフィールドを変更または拡張する
- グループ・テキスト本文フィールド
- コレクションに適用されるエンリッチメントの追加、削除、または変更
コレクションの編集
-
コレクションの分析ビューから、ページ・ヘッダーにある 「コレクション」 リンクをクリックします。
-
コレクションのタイルで、 「オプションのリストを開く/閉じる (Open and close list of options)」 アイコンをクリックして、 「コレクションの編集 (Edit collection)」 を選択します。
-
コレクションの特性を変更するには、該当するタブを使用します。
-
変更が完了したら 、[保存] をクリックします。
以下のメッセージが表示されます。
You need to clear index to make these changes. After clearing index, fully build the index to analyze using this collection.
メッセージは無視して構いません。 *「OK」*をクリックすると、索引が自動的に再作成されます。
-
OKをクリックして変更を確定します。
-
「閉じる」 をクリックすると、 コレクションページに戻ります。
索引が再作成されるのを待ってから、分析を続行してください。 「コレクション」 ページから、索引の再作成の進行状況を確認できます。
-
コレクション・タイルをクリックして、データ分析ページに戻ります。
タイム・ゾーンの変更
トレンド・グラフで使用されるタイム・ゾーンを変更するには、コレクションのデフォルトのタイム・ゾーンを編集する必要があります。
- 「 コレクションの編集 」のステップを実行して、コレクションを編集モードにします。
- 「編集」 タブで、 「タイム・ゾーン」 フィールドの値を変更し、 「保存」 をクリックします。
文書フラグの追加
文書フラグを追加するには、以下の手順に従ってください
- 「 コレクションの編集 」のステップを実行して、コレクションを編集モードにします。
- 「文書フラグ」 タブをクリックし、 「フラグの追加」 をクリックします。
- 「文書フラグ」 ダイアログ・ボックスで、フラグに名前を付け、説明を追加し、フラグの色を選択して、 「追加」 をクリックします。
- さらに旗を追加するには、前述の手順を繰り返します。
- ドキュメントフラグの表示から 「有効」 を選択すると、ドキュメントにフラグが表示されます。次に 、「保存」 をクリックしてコレクションで利用できるようにします。
文書にフラグを立てる方法について詳しくは、「 関心のある文書にフラグを立てる」を参照してください。
テキスト・フィールドの識別
コンテンツ・マイニング・アプリケーションを使用してデータを分析する場合、Discovery は、分析するテキストの 本文 が含まれているフィールドを判別します。 これを行うには、平均ワード・カウントが最も高いフィールドを検索します。
どのフィールドがメイン・テキスト本文フィールドとして指定されているかを確認し、別のフィールドの索引タイプを変更することによって、そのフィールドを変更または拡張することができます。
-
「 コレクションの編集 」のステップを実行して、コレクションを編集モードにします。
-
「フィールド」タブをクリックします。 「索引タイプ」 列を確認して、 「分析可能テキスト・コンテンツ」 索引タイプで指定されたフィールドを見つけます。
フィールドを変更することも、複数のテキスト・フィールドを 「分析可能テキスト・コンテンツ」 索引タイプに設定することもできます。
-
保存 をクリックします。
複数のフィールドを分析対象として選択した場合、1つのフィールドのみのファセット分析は表示されません。 複数のフィールドの分析を表示するには、それらをグループ化する必要があります。
複数のテキスト・フィールドをグループ化
-
「 コレクションの編集 」のステップを実行して、コレクションを編集モードにします。
-
「コンテキスト・ビュー」 タブをクリックし、 「ビューの追加」 をクリックします。
-
以下のフィールドに入力します。
- 名前: グループ化したビューの名前またはラベル。
- ID: テキスト照会を送信するときに Discovery が使用する英数字の ID。 例えば、
ans1
です。 - フィールド: **「分析可能テキスト・コンテンツ (Analyzable text content)」**設定が適用されたテキスト・フィールド。 ファセット分析用にグループ化する 1 つまたは複数のテキスト・フィールドを選択します。
-
追加 をクリックします。
ファセット分析用にグループ化するテキスト・フィールドをさらに追加する場合は、この作業を繰り返します。
-
保存 をクリックします。
これで、コレクションのデータ分析ページに戻ることができます。 「ファセット分析」 パネルで、 「コンテキスト・ビュー選択」 をクリックして、グループ化したテキスト・フィールドを表示できます。 いずれかのテキスト・フィールドを選択して、そのフィールドのファセット分析を表示することができます。
コレクションのエンリッチ
Discovery には、 「エンティティー」 エンリッチメントなどの組み込み自然言語処理モデルが用意されています。これらのエンリッチメントは、ビジネス名やロケーション名、その他のタイプの固有名詞など、よく知られている事柄についての言及を認識できます。 これらの組み込み NLP エンリッチメントをコレクションに適用できます。
また、コンテンツ・マイニング・アプリケーションで作成した文書分類器エンリッチメントをコレクションに適用することもできます。
あるいは、同じサービス・インスタンス内の他のプロジェクトで作成されたエンリッチメントを、コンテンツ・マイニング・プロジェクト内のコレクションに適用することもできます。 例えば、同じサービス・インスタンス内の別のプロジェクトで作成された辞書またはテキスト分類器をコレクションに適用できます。
コレクションにエンリッチメントを適用するには、以下のステップを実行します。
- 「 コレクションの編集 」のステップを実行して、コレクションを編集モードにします。
- 「エンリッチ」 タブをクリックし、コレクションに適用するエンリッチメントを選択します。
- 保存 をクリックします。