IBM Cloud Docs
プロジェクトの作成

プロジェクトの作成

プロジェクトは、 IBM Watson® Discovery アプリケーションでリソースを収集して管理するための便利な方法です。 コレクションを作成することにより、 プロジェクト・タイプ を割り当てて、データをプロジェクトに接続することができます。

プロジェクトを作成する前に、ニーズに最適なプロジェクト・タイプを決定します。

プロジェクトの説明

プロジェクト・タイプのユース・ケース
ニーズ 目的 プロジェクト・タイプ
IBM Cloud 反復的な文書処理タスクの自動化をサポートするために、データを抽出したいと考えています。 文書から抽出されたデータを素早く理解し、エンリッチメントを適用することでデータを改善したいと考えています。 インテリジェントな文書処理
どの文書に質問の回答が含まれていますか? 構造化データと非構造化データが混在するソースで意味のある情報を見つけ、スタンドアロンのエンタープライズ・サーチ・アプリケーションまたはビジネス・アプリケーションの検索フィールドに表示します。 文書の取得 (Document Retrieval)
タスクに必要な契約の一部はどこにありますか? 契約から重要な情報を素早く抽出します。 契約の文書検索
自分が作成するチャットボットに自分が所有する知識を使用させたい。 お客様の質問に答えるために、さまざまな外部データ・ソースや文書フォーマットに保管されている技術情報に仮想アシスタントが素早くアクセスできるようにします。 会話型検索 (Conversational Search)
知らなかったことについての洞察を明らかにしたいと思います。 パターン分析から洞察を得るか、根本原因分析を実行します。 コンテンツ・マイニング

IBM Cloud Pak for Data as a Service デプロイメントの一部として Discovery サービスを作成した場合、 Discovery プロジェクトは、 IBM Cloudに表示されるデプロイメント・プロジェクトとは別のものになります。

プロジェクトを作成するには、以下のステップを実行します。

  1. 「マイ・プロジェクト」 を選択して、 「プロジェクト」 ページを開きます。

  2. 「新規プロジェクト」 をクリックします。 プロジェクトに名前を付けてから、プロジェクト・タイプを選択します。

    各タイプについて詳しくは、 プロジェクト・タイプ を参照してください。

  3. 「文書の取得 (Document Retrieval)」 プロジェクト・タイプを選択し、データ・ソースが英語である場合は、 Content Intelligence 機能を有効にするかどうかを決定します。

    データ・ソースに契約が含まれている場合は、 「契約エンリッチメントの適用」 を選択してこの機能を有効にします。 必要に応じて、スクロールしてチェック・ボックスを表示します。

  4. 次へ をクリックします。

  5. データ・ソースを選択して構成します。

    サポートされるデータ・ソースについて詳しくは、 コレクションの作成 を参照してください。

ページ・ヘッダーから使用可能な以下のリソースを利用します。

  • 製品資料を開くには、「ヘルプ」アイコン 「ヘルプ」アイコン をクリックします。
  • すべてのプロジェクトを表示するには、 「マイ・プロジェクト」 をクリックします。

プロジェクト・タイプ

プロジェクト・タイプを選択すると、正しいエンリッチメントのセットが自動的に文書に適用されます。 使用可能な改善ツールは、ユース・ケースごとに最適化されたデプロイメント方式と同様に、プロジェクト・タイプごとに異なります。

以下のプロジェクト・タイプを使用できます。

インテリジェントな文書処理 IBM Cloud

このプロジェクト・タイプは、 Discovery が文書から抽出したデータを素早く理解するために使用します。 抽出したデータをリッチ・ドキュメント・プレビューで表示できます (デフォルトのビューは PDF です)。 抽出されたデータが要件を満たしていない場合は、エンリッチメントを適用してデータを改善することができます。

このプロジェクト・タイプは、 IBM Cloud管理対象インスタンスからのみ使用可能です。

このタイプのプロジェクトに追加した文書は、以下の方法で自動的にエンリッチされます。

  • 固有名詞などのエンティティーが識別され、タグ付けされます。

文書の取得 (Document Retrieval)

このプロジェクト・タイプは、データから最も関係のある答えを検索して見つける場合に使用します。 このタイプのプロジェクトは通常、Web サイトまたはその他のアプリケーションに追加される検索フィールド・コンポーネントとしてデプロイされます。

このタイプのプロジェクトに追加した文書は、以下の方法で自動的にエンリッチされます。

  • 固有名詞などのエンティティーが識別され、タグ付けされます。

このタグ付き情報は、後で、よりスマートな応答を返すために自然言語フレーズが検索照会として送信されるときに使用されます。

サンプルの「文書の取得 (Document Retrieval)」プロジェクトが用意されています。 詳しくは、 Watson Discovery を参照してください。

契約のドキュメント取得

英語の法的契約を扱う場合は、 Content Intelligence 機能を有効にして、データ内の契約関連の概念を認識してタグ付けできる契約エンリッチメントを適用します。 このプロジェクト・タイプを使用して、契約のレビューや交渉などの複雑なビジネス・プロセスを自動化します。 このプロジェクト・タイプは、生産性の向上、コストの最小化、および法的エクスポージャーの削減に役立ちます。

このタイプのプロジェクトを作成できるのは、インストール済みデプロイメント (IBM Cloud Pak for Data) またはプレミアム・プランまたはエンタープライズ・プランの管理対象デプロイメントのユーザーのみです。

標準的な文書取得プロジェクトに適用されるエンリッチメントに加えて、以下のエンリッチメントが自動的に作成されます。

  • ソース文書内の表からのコンテンツは、後で見つけられるようにタグ付けされます。
  • 契約の詳細 (契約に関係する支払条件や関係者など) が識別され、タグ付けされます。

プロジェクトに追加するすべてのコレクションに対して、光学式文字認識 (OCR) が自動的に有効になり、スキャンされた文書またはその他の画像からのテキストが処理されます。

契約エンリッチメントを適用する場合、Smart Document Understanding を使用して文書にアノテーションを付けることはできません。 契約関連情報を認識できる事前にトレーニングされた SDU モデルが自動的に適用されます。 「表の理解」エンリッチメントが自動的に適用されます。

詳しくは、 契約について を参照してください。

会話型検索 (Conversational Search)

「会話型検索 (Conversational Search)」 プロジェクトは、お客様がチャットボット ( アシスタントとも呼ばれる) に尋ねる質問に対する回答として、接続されたデータ・コレクションから情報を返します。

IBM® watsonx™ Assistant と Discovery を一緒に使用すると、企業データを再配置したりコピーしたりすることなく、技術コンテンツやその他の知識ベース・リソースにアシスタントがアクセスできるようになります。 同期機能が組み込まれているため、アシスタントは使用可能な最新の情報を共有できます。 watsonx Assistant に用意されている統合を使用して、このプロジェクトに接続するアシスタントを、会社の Web サイトを含むさまざまなプラットフォームに数分でデプロイします。

このタイプのプロジェクトに追加する文書は、自動的にエンリッチされません。

仮想アシスタントからさらに複雑な検索を実行する必要がある場合は、 「会話型検索 (Conversational Search)」 プロジェクトではなく、 「文書の取得 (Document Retrieval)」 プロジェクトを作成することをお勧めします。 詳しくは、 チャットボットの適切なプロジェクト・タイプの選択 を参照してください。

IBM Cloud 有効化を検討するもう 1 つの機能は、 「回答を強調する」 機能です。 有効にすると、アシスタントと対話する顧客に返される回答には、検索応答内で太字フォントで強調表示された正確な回答が表示されます。 正確な回答の決定方法について詳しくは、 回答の検索 を参照してください。

watsonx Assistant 検索スキルの作成について詳しくは、デプロイメントの該当する資料を参照してください。

コンテンツ・マイニング

このプロジェクト・タイプは、データ内の隠れた洞察、トレンド、および関係を発見する場合に使用します。

このタイプのプロジェクトを作成できるのは、インストール済みデプロイメント (IBM Cloud Pak for Data) またはプレミアム・プランまたはエンタープライズ・プランの管理対象デプロイメントのユーザーのみです。

このプロジェクト・タイプは、CSV ファイルをアップロードすることによって、またはデータベース・データ・ソースに接続することによって追加するデータなど、構造化データを分析する場合に特に役立ちます。 Discovery ユーザー・インターフェースからこのタイプのプロジェクトに追加できるコレクションは 1 つのみです。

初期コレクションの一部として追加した文書は、以下の方法で自動的にエンリッチされます。

  • 品詞が識別され、タグ付けされます。

コレクションを追加し、オプションで追加のエンリッチメントをデータに適用すると、すべての機能を備えたアプリケーションをデプロイできるようになります。 このアプリケーションを使用して、データを詳しく調べることができます。 アプリケーションの使用について詳しくは、「 デプロイされたコンテンツ・マイニング・アプリケーションを使用したデータの分析」を参照してください。

コンテンツ・マイニング・アプリケーションから、他のプロジェクト・タイプでは使用できない以下のエンリッチメント・タイプを作成できます。

デプロイ済みのコンテンツ・マイニング・アプリケーションからコレクションを作成できます。 作成したコレクションは、既存のコンテンツ・マイニング・プロジェクトに追加されません。 コレクションを保管するための新規コンテンツ・マイニング・プロジェクトが作成されます。 コレクションには、アップロードされた CSV ファイルのみを含めることができます。 生成されるプロジェクトには、コレクションに指定した名前が付けられます。

このタイプのプロジェクトに追加するデータは構造化されていることが多いため、API を使用して Discovery Query Language (DQL) で照会をサブミットすることを検討してください。 DQL 照会を使用すると、特定のフィールドから情報を取得したり、特定のエンリッチ・タイプのメンションを検索したりできます。 コンテンツ・マイニング ・プロジェクトに関連性トレーニングを適用することはできません。

カスタム

他のいずれかのプロジェクト・タイプを使用しない場合は、このタイプを選択します。 エンリッチメントは自動的に適用されないため、ユース・ケースに必要なエンリッチメントのみを追加できます。

基本プロジェクトのデフォルト

一部のエンリッチメントおよび照会結果の設定は、デフォルトで各プロジェクト・タイプに適用されます。

基本プロジェクト・デフォルト
プロジェクト・タイプ デフォルトのエンリッチメント デフォルトの照会結果設定
IBM Cloud インテリジェントな文書処理 エンティティー ファセット (エンティティー別)、パッセージ
文書の取得 (Document Retrieval) エンティティー ファセット (エンティティー別)、パッセージ
契約のドキュメント取得 エンティティー、表の理解、および契約 ファセット (カテゴリー、ネーチャー、契約期間、契約支払期間、契約タイプ、契約通貨、送り状購入者、送り状供給業者、送り状通貨、注文書購入者、注文書供給業者、注文書支払期間別) および表の検索
会話型検索 (Conversational Search) なし パッセージ
コンテンツ・マイニング 品詞 なし
カスタム なし パッセージ

プロジェクトの制限

作成できるプロジェクトの数は、 Discovery プラン・タイプによって異なります。

計画の詳細
プラン サービス・インスタンスごとのプロジェクト
Cloud Pak for Data Unlimited
プレミアム 100
エンタープライズ 100
プラス (試用版を含む) 20

サンプル・プロジェクトは、プロジェクトの総数から除外されます。

プロジェクトの名前変更

*「サンプル・プロジェクト」*の名前を変更することはできません。

プロジェクトを作成した後に名前変更するには、以下の手順を実行します。

  1. 「マイ・プロジェクト」 ページに移動します。
  2. 名前変更するプロジェクトを見つけ、 「プロジェクト・アクション」 アイコン オーバーフロー・メニュー をクリックし、 「名前変更」 を選択します。
  3. プロジェクト名を編集し、 「適用」 をクリックします。

プロジェクトの削除

プロジェクトを削除するが、プロジェクトからのコレクションは保持する場合は、これらのステップを実行する前に、コレクションを別のプロジェクトと共有します。 別のプロジェクト (複数のコレクションを許可するタイプ) から、 「コレクションの管理」 タブを開きます。 「新規コレクション」 をクリックし、 「既存のコレクションのデータを再使用」 をクリックします。 保持する収集を選択し、 「終了」 をクリックします。

*「サンプル・プロジェクト」*は削除できません。

プロジェクトを削除するには、以下の手順を実行します。

  1. 「マイ・プロジェクト」 ページに移動します。
  2. 削除するプロジェクトを見つけ、 「プロジェクト・アクション」 アイコン オーバーフロー・メニュー をクリックし、 「削除」 を選択します。
  3. **「削除」**をクリックします。