IBM Cloud Docs
watsonx.data Liteプランでの作業

watsonx.data Liteプランでの作業

ライト ・プランでは、無料で使用できる IBM® watsonx.data インスタンスをプロビジョンできます。キャパシティー (2000 リソース単位) に制限があり、30 日間の時間フレームのフィーチャーに制限があります。 このアカウントを使って、3つの異なるユースケース(Generative AI、High Performance BI、Data Engineering)に基づいてLiteプランのインスタンスを作成し、watsonx.dataを探索し、理解することができます。 ライト・プランの機能と制限について詳しくは、 ライト・プランを参照してください。

割り当てられたリソースユニットまたは時間がなくなると、すべてのLiteインスタンスが非アクティブになり、アクセスできなくなります。

リソースまたは時間制限なしですべてのフィーチャーおよび機能にアクセスするには、有料の IBM Cloud アカウントに Enterprise watsonx.data インスタンス が必要です。

このチュートリアルでは、 watsonx.data インスタンス (ライト・プラン) をプロビジョンし、その機能を検討する方法について学習します。

開始前に

watsonx.data ライト・プラン・インスタンスをプロビジョンするには、 IBM Cloud上にトライアル・アカウント (または有料アカウント) が必要です。 IBM Cloud トライアル・アカウントは、1 つのリソース・グループのみを持つことができます。 IBM Cloud トライアル・アカウントを作成するには、 トライアル・アカウント を参照してください。

watsonx.data ライト・プランのプロビジョニング

ライト・プラン・インスタンスをプロビジョンするには、 watsonx.data ライト・プランのプロビジョニング を参照してください。

watsonx.dataライトプランUIで始める

ライトプランの使用量は、インスタンスのプロビジョニング後に開始されます。 watsonx.dataインスタンスが使用されていなくても、リソースユニット(RU)は消費されます。 使用量を監視するには、使用量を見る を参照してください。 ただし、エンジンを一時停止または削除すると、RU 使用量が削減されます。 したがって、使用していないときはエンジンとサービスを一時停止して、IBM Cloud Lite プランの可用性を最大にします。 エンジンを一時停止するには エンジンを一時停止する を、エンジンを削除するには エンジンを削除する を参照してください。

  1. ライトプランのインスタンスをプロビジョニングすると、 「Welcome to watsonx.data 」ウィンドウが直接表示され、UIには選択したユースケースに基づくコンポーネント(エンジン、サービス、ストレージ)が含まれます。

ガイド付きワークフローの選択

watsonx.data機能を開始するために、UI はサンプル ワークシートを使用して Presto クエリを実行し、データ取り込みを実行するためのガイド付きワークフローを画面上で説明します。

  1. Welcome to watsonx.data ウィンドウから、次のいずれかのオプションを選択します:

    • ホームページ・ツアーに参加する: ホームページ・ツアーを見て、ホームページのエントリー・ポイントについてもっと知ることができます。

    • Start working with data: サンプルワークシートを使ってサンプルクエリを実行し、watsonx.data にデータを取り込んでみます。

    • Skip for now link : watsonx.dataのトップページを、ホームツアーに進まずに見たり、watsonx.dataで作業したりする。

サンプル・ワークシートを使用したデータ照会

データを照会するには、データの処理を開始オプションを使用します。 シームレスなクエリー体験を可能にするため、読み取り専用のサンプル IBM COS ストレージがすでに用意されており、デフォルトで Presto エンジンに関連付けられています。

  1. Start working with data オプションを選択し、Continue をクリックすると、以下のタイルが表示されます:

    • Explore a sample workheet: watsonx.dataライトプランインスタンスは、ユーザーがPrestoクエリを簡単に実行できるように、サンプルワークシート (クエリを含む) を提供します。 このタイルを選択し、画面の指示に従って最初の Presto クエリを実行してください。

    • Ingest data into watsonx.data: このタイルを選択してデータの取り込みを実行します。

    ハイパフォーマンスBI のユースケースでは、 tpcds 、クエリ用のベンチマーク・ワークシートとして利用できます。 データエンジニアリングGenAI のユースケースについては、 Gosales データがサンプルワークシートとして利用できる。

  2. Explore a sample worksheet を選択すると、Query workspace ページが開き、Sample worksheets セクションが強調表示されます。

  3. ワークシートを選択し、<engine> で実行」をクリックします。 クエリーは正常に実行され、Results セクションでクエリー結果を見ることができます。

    また、より多くのクエリ・ワークスペース関連の機能を調べることもできます。 SQLクエリの実行 を参照してください。

ストレージの選択とデータ取り込みの実行

データのインジェストには、Ingest data into watsonx.data オプションを使用します。 データ取り込みを行う前に、ストレージを関連付ける。 トライアルアカウントを使用すると、新しい IBM Cloud Object Storage インスタンスがデフォルト名 (watsonx-data-cos) で自動的にプロビジョニングされ、新しいバケットがデフォルト名 (watsonx-data-instanceId) でアタッチされます。 有料アカウントを使用する場合は、Create COS instance ページから新しい IBM Cloud Object Storage インスタンスをプロビジョニングする必要があります。

関連するストレージは、 Milvusではデータバケットとして、Sparkではエンジンホームバケットとして使用される。

  1. Ingest data into watsonx.data を選択すると、Data manager ページが開きます。

  2. データの取り込みを開始する前に、取り込み用のストレージを設定する。

  3. 今すぐセットアップをクリックします。 セットアップ完了ページが開きます。

    a. トライアルアカウントを使用する場合:

    • ユーザがIBM COSインスタンスを持っていない場合、新しいIBM COSインスタンスがデフォルト名(watsonx-data-cos)でプロビジョニングされ、新しいバケットがデフォルト名(watsonx-data-instanceId)でそれにアタッチされます。 ユーザがIBM COSインスタンスを持っている場合、そのインスタンスにデフォルト名(watsonx-data-instanceId)で新しいバケットがアタッチされます。
    • 「完了 (Finish)」 をクリックします。

    b. Paygoアカウントをご利用の場合:

    • Paygo アカウントに IBM COS インスタンスがある場合、そのインスタンスがフェッチされ、デフォルト名の新しいバケットがそれにアタッチされます。
    • ユーザーが IBM COS インスタンスを持っていない場合は、新しい IBM COS インスタンスをプロビジョニングする必要があります。 セットアップ完了ページから、新しいインスタンスを作成をクリックして、新しいCOSインスタンスを作成します。 ストレージを選択する。
    • 「完了 (Finish)」 をクリックします。

    また、インフラストラクチャー・マネージャーページからストレージを追加し、そこにデータを取り込むこともできます。

    1. Add Component > Storage >から、ストレージを選択します:

      最初のバケットを追加するために、いくつかのストレージのタイルが無効になっています:「というメッセージが表示されます 追加されるバケットは、その時点で利用可能なエンジンとサービスに基づいて有効化される。 利用可能なエンジンの条件を満たすバケツは、最初のバケツとして追加できるようになります。

      • Sparkの場合:IBM COSストレージ、Amazon S3。
      • Presto (Java) の場合:IBM COS ストレージ、Amazon S3、Google Cloud Storage。
      • Presto (C++) の場合:IBM COS ストレージ、Amazon S3、Google Cloud Storage。
      • Milvusの場合: IBM COSストレージ、 Amazon S3、 MinIO, Azure Data Lake Storage、 Google Cloud Storage。
    2. Add Component > Storage > IBM COS ストレージから:

      Liteプランのインスタンスには2つのオプションがある:

      a. COSインスタンスの検出 : IBM COSインスタンスと、 IBM Cloud アカウントに接続されたバケットを選択します。 COSインスタンスとバケットが見つからない場合、初回のみCOSインスタンスとバケットの作成機能が有効になり、生成されたデフォルトの命名スキームでCOSインスタンスとバケットが自動的に作成されます。 この自動化は、 watsonx.data インスタンスにバケットが登録されていない場合にのみ機能します。 複数の IBM COSインスタンスとバケットが検出された場合は、登録する目的のバケットが含まれる IBM COSインスタンスを選択し、 watsonx.data、次に以下の詳細を設定します

      バケットの登録
      フィールド 説明
      表示名 表示する名前を入力してください。 (以下の特殊文字は使用できません:!( ) = + : { } < >?' ; `).
      カタログの関連付け ストレージのカタログを追加するには、チェックボックスを選択します。 このカタログは、お客様のストレージに関連付けられており、その中に保存されたデータへの問い合わせインターフェースとして機能します。
      今すぐアクティブ化する ストレージをすぐに有効にするか、後で有効にします。
      カタログ名 カタログ名を入力してください。 (以下の特殊文字は使用できません:!( ) = + : { } < >?' ; `).

      b. 自分のバケットを登録する: 既存のインスタンスから既存のIBMCOS バケットを使用するか、新しいインスタンスをプロビジョニングすることができます。 新しいIBMCOS インスタンスをプロビジョニングするには、COS インスタンスの作成 を参照してください。

    watsonx.dataサービスが持ち込んだデータとどのように相互作用するかを調べるには、ストレージの追加とデータのクエリ を参照してください。

  4. Infrastructure manager に移動し、ストレージがエンジンに関連付けられ、Spark エンジンが実行中であることを確認します。

  5. 確認が終わったら、データ・マネージャーのページに行き、データのインジェストをクリックします。 データの取り込みを実行できる。 詳しくは データ取り込みについて をご覧ください。

既存のエンジンまたはサービスをスケーリングしたり、新しいエンジン (またはサービス) を追加したりすることはできません。 新しいエンジンまたはサービスを追加するには、既存のエンジンまたはサービスを削除する必要があります。

追加できるのは、 Presto ( Java )エンジン、Sparkエンジン(シングル・ノード、小規模 - 8 vCPU, 32GB ノード)、 Milvus サービス( Milvus サイズ指定あり、スターター - 100万ベクトル、インデックス・パラメーター - 64、セグメント・サイズ (1024))のみです。 制約事項を理解するには、 ライト・プランの機能と制約事項 を参照してください。

クエリー履歴の監視と管理

この機能は、Liteプラン・インスタンスではデフォルトで無効になっている。 この機能を有効にするには、QHMMを有効にする をご覧ください。 を、さらに詳しくは QHMM をご覧ください。

使用量の表示

watsonx.dataコンソールの2つの場所から、ライトプラン・リソースユニットの使用レベルを監視できます。

  1. ライト・プランの場合、 watsonx.data UI の 「請求処理」 セクションで、リソース単位の使用量を表示するウィジェットを表示できます。

    watsonx.dataコンソール UI > ようこそページ > 現在のプランタイルからもリソースユニットの消費量を見ることができます。

  2. 割り振られたリソース・ユニットまたは時間が使い尽くされると、ライト・インスタンスは中断されます。 ただし、IBM Cloud インスタンスを起動することはできますが、使用することはできません。 以下の手順に従って、 IBM Cloud ライト・インスタンスを手動で削除できます。

    1. ご使用の IBM Cloud アカウントにログインします。
    2. リソースリストをクリックする。 リソースのリストが表示されます。
    3. 「リソース・リスト」 で、 「データベース」 を展開します。
    4. インスタンスを削除するには、行の最後にあるオーバーフロー・メニュー・アイコンをクリックし、 「削除」 をクリックします。 削除の確認ダイアログが表示されます。
    5. **「削除」**をクリックします。

    インスタンスを手動で削除する方法について詳しくは、 インスタンスの削除 を参照してください。

企業プランへの継続

割り振られたリソース単位または時間が経過すると、インスタンスは非アクティブになり、アクセスできなくなります。

Enterprise watsonx.data インスタンスを作成して watsonx.data の使用を継続する場合、Lite プランからのデータがある同じストレージを使用できます。

  1. ライト・プランの完了前または完了後に、エンタープライズ・プラン・インスタンスを作成します。 詳しくは、 エンタープライズ・プラン を参照してください。

  2. 「クイック・スタート」 watsonx.data コンソール > 「バケットの構成」 ページに移動し、所有する COS バケットの詳細 (ライト・プランのデータを保管する) を指定します。 詳しくは、 クイック・スタート watsonx.data コンソール を参照してください。

セットアップが完了すると、 watsonx.data のホーム・ページ (エンタープライズ・プラン) が開きます。 ナビゲーションメニューから、データマネージャーを選択し、ライトプランのデータを含むCOSストレージバケットを表示します。