IBM Cloud Docs
クエリー・エンジンの概要

クエリー・エンジンの概要

After successfully provisioning the Presto engine, kickstart your watsonx.data experience by exploring the capabilities of Presto by running test queries, creating your first schema, and tables.

このチュートリアルでは、Prestoの機能を理解するためにいくつかのテストクエリを実行し、データを整理するための基礎構造を確立するために最初のスキーマを作成することを学びます。 スキーマが配置されたら、表の作成に進むことができます。 表は、データを保管および編成するための重要なコンポーネントです。

サンプル・シナリオ: 以下を理解します。

  • watsonx.data Prestoを使ったテーブルのクエリ
  • キック・スタートに使用可能なデータについて
  • データを保管、編成、および照会するためのスキーマおよび表の作成方法について説明します。

目標

  • テスト照会の実行
  • 最初のスキーマおよび表の作成

開始前に

このチュートリアルでは、以下が必要です。

  • IBM Cloudで watsonx.data にサブスクライブします。
  • watsonx.data インスタンスをプロビジョニングします。 詳しくは、 インスタンスのプロビジョンを参照してください。

テスト照会の実行

チュートリアルのこのセクションでは、Queryワークスペースの使用方法と、Prestoエンジンの動作に慣れるためのテストクエリの実行方法について説明します。

SQLクエリーを実行するには、以下の手順を実行する:

  1. ナビゲーション・メニューから SQLを選択する。 クエリ・ワークスペース・ページが開きます。
  2. エンジンリストからPrestoエンジンを選択します。
  3. System and benchmarking data に移動します。 watsonx.data には、デフォルト・カタログ tpcdstpch が用意されています。 これらのカタログは、ベンチマーク用に自動生成されたデータを提供します。 これは、サンプル照会およびデータの実行にも使用できます。
  4. tpch カタログからスキーマ (例えば、 Tiny) を選択してから、表 (例えば、 Customer) を選択します。 オーバーフロー・メニューをクリックして、 「パスの生成」 または 「SELECT の生成」 を選択します。
  5. 「選択の生成」 を選択し、制限 (例: 100) を選択します。
  6. Run onをクリックしてクエリを実行する。
  7. 「結果セット」 または 「詳細」 タブを選択して、結果を表示します。 必要に応じて、照会を保存できます。

データの保存

  1. ナビゲーションメニューから、 データマネージャーを選択する。 データマネージャーページが開きます。
  2. iceberg_data カタログを選択する。 カタログはデフォルトで使用可能です。
  3. 「作成」 をクリックします。 「スキーマの作成」 を選択して、 iceberg_data カタログの下にスキーマを作成します。 詳しくは、 スキーマの作成を参照してください。
  4. スキーマに new_schema などの名前を付けます。
  5. データを保管するには、スキーマ内に表を作成する必要があります。 テーブルを作成するには、以下のいずれかのオプションを使用します:
  • オプション 1: SQL 照会を実行することにより、( tpcds カタログで使用可能なデフォルト・データを使用して) 表を作成することができます。

    a. 「照会ワークスペース」 ページに移動します。

    b. 「表の作成」 照会を実行します。 サンプル照会を以下に示します。

      CREATE TABLE IF NOT EXISTS
      "iceberg_data"."new_schema"."new_table"
      AS SELECT * FROM "tpcds"."sf1"."catalog_returns"
      LIMIT
       100;
    

    SQL 照会は、 iceberg_data catalog 内に new_schema を使用して new_table という名前の表を作成します。 また、 tpcds カタログ内の sf1 スキーマを使用する catalog_returns 表からデータをロードします。

    iceberg_data カタログに移動し、SELECT 照会ステートメントを実行して、 new_table にデータが含まれているかどうかを確認できます。

  • オプション 2: 独自のデータ (.csv、parquet、.json、.txt 形式) をアップロードして表を作成できます。

    a. 「データ・マネージャー」 ページに移動します。

    b. .csv、parquet、.json、.txt の形式のデータを使用して表を作成できます。 これを行うには、 表の作成を参照してください。

    「照会ワークスペース」 ページに移動できます。 新しく作成された表を iceberg_data カタログから選択し、SELECT 照会ステートメントを実行して、表にデータが含まれているかどうかを確認します。

作成された表からのデータの照会

iceberg_data カタログ内に作成された新しい表から Generate SELECT 照会を実行できます。 これを行うには、以下の手順

  1. ナビゲーション・メニューから、 「照会ワークスペース」 ページに移動します。
  2. new_table スキーマ内の new_schema カタログ内の iceberg_data 表を選択します。
  3. 「SELECT の生成」 を選択します。
  4. 例に示すように、制限を 100 に編集します。
      SELECT * FROM
      "iceberg_data"."new_schema"."new_table"
      LIMIT
       100;
    
  5. クエリを実行するには、[ 実行] をクリックします。
  6. 「結果セット」 または 「詳細」 タブを選択して、結果を表示します。 照会を保存することもできます。