IBM Cloud Docs
查询引擎入门

查询引擎入门

成功配置Presto引擎后,通过运行测试查询、创建第一个模式和表,探索Presto的功能,从而开始您的watsonx.data体验。

在本教程中,您将学习执行一些测试查询以了解Presto的功能,并创建第一个模式以建立组织数据的基础结构。 当您的模式到位时,您可以继续创建表。 表是存储和组织数据的基本组件。

样本场景: 要了解:

  • 在watsonx.data中使用Presto查询表格}
  • 关于可用于启动的数据
  • 了解如何创建模式和表以存储,组织和查询数据。

目标

  • 运行测试查询
  • 创建第一个模式和表

准备工作

本教程需要:

  • 在 IBM Cloud上预订 watsonx.data。
  • 配置 watsonx.data 实例。 有关更多信息,请参阅 供应实例

运行测试查询

本节教程介绍如何使用查询工作区,并运行测试查询以熟悉Presto引擎的工作。

要运行 SQL 查询,请执行以下步骤:

  1. 从导航菜单中选择 SQL查询工作区页面打开。
  2. Select the Presto engine from the 发动机 list.
  3. 转至 系统和基准数据。watsonx.data 提供缺省目录 tpcdstpch。 这些目录提供自动生成的数据以进行基准测试。 您还可以将其用于运行样本查询和数据。
  4. tpch 目录中选择模式 (例如,Tiny),然后选择表 (例如,Customer)。 单击溢出菜单以选择 生成路径生成 SELECT
  5. 选择 生成选择 并选择限制,例如 100。
  6. 单击 运行时间 以运行查询。
  7. 选择 结果集详细信息 选项卡以查看结果。 如果需要,可以保存查询。

保存数据

  1. 从导航菜单中选择数据管理器数据管理器页面打开。
  2. 选择 iceberg_data 目录。 缺省情况下,目录可用。
  3. 单击创建。 选择 创建模式 以在 iceberg_data 目录下创建模式。 有关更多信息,请参阅 创建模式
  4. 为模式提供名称,例如 new_schema
  5. 要存储数据,必须在模式中创建表。 使用以下选项之一创建表格:
  • 选项 1: 您可以通过运行 SQL 查询来创建表 (使用 tpcds 目录中提供的缺省数据)。

    a. 转至“查询工作空间”页面。

    b. 运行 创建表 查询。 将显示样本查询:

      CREATE TABLE IF NOT EXISTS
      "iceberg_data"."new_schema"."new_table"
      AS SELECT * FROM "tpcds"."sf1"."catalog_returns"
      LIMIT
       100;
    

    SQL 查询将在 iceberg_data catalog 中使用 new_schema 创建名为 new_table 的表。 它还从 catalog_returns 表装入数据,该表使用 tpcds 目录中的 sf1 模式。

    您可以转至 iceberg_data 目录,并运行 SELECT 查询语句以验证 new_table 是否包含数据。

  • 选项 2: 您可以通过上载自己的数据 (.csv,parquet,.json 和 .txt 格式) 来创建表。

    a. 转至“数据管理器”页面。

    b. 您可以使用 .csv,parquet,.json 和 .txt 格式的数据创建表。 要执行此操作,请参阅 创建表

    您可以转至“查询工作空间”页面。 从 iceberg_data 目录中选择新创建的表,然后运行 SELECT 查询语句以验证该表中是否包含数据。

从创建的表中查询数据

您可以从在 iceberg_data 目录中创建的新表运行 生成 SELECT 查询。 为此:

  1. 从导航菜单中,转至“查询工作空间”页面。
  2. 选择表,new_table 在模式中,new_schema 在目录中 iceberg_data
  3. 选择 生成 SELECT
  4. 编辑 100 的限制,如以下示例中所示:
      SELECT * FROM
      "iceberg_data"."new_schema"."new_table"
      LIMIT
       100;
    
  5. 单击 运行时间 以运行查询。
  6. 选择 结果集详细信息 选项卡以查看结果。 您还可以保存查询。