查询引擎入门
成功配置Presto引擎后,通过运行测试查询、创建第一个模式和表,探索Presto的功能,从而开始您的watsonx.data体验。
在本教程中,您将学习执行一些测试查询以了解Presto的功能,并创建第一个模式以建立组织数据的基础结构。 当您的模式到位时,您可以继续创建表。 表是存储和组织数据的基本组件。
样本场景: 要了解:
- 在watsonx.data中使用Presto查询表格}
- 关于可用于启动的数据
- 了解如何创建模式和表以存储,组织和查询数据。
目标
- 运行测试查询
- 创建第一个模式和表
准备工作
本教程需要:
- 在 IBM Cloud上预订 watsonx.data。
- 配置 watsonx.data 实例。 有关更多信息,请参阅 供应实例。
运行测试查询
本节教程介绍如何使用查询工作区,并运行测试查询以熟悉Presto引擎的工作。
要运行 SQL 查询,请执行以下步骤:
- 从导航菜单中选择 SQL。 查询工作区页面打开。
- Select the Presto engine from the 发动机 list.
- 转至 系统和基准数据。watsonx.data 提供缺省目录 tpcds 和 tpch。 这些目录提供自动生成的数据以进行基准测试。 您还可以将其用于运行样本查询和数据。
- 从 tpch 目录中选择模式 (例如,
Tiny
),然后选择表 (例如,Customer
)。 单击溢出菜单以选择 生成路径或 生成 SELECT。 - 选择 生成选择 并选择限制,例如 100。
- 单击 运行时间 以运行查询。
- 选择 结果集 或 详细信息 选项卡以查看结果。 如果需要,可以保存查询。
保存数据
- 从导航菜单中选择数据管理器。 数据管理器页面打开。
- 选择 iceberg_data 目录。 缺省情况下,目录可用。
- 单击创建。 选择 创建模式 以在 iceberg_data 目录下创建模式。 有关更多信息,请参阅 创建模式。
- 为模式提供名称,例如
new_schema
。 - 要存储数据,必须在模式中创建表。 使用以下选项之一创建表格:
-
选项 1: 您可以通过运行 SQL 查询来创建表 (使用 tpcds 目录中提供的缺省数据)。
a. 转至“查询工作空间”页面。
b. 运行 创建表 查询。 将显示样本查询:
CREATE TABLE IF NOT EXISTS "iceberg_data"."new_schema"."new_table" AS SELECT * FROM "tpcds"."sf1"."catalog_returns" LIMIT 100;
SQL 查询将在
iceberg_data catalog
中使用new_schema
创建名为new_table
的表。 它还从catalog_returns
表装入数据,该表使用tpcds
目录中的sf1
模式。您可以转至 iceberg_data 目录,并运行 SELECT 查询语句以验证
new_table
是否包含数据。 -
选项 2: 您可以通过上载自己的数据 (.csv,parquet,.json 和 .txt 格式) 来创建表。
a. 转至“数据管理器”页面。
b. 您可以使用 .csv,parquet,.json 和 .txt 格式的数据创建表。 要执行此操作,请参阅 创建表。
您可以转至“查询工作空间”页面。 从 iceberg_data 目录中选择新创建的表,然后运行 SELECT 查询语句以验证该表中是否包含数据。
从创建的表中查询数据
您可以从在 iceberg_data 目录中创建的新表运行 生成 SELECT 查询。 为此:
- 从导航菜单中,转至“查询工作空间”页面。
- 选择表,
new_table
在模式中,new_schema
在目录中iceberg_data
。 - 选择 生成 SELECT。
- 编辑 100 的限制,如以下示例中所示:
SELECT * FROM "iceberg_data"."new_schema"."new_table" LIMIT 100;
- 单击 运行时间 以运行查询。
- 选择 结果集 或 详细信息 选项卡以查看结果。 您还可以保存查询。