IBM Cloud Docs

查询引擎入门

查询引擎入门

成功配置Presto引擎后，通过运行测试查询、创建第一个模式和表，探索Presto的功能，从而开始您的watsonx.data体验。

在本教程中，您将学习执行一些测试查询以了解Presto的功能，并创建第一个模式以建立组织数据的基础结构。当您的模式到位时，您可以继续创建表。表是存储和组织数据的基本组件。

样本场景: 要了解:

在watsonx.data中使用Presto查询表格｝
关于可用于启动的数据
了解如何创建模式和表以存储，组织和查询数据。

目标

运行测试查询
创建第一个模式和表

准备工作

本教程需要:

在 IBM Cloud上预订 watsonx.data。
配置 watsonx.data 实例。有关更多信息，请参阅供应实例。

运行测试查询

本节教程介绍如何使用查询工作区，并运行测试查询以熟悉Presto引擎的工作。

要运行 SQL 查询，请执行以下步骤：

从导航菜单中选择 SQL。 查询工作区页面打开。
Select the Presto engine from the 发动机 list.
转至 系统和基准数据。watsonx.data 提供缺省目录 tpcds 和 tpch。这些目录提供自动生成的数据以进行基准测试。您还可以将其用于运行样本查询和数据。
从 tpch 目录中选择模式 (例如，Tiny)，然后选择表 (例如，Customer)。单击溢出菜单以选择 生成路径或 生成 SELECT。
选择 生成选择 并选择限制，例如 100。
单击 运行时间 以运行查询。
选择 结果集 或 详细信息 选项卡以查看结果。如果需要，可以保存查询。

保存数据

从导航菜单中选择数据管理器。 数据管理器页面打开。
选择 iceberg_data 目录。缺省情况下，目录可用。
单击创建。选择 创建模式 以在 iceberg_data 目录下创建模式。有关更多信息，请参阅创建模式。
为模式提供名称，例如 new_schema。
要存储数据，必须在模式中创建表。使用以下选项之一创建表格：

选项 1: 您可以通过运行 SQL 查询来创建表 (使用 tpcds 目录中提供的缺省数据)。

a. 转至“查询工作空间”页面。

b. 运行 创建表 查询。将显示样本查询:
```
  CREATE TABLE IF NOT EXISTS
  "iceberg_data"."new_schema"."new_table"
  AS SELECT * FROM "tpcds"."sf1"."catalog_returns"
  LIMIT
   100;
```
SQL 查询将在 iceberg_data catalog 中使用 new_schema 创建名为 new_table 的表。它还从 catalog_returns 表装入数据，该表使用 tpcds 目录中的 sf1 模式。

您可以转至 iceberg_data 目录，并运行 SELECT 查询语句以验证 new_table 是否包含数据。
选项 2: 您可以通过上载自己的数据 (.csv，parquet，.json 和 .txt 格式) 来创建表。

a. 转至“数据管理器”页面。

b. 您可以使用 .csv，parquet，.json 和 .txt 格式的数据创建表。要执行此操作，请参阅创建表。

您可以转至“查询工作空间”页面。从 iceberg_data 目录中选择新创建的表，然后运行 SELECT 查询语句以验证该表中是否包含数据。

从创建的表中查询数据

您可以从在 iceberg_data 目录中创建的新表运行 生成 SELECT 查询。为此:

从导航菜单中，转至“查询工作空间”页面。
选择表，new_table 在模式中，new_schema 在目录中 iceberg_data。
选择 生成 SELECT。

编辑 100 的限制，如以下示例中所示:

  SELECT * FROM
  "iceberg_data"."new_schema"."new_table"
  LIMIT
   100;

单击 运行时间 以运行查询。
选择 结果集 或 详细信息 选项卡以查看结果。您还可以保存查询。