将数据装入到 Netezza Performance Server

可以通过不同的方式在 IBM® Netezza® Performance Server for IBM Cloud Pak® for Data as a Service上装入数据。了解如何装入数据从本地机器或从 S3。

准备工作

从 Fix Central 下载客户机软件包，并按安装客户机软件包中所述进行安装。

将数据上载到 NPSaaS 的最简单方法之一是使用 nzsql 命令。nzsql 提供了可用于在 NPSaaS 主机上运行 SQL 命令的接口。

不能使用 Web 控制台来装入数据。

登录到 Netezza Performance Server。

在此示例中，将使用 nzsql 命令，但您可以使用其他客户机。

如连接到 NPSaaS 中所述，您可以使用专用端点或公共端点和专用端点来供应 NPSaaS。每种端点类型都提供一组可连接到 NPSaaS的两个主机名。

要装入数据，您必须是管理员用户，或者是数据库或模式的所有者。如果您是首次装入数据，并且未将数据装入到预先存在的表中，那么您还必须具有 Create Table 特权。如果需要更改用户特权，请参阅管理用户。

nzsql -host <nps_host_ip> -u <user> -pw <password>

详细信息
Input	描述
nps_host_ip	指定实例的 IP 地址。要检索 `NPS HOST IP`: 1。登录您的IBM Cloud帐户。转至专用端点> 服务实例详细信息。 1。选择实例。现在，您的实例 IP 地址将显示在页面上。
用户	指定用户名。
密码	指定用户的密码。

示例：

nzsql -host X.XX.XXX.XXX -u admin -pw password
Welcome to nzsql, the IBM Netezza SQL interactive terminal.
Type:  \h for help with SQL commands
       \? for help on internal slash commands
       \g or terminate with semicolon to execute query
       \q to quit

SYSTEM.ADMIN(ADMIN)=>

从本地系统装入数据

准备要装入的本地数据文件:
1. 记下这些列。
2. 请注意该文件的位置。
3. 确保数据保存在定界文件中，例如逗号分隔 (CSV) 文件。

使用 CREATE TABLE AS 命令创建表。

CREATE TABLE AS 命令在 NPSaaS 上创建表，并使用本地数据文件中的数据填充该表。

作为此命令的一部分，本地数据文件将变成瞬态外部表。换言之，本地数据文件将临时作为数据库表处理，您可以查询该数据库表以将其装入到 NPSaaS 表。完成后，将自动删除瞬态外部表。

CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file_path> (<col1>, <col2>, ...) USING (RemoteSource <source_type> DELIM <delimiter_type> SkipRows <number_of_rows>);

其中：

详细信息
Input	描述
表	指定要创建的表的名称。
file_path	指定要装入的源数据文件的位置。此源数据文件将转换为瞬态外部表。
col1, col2, ...	指定与要装入的文件中的列名对应的列名。
Source_Type	指定源数据文件是远程的。使用外部表装入数据时，缺省情况下，假定源数据文件路径位于 NPSaaS 主机上。如果要从本地机器装入数据，必须使用 `RemoteSource` 选项。对于 `nzsql` 客户机，请指定 `RemoteSource 'NZSQL'`。有关更多信息，请参阅 RemoteSource 选项。
定界符类型	指定在源数据文件中使用的定界符。有关更多信息，请参阅定界符选项。
行数 (_of_rows)	指定在装入数据之前要跳过的初始行数。有关更多信息，请参阅 SkipRows 选项。

示例：

CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/home/user/Downloads/customer_data.csv' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (RemoteSource 'nzsql' DELIM ',' SkipRows 1);

有关使用外部表装入数据的更多示例，请参阅外部表。

您的数据将装入到 NPSaaS中。您可以立即开始运行查询。

从 Amazon S3 装入数据

您可以从先前在其中上载的 Amazon S3 上的数据文件将数据装入到 NPSaaS。

准备要加载的数据。
1. 确保数据位于 Amazon S3上。
2. 记下文件格式。

在 NPSaaS上，使用 CREATE TABLE AS 命令创建表。

CREATE TABLE AS 命令在 NPSaaS 上创建表，并使用 S3中的数据填充该表。

作为此命令的一部分，您的数据文件将变成瞬态外部表。换言之，您的数据文件暂时被视为数据库表，您可以查询该表以将其装入到 NPSaaS 表。完成后，将自动删除瞬态外部表。

CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file> USING (
 REMOTESOURCE <source_type>
 DELIM <delimiter_type>
 UNIQUEID <unique_ID>
 ACCESSKEYID <access_key_ID>
 SECRETACCESSKEY <secret_access_key>
 DEFAULTREGION <default_region>
 BUCKETURL <bucket_URL>
 ENDPOINT <endpoint>
 MULTIPARTSIZEMB <multipart_size>
 );

其中：

详细信息
Input	描述
Source_Type	指定源类型。您必须使用 "`S3`。
定界符类型	指定在源数据文件中使用的定界符类型。
unique_ID	可选。指定用于对云存储区中的数据进行分组的名称空间。
ACCESS_KEY_ID	指定访问密钥。
SECRET_ACCESS_KEY	指定秘密访问密钥。
缺省区域	指定水桶所在的区域。
bucket_URL	指定水桶的名称。
端点	指定用于访问存储区的区域 URL。
multipart_size	指定多重部件上载中每个部件的大小。缺省值为 105 MB; 可以在一个请求中上载最大为 105 MB 的缓冲区。

示例：

CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/customer_data.dat' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (
   REMOTESOURCE 'S3'
   DELIM '|'
   UNIQUEID 'sample'
   ACCESSKEYID 'xxxxx'
   SECRETACCESSKEY 'xxxxx'
   DEFAULTREGION 'ap-geo'
   BUCKETURL 'my.sample.bucket'
   ENDPOINT 's3.eu-west-1.cloud-object-storage.appdomain.cloud'
   MULTIPARTSIZEMB '50'
   );

您的数据将装入到 NPSaaS中。您可以立即开始运行查询。