将数据装入到 Netezza Performance Server
可以通过不同的方式在 IBM® Netezza® Performance Server for IBM Cloud Pak® for Data as a Service上装入数据。 了解如何装入数据 从本地机器 或 从 S3。
准备工作
-
从 Fix Central 下载客户机软件包,并按 安装客户机软件包 中所述进行安装。
将数据上载到 NPSaaS 的最简单方法之一是使用
nzsql
命令。nzsql
提供了可用于在 NPSaaS 主机上运行 SQL 命令的接口。不能使用 Web 控制台来装入数据。
-
登录到 Netezza Performance Server。
在此示例中,将使用
nzsql
命令,但您可以使用其他客户机。如 连接到 NPSaaS 中所述,您可以使用专用端点或公共端点和专用端点来供应 NPSaaS。 每种端点类型都提供一组可连接到 NPSaaS的两个主机名。
要装入数据,您必须是管理员用户,或者是数据库或模式的所有者。 如果您是首次装入数据,并且未将数据装入到预先存在的表中,那么您还必须具有
Create Table
特权。 如果需要更改用户特权,请参阅 管理用户。nzsql -host <nps_host_ip> -u <user> -pw <password>
详细信息 Input 描述 nps_host_ip 指定实例的 IP 地址。
要检索NPS HOST IP
:
1。 登录您的IBM Cloud帐户。- 转至 专用端点> 服务实例详细信息。
1。 选择实例。
现在,您的实例 IP 地址将显示在页面上。
用户 指定用户名。 密码 指定用户的密码。 示例:
nzsql -host X.XX.XXX.XXX -u admin -pw password Welcome to nzsql, the IBM Netezza SQL interactive terminal. Type: \h for help with SQL commands \? for help on internal slash commands \g or terminate with semicolon to execute query \q to quit SYSTEM.ADMIN(ADMIN)=>
- 转至 专用端点> 服务实例详细信息。
从本地系统装入数据
-
准备要装入的本地数据文件:
- 记下这些列。
- 请注意该文件的位置。
- 确保数据保存在定界文件中,例如逗号分隔 (CSV) 文件。
-
使用
CREATE TABLE AS
命令创建表。CREATE TABLE AS
命令在 NPSaaS 上创建表,并使用本地数据文件中的数据填充该表。作为此命令的一部分,本地数据文件将变成 瞬态外部表。 换言之,本地数据文件将临时作为数据库表处理,您可以查询该数据库表以将其装入到 NPSaaS 表。 完成后,将自动删除瞬态外部表。
CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file_path> (<col1>, <col2>, ...) USING (RemoteSource <source_type> DELIM <delimiter_type> SkipRows <number_of_rows>);
其中:
详细信息 Input 描述 表 指定要创建的表的名称。 file_path 指定要装入的源数据文件的位置。 此源数据文件将转换为瞬态外部表。 col1, col2, ... 指定与要装入的文件中的列名对应的列名。 Source_Type 指定源数据文件是远程的。 使用外部表装入数据时,缺省情况下,假定源数据文件路径位于 NPSaaS 主机上。 如果要从本地机器装入数据,必须使用 RemoteSource
选项。 对于nzsql
客户机,请指定RemoteSource 'NZSQL'
。 有关更多信息,请参阅 RemoteSource 选项。定界符类型 指定在源数据文件中使用的定界符。 有关更多信息,请参阅 定界符选项。 行数 (_of_rows) 指定在装入数据之前要跳过的初始行数。 有关更多信息,请参阅 SkipRows 选项。 示例:
CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/home/user/Downloads/customer_data.csv' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (RemoteSource 'nzsql' DELIM ',' SkipRows 1);
有关使用外部表装入数据的更多示例,请参阅 外部表。
您的数据将装入到 NPSaaS中。 您可以立即开始运行查询。
从 Amazon S3 装入数据
您可以从先前在其中上载的 Amazon S3 上的数据文件将数据装入到 NPSaaS。
-
准备要加载的数据。
- 确保数据位于 Amazon S3上。
- 记下文件格式。
-
在 NPSaaS上,使用
CREATE TABLE AS
命令创建表。CREATE TABLE AS
命令在 NPSaaS 上创建表,并使用 S3中的数据填充该表。作为此命令的一部分,您的数据文件将变成 瞬态外部表。 换言之,您的数据文件暂时被视为数据库表,您可以查询该表以将其装入到 NPSaaS 表。 完成后,将自动删除瞬态外部表。
CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file> USING ( REMOTESOURCE <source_type> DELIM <delimiter_type> UNIQUEID <unique_ID> ACCESSKEYID <access_key_ID> SECRETACCESSKEY <secret_access_key> DEFAULTREGION <default_region> BUCKETURL <bucket_URL> ENDPOINT <endpoint> MULTIPARTSIZEMB <multipart_size> );
其中:
详细信息 Input 描述 Source_Type 指定源类型。 您必须使用 " S3
。定界符类型 指定在源数据文件中使用的定界符类型。 unique_ID 可选。 指定用于对云存储区中的数据进行分组的名称空间。 ACCESS_KEY_ID 指定访问密钥。 SECRET_ACCESS_KEY 指定秘密访问密钥。 缺省区域 指定水桶所在的区域。 bucket_URL 指定水桶的名称。 端点 指定用于访问存储区的区域 URL。 multipart_size 指定多重部件上载中每个部件的大小。 缺省值为 105 MB; 可以在一个请求中上载最大为 105 MB 的缓冲区。 示例:
CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/customer_data.dat' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING ( REMOTESOURCE 'S3' DELIM '|' UNIQUEID 'sample' ACCESSKEYID 'xxxxx' SECRETACCESSKEY 'xxxxx' DEFAULTREGION 'ap-geo' BUCKETURL 'my.sample.bucket' ENDPOINT 's3.eu-west-1.cloud-object-storage.appdomain.cloud' MULTIPARTSIZEMB '50' );
您的数据将装入到 NPSaaS中。 您可以立即开始运行查询。