IBM Cloud Docs
将数据装入到 Netezza Performance Server

将数据装入到 Netezza Performance Server

可以通过不同的方式在 IBM® Netezza® Performance Server for IBM Cloud Pak® for Data as a Service上装入数据。 了解如何装入数据 从本地机器从 S3

准备工作

  1. 从 Fix Central 下载客户机软件包,并按 安装客户机软件包 中所述进行安装。

    将数据上载到 NPSaaS 的最简单方法之一是使用 nzsql 命令。nzsql 提供了可用于在 NPSaaS 主机上运行 SQL 命令的接口。

    不能使用 Web 控制台来装入数据。

  2. 登录到 Netezza Performance Server。

    在此示例中,将使用 nzsql 命令,但您可以使用其他客户机。

    连接到 NPSaaS 中所述,您可以使用专用端点或公共端点和专用端点来供应 NPSaaS。 每种端点类型都提供一组可连接到 NPSaaS的两个主机名。

    要装入数据,您必须是管理员用户,或者是数据库或模式的所有者。 如果您是首次装入数据,并且未将数据装入到预先存在的表中,那么您还必须具有 Create Table 特权。 如果需要更改用户特权,请参阅 管理用户

    nzsql -host <nps_host_ip> -u <user> -pw <password>
    
    详细信息
    Input 描述
    nps_host_ip

    指定实例的 IP 地址。
    要检索 NPS HOST IP:
    1。 登录您的IBM Cloud帐户。

    1. 转至 专用端点> 服务实例详细信息
      1。 选择实例。
      现在,您的实例 IP 地址将显示在页面上。
    用户 指定用户名。
    密码 指定用户的密码。

    示例:

    nzsql -host X.XX.XXX.XXX -u admin -pw password
    Welcome to nzsql, the IBM Netezza SQL interactive terminal.
    Type:  \h for help with SQL commands
           \? for help on internal slash commands
           \g or terminate with semicolon to execute query
           \q to quit
    
    SYSTEM.ADMIN(ADMIN)=>
    

从本地系统装入数据

  1. 准备要装入的本地数据文件:

    1. 记下这些列。
    2. 请注意该文件的位置。
    3. 确保数据保存在定界文件中,例如逗号分隔 (CSV) 文件。
  2. 使用 CREATE TABLE AS 命令创建表。

    CREATE TABLE AS 命令在 NPSaaS 上创建表,并使用本地数据文件中的数据填充该表。

    作为此命令的一部分,本地数据文件将变成 瞬态外部表。 换言之,本地数据文件将临时作为数据库表处理,您可以查询该数据库表以将其装入到 NPSaaS 表。 完成后,将自动删除瞬态外部表。

    CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file_path> (<col1>, <col2>, ...) USING (RemoteSource <source_type> DELIM <delimiter_type> SkipRows <number_of_rows>);
    

    其中:

    详细信息
    Input 描述
    指定要创建的表的名称。
    file_path 指定要装入的源数据文件的位置。 此源数据文件将转换为瞬态外部表。
    col1, col2, ... 指定与要装入的文件中的列名对应的列名。
    Source_Type 指定源数据文件是远程的。 使用外部表装入数据时,缺省情况下,假定源数据文件路径位于 NPSaaS 主机上。 如果要从本地机器装入数据,必须使用 RemoteSource 选项。 对于 nzsql 客户机,请指定 RemoteSource 'NZSQL'。 有关更多信息,请参阅 RemoteSource 选项
    定界符类型 指定在源数据文件中使用的定界符。 有关更多信息,请参阅 定界符选项
    行数 (_of_rows) 指定在装入数据之前要跳过的初始行数。 有关更多信息,请参阅 SkipRows 选项

    示例:

    CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/home/user/Downloads/customer_data.csv' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (RemoteSource 'nzsql' DELIM ',' SkipRows 1);
    

    有关使用外部表装入数据的更多示例,请参阅 外部表

    您的数据将装入到 NPSaaS中。 您可以立即开始运行查询。

从 Amazon S3 装入数据

您可以从先前在其中上载的 Amazon S3 上的数据文件将数据装入到 NPSaaS。

  1. 准备要加载的数据。

    1. 确保数据位于 Amazon S3上。
    2. 记下文件格式。
  2. 在 NPSaaS上,使用 CREATE TABLE AS 命令创建表。

    CREATE TABLE AS 命令在 NPSaaS 上创建表,并使用 S3中的数据填充该表。

    作为此命令的一部分,您的数据文件将变成 瞬态外部表。 换言之,您的数据文件暂时被视为数据库表,您可以查询该表以将其装入到 NPSaaS 表。 完成后,将自动删除瞬态外部表。

    CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file> USING (
     REMOTESOURCE <source_type>
     DELIM <delimiter_type>
     UNIQUEID <unique_ID>
     ACCESSKEYID <access_key_ID>
     SECRETACCESSKEY <secret_access_key>
     DEFAULTREGION <default_region>
     BUCKETURL <bucket_URL>
     ENDPOINT <endpoint>
     MULTIPARTSIZEMB <multipart_size>
     );
    

    其中:

    详细信息
    Input 描述
    Source_Type 指定源类型。 您必须使用 "S3
    定界符类型 指定在源数据文件中使用的定界符类型。
    unique_ID 可选。 指定用于对云存储区中的数据进行分组的名称空间。
    ACCESS_KEY_ID 指定访问密钥。
    SECRET_ACCESS_KEY 指定秘密访问密钥。
    缺省区域 指定水桶所在的区域。
    bucket_URL 指定水桶的名称。
    端点 指定用于访问存储区的区域 URL。
    multipart_size 指定多重部件上载中每个部件的大小。 缺省值为 105 MB; 可以在一个请求中上载最大为 105 MB 的缓冲区。

    示例:

    CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/customer_data.dat' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (
       REMOTESOURCE 'S3'
       DELIM '|'
       UNIQUEID 'sample'
       ACCESSKEYID 'xxxxx'
       SECRETACCESSKEY 'xxxxx'
       DEFAULTREGION 'ap-geo'
       BUCKETURL 'my.sample.bucket'
       ENDPOINT 's3.eu-west-1.cloud-object-storage.appdomain.cloud'
       MULTIPARTSIZEMB '50'
       );
    

您的数据将装入到 NPSaaS中。 您可以立即开始运行查询。