Carga de datos en Netezza Performance Server
Existen diferentes formas en las que puede cargar los datos en IBM® Netezza® Performance Server for IBM Cloud Pak® for Data as a Service. Aprenda a cargar datos desde la máquina local o desde S3.
Antes de empezar
-
Descargue los paquetes de cliente de Fix Central e instálelos tal como se describe en Instalación de paquetes de cliente.
Una de las formas más sencillas de cargar los datos en NPSaaS es utilizando el mandato
nzsql
.nzsql
proporciona una interfaz que puede utilizar para ejecutar mandatos SQL en el host NPSaaS.No puede utilizar la consola web para cargar datos.
-
Inicie sesión en Netezza Performance Server.
En este ejemplo, se utiliza el mandato
nzsql
, pero puede utilizar otros clientes.Tal como se explica en Conexión a NPSaaS, puede suministrar NPSaaS con un punto final privado o puntos finales públicos y privados. Cada tipo de punto final proporciona un conjunto de dos nombres de host que puede conectar a NPSaaS.
Para cargar datos, debe ser el usuario administrativo o el propietario de la base de datos o el esquema. Si está cargando datos por primera vez y no está cargando datos en una tabla preexistente, también debe tener el privilegio
Create Table
. Si necesita cambiar los privilegios de usuario, consulte Gestión de usuarios.nzsql -host <nps_host_ip> -u <user> -pw <password>
Detalles Entrada Descripción ip_host_nps Especifica la dirección IP de la instancia.
Para recuperarNPS HOST IP
:- Inicie sesión en su cuenta de IBM Cloud.
- Vaya a Puntos finales privados > Detalles de instancia de servicio.
- Seleccione su instancia.
La dirección IP de la instancia se muestra ahora en la página.
usuario Especifica el nombre de usuario. Contraseña Especifica la contraseña del usuario. Ejemplo:
nzsql -host X.XX.XXX.XXX -u admin -pw password Welcome to nzsql, the IBM Netezza SQL interactive terminal. Type: \h for help with SQL commands \? for help on internal slash commands \g or terminate with semicolon to execute query \q to quit SYSTEM.ADMIN(ADMIN)=>
Carga de datos desde sistemas locales
-
Prepare el archivo de datos local que desea cargar:
- Anote las columnas.
- Anote la ubicación del archivo.
- Asegúrese de que los datos se guardan en un archivo delimitado, como un archivo separado por comas (CSV).
-
Cree una tabla utilizando el mandato
CREATE TABLE AS
.El mandato
CREATE TABLE AS
crea una tabla en NPSaaS y la llena con los datos del archivo de datos local.Como parte de este mandato, el archivo de datos local se convierte en una tabla externa transitoria. En otras palabras, el archivo de datos local se trata temporalmente como una tabla de base de datos que puede consultar para cargarlo en una tabla NPSaaS. Cuando haya terminado, la tabla externa transitoria se suprimirá automáticamente.
CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file_path> (<col1>, <col2>, ...) USING (RemoteSource <source_type> DELIM <delimiter_type> SkipRows <number_of_rows>);
Donde:
Detalles Entrada Descripción tabla Especifica un nombre para la tabla que está creando. file_path Especifica la ubicación del archivo de datos de origen que está cargando. Este archivo de datos de origen se convierte en una tabla externa transitoria. col1, col2, ... Especifique los nombres de columna que corresponden a los nombres de columna del archivo que está cargando. Source_Type Especifica que el archivo de datos de origen es remoto. Al cargar datos utilizando tablas externas, de forma predeterminada, se presupone que la vía de acceso del archivo de datos de origen está en el host NPSaaS. Si desea cargar datos desde la máquina local, debe utilizar la opción RemoteSource
. Para el clientenzsql
, especifiqueRemoteSource 'NZSQL'
. Para obtener más información, consulte OpciónRemoteSource.tipo_delimitador Especifica el delimitador que se utiliza en el archivo de datos de origen. Para obtener más información, consulte Opción de delimitador. número_de_filas Especifica el número de filas iniciales que se deben omitir antes de cargar los datos. Para obtener más información, consulte OpciónSkipRows. Ejemplo:
CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/home/user/Downloads/customer_data.csv' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (RemoteSource 'nzsql' DELIM ',' SkipRows 1);
Para obtener más ejemplos sobre la carga de datos con tablas externas, consulte Tablas externas.
Los datos se cargan en NPSaaS. Puede empezar a ejecutar consultas ahora.
Carga de datos desde Amazon S3
Puede cargar datos en NPSaaS desde un archivo de datos en Amazon S3 que ha cargado anteriormente allí.
-
Prepare los datos que desea cargar.
- Asegúrese de que los datos estén en Amazon S3.
- Anote el formato de archivo.
-
En NPSaaS, cree una tabla utilizando el mandato
CREATE TABLE AS
.El mandato
CREATE TABLE AS
crea una tabla en NPSaaS y la llena con los datos de S3.Como parte de este mandato, el archivo de datos se convierte en una tabla externa transitoria. En otras palabras, el archivo de datos se trata temporalmente como una tabla de base de datos que puede consultar para cargarlo en una tabla NPSaaS. Cuando haya terminado, la tabla externa transitoria se suprimirá automáticamente.
CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file> USING ( REMOTESOURCE <source_type> DELIM <delimiter_type> UNIQUEID <unique_ID> ACCESSKEYID <access_key_ID> SECRETACCESSKEY <secret_access_key> DEFAULTREGION <default_region> BUCKETURL <bucket_URL> ENDPOINT <endpoint> MULTIPARTSIZEMB <multipart_size> );
Donde:
Detalles Entrada Descripción Source_Type Especifica el tipo de origen. Debe utilizar ' S3
.tipo_delimitador Especifica el tipo de delimitador que se utiliza en el archivo de datos de origen. ID_exclusivo Opcional. Especifica el espacio de nombres que se utiliza para agrupar datos en el grupo de nube. access_key_id Especifica la clave de acceso. secret_access_key Especifica la clave de acceso secreta. región_predeterminada Especifica la región en la que se encuentra el cubo. URL de grupo Especifica el nombre del cubo. punto final Especifica el URL de región para acceder al grupo. tamaño_multiparte Especifica el tamaño de cada parte en una carga de varias partes. El valor predeterminado es 105 MB; se puede cargar un máximo de 105 MB de almacenamiento intermedio en una solicitud. Ejemplo:
CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/customer_data.dat' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING ( REMOTESOURCE 'S3' DELIM '|' UNIQUEID 'sample' ACCESSKEYID 'xxxxx' SECRETACCESSKEY 'xxxxx' DEFAULTREGION 'ap-geo' BUCKETURL 'my.sample.bucket' ENDPOINT 's3.eu-west-1.cloud-object-storage.appdomain.cloud' MULTIPARTSIZEMB '50' );
Los datos se cargan en NPSaaS. Puede empezar a ejecutar consultas ahora.