Caricamento dei dati in Netezza Performance Server

Esistono diversi modi in cui puoi caricare i tuoi dati su IBM® Netezza® Performance Server for IBM Cloud Pak® for Data as a Service. Scopri come caricare i dati dalla tua macchina locale o da S3.

Prima di iniziare

Scaricare i pacchetti client da Fix Central e installarli, come descritto in Installazione dei pacchetti client.

Uno dei modi più semplici per caricare i tuoi dati in NPSaaS è utilizzando il comando nzsql. nzsql fornisce un'interfaccia che puoi utilizzare per eseguire i comandi SQL nell'host NPSaaS.

Non è possibile utilizzare la console Web per caricare dati.

Accedere a Netezza Performance Server.

In questo esempio, viene utilizzato il comando the nzsql, ma è possibile utilizzare altri client.

Come spiegato in Connessione a NPSaaS, puoi eseguire il provisioning di NPSaaS con un endpoint privato o con endpoint pubblici e privati. Ogni tipo di endpoint fornisce una serie di due nomi host che puoi collegare a NPSaaS.

Per caricare i dati, è necessario essere l'utente admin o il proprietario del database o schema. Se si stanno caricando i dati per la prima volta e non si stanno caricando i dati in una tabella preesistente, è necessario disporre anche del privilegio Create Table. Se è necessario modificare i privilegi utente, consultare Gestione degli utenti.

nzsql -host <nps_host_ip> -u <user> -pw <password>

Dettagli
Input	Descrizione
ip_host_nps	Specifica l'indirizzo IP della tua istanza. Per richiamare `NPS HOST IP`: Accedere al proprio account IBM Cloud. Vai a Private endpoints> Service instance details. Selezionare l'istanza. L'indirizzo IP dell'istanza viene visualizzato ora nella pagina.
Utente	Specifica il nome utente.
Password	Specifica la password per l'utente.

Esempio:

nzsql -host X.XX.XXX.XXX -u admin -pw password
Welcome to nzsql, the IBM Netezza SQL interactive terminal.
Type:  \h for help with SQL commands
       \? for help on internal slash commands
       \g or terminate with semicolon to execute query
       \q to quit

SYSTEM.ADMIN(ADMIN)=>

Caricamento dei dati dai sistemi locali

Preparare il file di dati locale che si desidera caricare:
1. Notare le colonne.
2. Prendere nota della posizione del file.
3. Assicurarsi che i dati vengano salvati in un file delimitato, ad esempio un file separato da virgole (CSV).

Creare una tabella utilizzando il comando CREATE TABLE AS.

Il comando CREATE TABLE AS crea una tabella su NPSaaS e la riempie con i dati dal tuo file di dati locale.

Come parte di questo comando, il file di dati locale viene trasformato in una tabella esterna transitoria. In altre parole, il tuo file di dati locale viene temporaneamente trattato come una tabella di database che puoi interrogare per il caricamento in una tabella NPSaaS. Una volta terminato, la tabella esterna transitoria viene automaticamente eliminata.

CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file_path> (<col1>, <col2>, ...) USING (RemoteSource <source_type> DELIM <delimiter_type> SkipRows <number_of_rows>);

Dove:

Dettagli
Input	Descrizione
tabella	Specifica un nome per la tabella che si sta creando.
file_path	Specifica l'ubicazione del file di dati origine che si sta caricando. Questo file di dati di origine viene trasformato in una tabella esterna transitoria.
col1, col2, ...	Specificare i nomi colonna che corrispondono ai nomi colonna dal file che si sta caricando.
Source_Type	Specifica che il file di dati origine è remoto. Quando carichi i dati utilizzando tabelle esterne, per impostazione predefinita, il percorso del file di dati di origine si presume sia sull'host NPSaaS. Se si desidera caricare i dati dalla macchina locale, è necessario utilizzare l'opzione `RemoteSource`. Per il client `nzsql`, specificare `RemoteSource 'NZSQL'`. Per ulteriori informazioni, consultare l'opzione RemoteSource.
tipo_delimitatore	Specifica il delimitatore utilizzato nel file di dati di origine. Per ulteriori informazioni, consultare Opzione delimitatore.
numero_di_righe	Specifica il numero di righe iniziali da ignorare prima di caricare i dati. Per ulteriori informazioni, consultare l'opzione SkipRows.

Esempio:

CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/home/user/Downloads/customer_data.csv' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (RemoteSource 'nzsql' DELIM ',' SkipRows 1);

Per ulteriori esempi sul caricamento dei dati con tabelle esterne, consultare Tabelle esterne.

I tuoi dati vengono caricati in NPSaaS. È possibile avviare l'esecuzione delle interrogazioni ora.

Caricamento dei dati da Amazon S3

Puoi caricare i tuoi dati in NPSaaS da un file di dati su Amazon S3 che hai precedentemente caricato lì.

Preparare i dati da caricare.
1. Assicurarsi che i dati siano su Amazon S3.
2. Notare il formato del file.

Su NPSaaS, crea una tabella utilizzando il comando CREATE TABLE AS.

Il comando CREATE TABLE AS crea una tabella su NPSaaS e la riempie con dati da S3.

Come parte di questo comando, i file di dati vengono trasformati in una tabella esterna transitoria. In altre parole, il tuo file di dati viene temporaneamente considerato come una tabella di database che puoi interrogare per il caricamento in una tabella NPSaaS. Una volta terminato, la tabella esterna transitoria viene automaticamente eliminata.

CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file> USING (
 REMOTESOURCE <source_type>
 DELIM <delimiter_type>
 UNIQUEID <unique_ID>
 ACCESSKEYID <access_key_ID>
 SECRETACCESSKEY <secret_access_key>
 DEFAULTREGION <default_region>
 BUCKETURL <bucket_URL>
 ENDPOINT <endpoint>
 MULTIPARTSIZEMB <multipart_size>
 );

Dove:

Dettagli
Input	Descrizione
Source_Type	Specifica il tipo di origine. È necessario utilizzare `S3`.
tipo_delimitatore	Specifica il tipo di delimitatore utilizzato nel file di dati di origine.
ID_univoco	Facoltativo. Specifica lo spazio nomi utilizzato per raggruppare i dati nel bucket cloud.
ACCESS_KEY_ID	Specifica la chiave di accesso.
SECRET_ACCESS_KEY	Specifica la chiave di accesso segreta.
Regione predefinita	Specifica la regione in cui si trova il bucket.
URL_bucket	Specifica il nome del bucket.
endpoint	Specifica l'URL della regione per accedere al bucket.
dimensione_multiparte	Specifica la dimensione di ciascuna parte in un caricamento multiparte. Il valore predefinito è 105 MB; un massimo di 105 MB di buffer può essere caricato in una richiesta.

Esempio:

CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/customer_data.dat' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (
   REMOTESOURCE 'S3'
   DELIM '|'
   UNIQUEID 'sample'
   ACCESSKEYID 'xxxxx'
   SECRETACCESSKEY 'xxxxx'
   DEFAULTREGION 'ap-geo'
   BUCKETURL 'my.sample.bucket'
   ENDPOINT 's3.eu-west-1.cloud-object-storage.appdomain.cloud'
   MULTIPARTSIZEMB '50'
   );

I tuoi dati vengono caricati in NPSaaS. È possibile avviare l'esecuzione delle interrogazioni ora.