IBM Cloud Docs
Caricamento dei dati in Netezza Performance Server

Caricamento dei dati in Netezza Performance Server

Esistono diversi modi in cui puoi caricare i tuoi dati su IBM® Netezza® Performance Server for IBM Cloud Pak® for Data as a Service. Scopri come caricare i dati dalla tua macchina locale o da S3.

Prima di iniziare

  1. Scaricare i pacchetti client da Fix Central e installarli, come descritto in Installazione dei pacchetti client.

    Uno dei modi più semplici per caricare i tuoi dati in NPSaaS è utilizzando il comando nzsql. nzsql fornisce un'interfaccia che puoi utilizzare per eseguire i comandi SQL nell'host NPSaaS.

    Non è possibile utilizzare la console Web per caricare dati.

  2. Accedere a Netezza Performance Server.

    In questo esempio, viene utilizzato il comando the nzsql, ma è possibile utilizzare altri client.

    Come spiegato in Connessione a NPSaaS, puoi eseguire il provisioning di NPSaaS con un endpoint privato o con endpoint pubblici e privati. Ogni tipo di endpoint fornisce una serie di due nomi host che puoi collegare a NPSaaS.

    Per caricare i dati, è necessario essere l'utente admin o il proprietario del database o schema. Se si stanno caricando i dati per la prima volta e non si stanno caricando i dati in una tabella preesistente, è necessario disporre anche del privilegio Create Table. Se è necessario modificare i privilegi utente, consultare Gestione degli utenti.

    nzsql -host <nps_host_ip> -u <user> -pw <password>
    
    Dettagli
    Input Descrizione
    ip_host_nps

    Specifica l'indirizzo IP della tua istanza.
    Per richiamare NPS HOST IP:

    1. Accedere al proprio account IBM Cloud.
    2. Vai a Private endpoints> Service instance details.
    3. Selezionare l'istanza.
      L'indirizzo IP dell'istanza viene visualizzato ora nella pagina.
    Utente Specifica il nome utente.
    Password Specifica la password per l'utente.

    Esempio:

    nzsql -host X.XX.XXX.XXX -u admin -pw password
    Welcome to nzsql, the IBM Netezza SQL interactive terminal.
    Type:  \h for help with SQL commands
           \? for help on internal slash commands
           \g or terminate with semicolon to execute query
           \q to quit
    
    SYSTEM.ADMIN(ADMIN)=>
    

Caricamento dei dati dai sistemi locali

  1. Preparare il file di dati locale che si desidera caricare:

    1. Notare le colonne.
    2. Prendere nota della posizione del file.
    3. Assicurarsi che i dati vengano salvati in un file delimitato, ad esempio un file separato da virgole (CSV).
  2. Creare una tabella utilizzando il comando CREATE TABLE AS.

    Il comando CREATE TABLE AS crea una tabella su NPSaaS e la riempie con i dati dal tuo file di dati locale.

    Come parte di questo comando, il file di dati locale viene trasformato in una tabella esterna transitoria. In altre parole, il tuo file di dati locale viene temporaneamente trattato come una tabella di database che puoi interrogare per il caricamento in una tabella NPSaaS. Una volta terminato, la tabella esterna transitoria viene automaticamente eliminata.

    CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file_path> (<col1>, <col2>, ...) USING (RemoteSource <source_type> DELIM <delimiter_type> SkipRows <number_of_rows>);
    

    Dove:

    Dettagli
    Input Descrizione
    tabella Specifica un nome per la tabella che si sta creando.
    file_path Specifica l'ubicazione del file di dati origine che si sta caricando. Questo file di dati di origine viene trasformato in una tabella esterna transitoria.
    col1, col2, ... Specificare i nomi colonna che corrispondono ai nomi colonna dal file che si sta caricando.
    Source_Type Specifica che il file di dati origine è remoto. Quando carichi i dati utilizzando tabelle esterne, per impostazione predefinita, il percorso del file di dati di origine si presume sia sull'host NPSaaS. Se si desidera caricare i dati dalla macchina locale, è necessario utilizzare l'opzione RemoteSource. Per il client nzsql, specificare RemoteSource 'NZSQL'. Per ulteriori informazioni, consultare l'opzione RemoteSource.
    tipo_delimitatore Specifica il delimitatore utilizzato nel file di dati di origine. Per ulteriori informazioni, consultare Opzione delimitatore.
    numero_di_righe Specifica il numero di righe iniziali da ignorare prima di caricare i dati. Per ulteriori informazioni, consultare l'opzione SkipRows.

    Esempio:

    CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/home/user/Downloads/customer_data.csv' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (RemoteSource 'nzsql' DELIM ',' SkipRows 1);
    

    Per ulteriori esempi sul caricamento dei dati con tabelle esterne, consultare Tabelle esterne.

    I tuoi dati vengono caricati in NPSaaS. È possibile avviare l'esecuzione delle interrogazioni ora.

Caricamento dei dati da Amazon S3

Puoi caricare i tuoi dati in NPSaaS da un file di dati su Amazon S3 che hai precedentemente caricato lì.

  1. Preparare i dati da caricare.

    1. Assicurarsi che i dati siano su Amazon S3.
    2. Notare il formato del file.
  2. Su NPSaaS, crea una tabella utilizzando il comando CREATE TABLE AS.

    Il comando CREATE TABLE AS crea una tabella su NPSaaS e la riempie con dati da S3.

    Come parte di questo comando, i file di dati vengono trasformati in una tabella esterna transitoria. In altre parole, il tuo file di dati viene temporaneamente considerato come una tabella di database che puoi interrogare per il caricamento in una tabella NPSaaS. Una volta terminato, la tabella esterna transitoria viene automaticamente eliminata.

    CREATE TABLE <table> AS SELECT * FROM EXTERNAL <file> USING (
     REMOTESOURCE <source_type>
     DELIM <delimiter_type>
     UNIQUEID <unique_ID>
     ACCESSKEYID <access_key_ID>
     SECRETACCESSKEY <secret_access_key>
     DEFAULTREGION <default_region>
     BUCKETURL <bucket_URL>
     ENDPOINT <endpoint>
     MULTIPARTSIZEMB <multipart_size>
     );
    

    Dove:

    Dettagli
    Input Descrizione
    Source_Type Specifica il tipo di origine. È necessario utilizzare S3.
    tipo_delimitatore Specifica il tipo di delimitatore utilizzato nel file di dati di origine.
    ID_univoco Facoltativo. Specifica lo spazio nomi utilizzato per raggruppare i dati nel bucket cloud.
    ACCESS_KEY_ID Specifica la chiave di accesso.
    SECRET_ACCESS_KEY Specifica la chiave di accesso segreta.
    Regione predefinita Specifica la regione in cui si trova il bucket.
    URL_bucket Specifica il nome del bucket.
    endpoint Specifica l'URL della regione per accedere al bucket.
    dimensione_multiparte Specifica la dimensione di ciascuna parte in un caricamento multiparte. Il valore predefinito è 105 MB; un massimo di 105 MB di buffer può essere caricato in una richiesta.

    Esempio:

    CREATE TABLE flight_data AS SELECT * FROM EXTERNAL '/customer_data.dat' (flight_id bigint, passenger_id int, last_name varchar(225), first_name varchar(225), seat_number int) USING (
       REMOTESOURCE 'S3'
       DELIM '|'
       UNIQUEID 'sample'
       ACCESSKEYID 'xxxxx'
       SECRETACCESSKEY 'xxxxx'
       DEFAULTREGION 'ap-geo'
       BUCKETURL 'my.sample.bucket'
       ENDPOINT 's3.eu-west-1.cloud-object-storage.appdomain.cloud'
       MULTIPARTSIZEMB '50'
       );
    

I tuoi dati vengono caricati in NPSaaS. È possibile avviare l'esecuzione delle interrogazioni ora.