Introduzione al motore di query
Dopo aver effettuato il provisioning del motore Presto, iniziate la vostra esperienza watsonx.data esplorando le capacità di Presto con query di prova, creando il vostro primo schema e le vostre tabelle.
In questa esercitazione si impara a eseguire alcune query di prova per comprendere le capacità di Presto e a creare il primo schema per stabilire una struttura di base per l'organizzazione dei dati. Quando lo schema è in uso, è possibile procedere con la creazione della tabella. Le tabelle sono componenti essenziali per memorizzare e organizzare i dati.
Scenario di esempio: per comprendere:
- Interrogazione di tabelle con Presto in watsonx.data
- Informazioni sui dati disponibili per il kick start
- Per informazioni su come creare schemi e tabelle per memorizzare, organizzare ed eseguire query di dati.
Obiettivo
- Esecuzione di query di verifica
- Creazione del primo schema e tabella
Prima di iniziare
Questa esercitazione richiede:
- Sottoscrivi a watsonx.data su IBM Cloud.
- Esegui il provisioning della tua istanza watsonx.data. Per ulteriori informazioni, consulta Provisioning di un'istanza.
Esecuzione di query di verifica
Questa sezione del tutorial descrive come utilizzare l'area di lavoro Query ed eseguire query di prova per familiarizzare con il funzionamento del motore Presto.
Per eseguire la query SQL, procedere come segue:
- Dal menu di navigazione, selezionare SQL. Viene aperta la pagina Area di lavoro Query.
- Selezionare il motore Presto dall'elenco dei motori.
- Vai a System and benchmarking data. watsonx.data fornisce i cataloghi predefiniti tpcds e tpch. Questi cataloghi forniscono dati generati automaticamente per il benchmarking. È possibile utilizzarlo anche per eseguire query e dati di esempio.
- Selezionare uno schema dal catalogo tpch (ad esempio,
Tiny) e selezionare una tabella, ad esempio,Customer. Fare clic sul menu di overflow per selezionare Genera percorso o Genera SELECT. - Selezionare Genera selezione e selezionare un limite, ad esempio 100.
- Fare clic su Esegui su per eseguire la query.
- Selezionare la scheda Serie di risultati o Dettagli per visualizzare i risultati. Se necessario, è possibile salvare la query.
Salvataggio dei dati
- Dal menu di esplorazione, selezionare Gestore dati. Si apre la pagina Gestione dati.
- Selezionare il catalogo iceberg_data. Il catalogo è disponibile per impostazione predefinita.
- Fai clic su Crea. Selezionare Crea schema per creare uno schema nel catalogo iceberg_data. Per ulteriori informazioni, consultare Creazione dello schema.
- Assegnare un nome allo schema, ad esempio
new_schema. - Per memorizzare i dati, è necessario creare tabelle all'interno dello schema. Per creare una tabella, utilizzare una delle seguenti opzioni:
-
Opzione 1: è possibile creare una tabella (con i dati predefiniti disponibili nel catalogo tpcds ) eseguendo una query SQL.
a. Andare alla pagina Area di lavoro Query.
b. Eseguire la query Crea tabella. Viene visualizzata una query di esempio:
CREATE TABLE IF NOT EXISTS "iceberg_data"."new_schema"."new_table" AS SELECT * FROM "tpcds"."sf1"."catalog_returns" LIMIT 100;La query SQL crea una tabella denominata
new_tableutilizzandonew_schema, all'interno diiceberg_data catalog. Carica inoltre i dati dalla tabellacatalog_returns, che utilizza lo schemasf1nel catalogotpcds.È possibile passare al catalogo iceberg_data ed eseguire un'istruzione di query select per verificare se
new_tablecontiene dati. -
Opzione 2: è possibile creare una tabella caricando i propri dati (formato .csv, parquet, .json, .txt).
a. Passare alla pagina Gestore dati.
b. È possibile creare una tabella con i dati in formato .csv, parquet, .json, .txt. Per fare ciò, consultare Creazione della tabella.
È possibile passare alla pagina Area di lavoro Query. Selezionare la tabella appena creata dal catalogo iceberg_data ed eseguire un'istruzione di query di selezione per verificare se la tabella contiene dati.
Query dei dati dalla tabella creata
Puoi eseguire una query Generate SELECT dalla nuova tabella creata nel catalogo iceberg_data. Per fare ciò:
- Dal menu di navigazione, andare alla pagina Area di lavoro Query.
- Selezionare la tabella,
new_tableall'interno dello schema,new_schemaall'interno del catalogoiceberg_data. - Selezionare Genera SELECT.
- Modificare il limite su 100 come mostrato nell'esempio:
SELECT * FROM "iceberg_data"."new_schema"."new_table" LIMIT 100; - Fare clic su Esegui su per eseguire la query.
- Selezionare la scheda Serie di risultati o Dettagli per visualizzare i risultati. È inoltre possibile salvare la query.