Verbinden und Abfragen über mehrere Datenquellen hinweg
Dieses Tutorial führt Sie durch den Prozess der Verwendung föderierter Abfragen zur Analyse von Verkaufsdaten für ein fiktives großes Einzelhandelsunternehmen, die an mehreren Standorten gespeichert sind.
Einführung
Übersicht über die Datenföderation
Datenföderation ist ein Softwareprozess, der die Zusammenarbeit mehrerer Datenbanken ermöglicht. Es ermöglicht Ihnen, Daten aus mehreren Quellen zu mischen, um Erkenntnisse zu gewinnen. Es ermöglicht Ihnen, mit einer einzigen Abfrage auf alle Ihre Daten in zahlreichen verteilten Datenbanken zuzugreifen.
Presto (Java ) Datenföderationsfunktion der Engine
DerPresto (Java ) Engine ermöglicht es Organisationen, Daten aus mehreren Quellen mühelos zu mischen, einschließlich aktueller Datenbanken und neuer Daten inIBM® watsonx.data. Durch die Nutzung der Fähigkeiten vonwatsonx.data integrieren mitPresto (Java ) kann Ihr Unternehmen jetzt Daten aus verschiedenen Quellen nahtlos kombinieren und analysieren und so tiefere Erkenntnisse gewinnen. Dieser optimierte Ansatz steigert nicht nur die Betriebseffizienz, sondern gibt Entscheidungsträgern auch zeitnahe und genaue Erkenntnisse auf Basis von Daten.
Anwendungsfall-Szenario
- Analysieren von Einkaufsmethoden über mehrere Datenquellen hinweg
- Das Ziel dieses Anwendungsfalls besteht darin, die mit den größten Bestellungen verbundenen Einkaufsmethoden zu analysieren. Die Verkaufsdaten sind verfügbar inDb2. Ein Teil dieser Daten wird in Iceberg-Tabellen verschoben innerhalbwatsonx.data. Die Verkaufsdaten befinden sich nun an zwei Stellen -Db2 Undwatsonx.data und Sie müssen einePresto (Java ) Abfrage von beidenDb2 und Iceberg, um die Daten zu analysieren und die Einkaufsmethode zu ermitteln, die mit den größten Bestellungen verknüpft ist.
Das folgende Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Ziel
- Registrieren Sie IhrDb2 Datenquelle mitwatsonx.data
- Verschieben eines Teils der Verkaufsdaten vonDb2 Zuwatsonx.data
- Ausführen einer Abfrage zum Abrufen von Erkenntnissen
Vorbereitende Schritte
Für dieses Lernprogramm ist Folgendes erforderlich:
- Abonnement vonwatsonx.data auf der Wolke.
- Verfügbarkeit der Presto (Java) Engine
- Db2 Datenbank mit
GOSALESDW
Daten - Referenzen vonDb2 Datenbank
Registrieren Sie IhrDb2 Datenquelle
Registrieren Sie dieDb2 Datenquelle (die GOSALESDW
Daten darin) mitwatsonx.data Beispiel.
Zur Registrierung IhresDb2 Datenquelle finden Sie unter IBMDb2. Verwenden Sie die folgenden Angaben bei der Registrierung desDb2 Datenquelle.
- Datenbankname: Geben Sie den Datenbanknamen als
BLUDB
. - Hostname: Geben Sie den Hostnamen als
db2w-sucqakq.us-south.db2w.cloud.ibm.com
- Nutzername :
db2inst
- Passwort :
Usertutorials1!
- Hafen:
50001
VerknüpfenDb2 mitPresto (Java ) Motor
Nach der Registrierung desDb2 Datenbank müssen Sie den Katalog mit demPresto (Java ) Motor. Weitere Informationen finden Sie unter Einen Katalog einer Engine zuordnen.
Daten kopieren vonDb2 Datenbank zu Iceberg
Nachdem Sie den Katalog mit der Engine verknüpft haben, kopieren Sie Daten (eine einzelne Tabelle) ausDb2 zum Eisberg. Führen Sie dazu die folgenden Schritte aus:
-
Wählen Sie im Navigationsmenü die Option Datenmanager. Erstellen Sie ein Schema innerhalb
Iceberg_data
Katalog. Weitere Informationen zum Erstellen eines Schemas finden Sie unter Schema erstellen. -
Wählen Sie im Navigationsmenü Abfrage-Arbeitsbereich.
-
Schreiben Sie eine Abfrage zum Kopieren der Daten aus
GOSALESDW
Tabelle in derDb2 Datenbank und erstellen Sie eine neue Tabelle (hierSLS_SALES_FACT
) innenIceberg
Katalog.Beispielabfrage:
create table "iceberg_data"."wxgosalesdw"."sls_sales_fact" as select * from "db2catalog". "GOSALESDW"."SLS_SALES_FACT";
-
Drücke den Mit Anlasser laufen Schaltfläche, um die Abfrage auszuführen.
-
Aktualisierung
Iceberg_data
Katalog, um die neue Tabelle anzuzeigenSLS_SALES_FACT
.
Datenföderation
Nun werden die Verkaufsdaten aufgeteilt zwischenDb2 und Iceberg-Kataloge. Sie können die Abfrage von beiden ausführenDb2 und Iceberg, um die Daten zu analysieren und Erkenntnisse über die Einkaufsmethoden zu gewinnen, die mit den größten Bestellungen verbunden sind. Das zu tun:
-
Von dem Abfrage-Arbeitsbereich führen Sie die folgende Abfrage aus, um herauszufinden, mit welcher Einkaufsmethode die größten Bestellungen verbunden sind.
Sie können die folgende Beispielabfrage verwenden, um festzustellen, welche Einkaufsmethode mit den größten Bestellungen verbunden ist. Die Abfrage greift auf fünf Tabellen zu, von denen sich eine im Objektspeicher watsonx.data (iceberg_data) und die anderen vier in Db2 ( db2catalog ) befinden.
Beispielabfrage:
select pll.product_line_en as product,
md.order_method_en as order_method,
Summe(sf.quantity) als Summe
in dem
db2catalog.GOSALESDW.SLS_ORDER_METHOD_DIM as md,
db2catalog.GOSALESDW.SLS_PRODUCT_DIM as pd,
db2catalog.GOSALESDW.SLS_PRODUCT_LINE_LOOKUP as pll,
db2catalog.GOSALESDW.SLS_PRODUCT_BRAND_LOOKUP as pbl,
iceberg_data.wxgosalesdw.sls_sales_fact as sf
wo
pd.product_key = sf.product_key
und md.order_method_key = sf.order_method_key
und pll.product_line_code = pd.product_line_code
und pbl.product_brand_code = pd.product_brand_code
gruppieren nach pll.product_line_en, md.order_method_en
Bestellung nach Produkt, order_method;
-
Drücke den Ausführen auf Schaltfläche, um die Abfrage auszuführen.
-
Wähle aus Ergebnismenge oder Einzelheiten Registerkarte, um das Ergebnis anzuzeigen.
-
Klicken Sie auf den Link Erklären. Die Seite Erklären wird geöffnet, auf der die visuelle Erklärungsausgabe für die Abfrage angezeigt wird. Sie können durch die Visual-Explain-Ausgabe blättern, um die fünf ScanProject Blattknoten (hier werden fünf Tabellen in der Abfrage verwendet) in der Struktur anzuzeigen. Diese entsprechen den fünf zu lesenden Tabellen.
Mit diesen Funktionen kann Ihr Unternehmen intelligentere Betriebsabläufe vorantreiben, Einkaufsmethoden optimieren und letztendlich die gesamte Geschäftsleistung verbessern.