IBM Cloud Docs
Verbinden und Abfragen über mehrere Datenquellen hinweg

Verbinden und Abfragen über mehrere Datenquellen hinweg

Dieses Tutorial führt Sie durch den Prozess der Verwendung föderierter Abfragen zur Analyse von Verkaufsdaten für ein fiktives großes Einzelhandelsunternehmen, die an mehreren Standorten gespeichert sind.

Einführung

Übersicht über die Datenföderation

Datenföderation ist ein Softwareprozess, der die Zusammenarbeit mehrerer Datenbanken ermöglicht. Es ermöglicht Ihnen, Daten aus mehreren Quellen zu mischen, um Erkenntnisse zu gewinnen. Es ermöglicht Ihnen, mit einer einzigen Abfrage auf alle Ihre Daten in zahlreichen verteilten Datenbanken zuzugreifen.

Presto (Java ) Datenföderationsfunktion der Engine

DerPresto (Java ) Engine ermöglicht es Organisationen, Daten aus mehreren Quellen mühelos zu mischen, einschließlich aktueller Datenbanken und neuer Daten inIBM® watsonx.data. Durch die Nutzung der Fähigkeiten vonwatsonx.data integrieren mitPresto (Java ) kann Ihr Unternehmen jetzt Daten aus verschiedenen Quellen nahtlos kombinieren und analysieren und so tiefere Erkenntnisse gewinnen. Dieser optimierte Ansatz steigert nicht nur die Betriebseffizienz, sondern gibt Entscheidungsträgern auch zeitnahe und genaue Erkenntnisse auf Basis von Daten.

Anwendungsfall-Szenario

Analysieren von Einkaufsmethoden über mehrere Datenquellen hinweg
Das Ziel dieses Anwendungsfalls besteht darin, die mit den größten Bestellungen verbundenen Einkaufsmethoden zu analysieren. Die Verkaufsdaten sind verfügbar inDb2. Ein Teil dieser Daten wird in Iceberg-Tabellen verschoben innerhalbwatsonx.data. Die Verkaufsdaten befinden sich nun an zwei Stellen -Db2 Undwatsonx.data und Sie müssen einePresto (Java ) Abfrage von beidenDb2 und Iceberg, um die Daten zu analysieren und die Einkaufsmethode zu ermitteln, die mit den größten Bestellungen verknüpft ist.

Das folgende Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.

Ziel

  • Registrieren Sie IhrDb2 Datenquelle mitwatsonx.data
  • Verschieben eines Teils der Verkaufsdaten vonDb2 Zuwatsonx.data
  • Ausführen einer Abfrage zum Abrufen von Erkenntnissen

Vorbereitende Schritte

Für dieses Lernprogramm ist Folgendes erforderlich:

  • Abonnement vonwatsonx.data auf der Wolke.
  • Verfügbarkeit der Presto (Java) Engine
  • Db2 Datenbank mit GOSALESDW Daten
  • Referenzen vonDb2 Datenbank

Registrieren Sie IhrDb2 Datenquelle

Registrieren Sie dieDb2 Datenquelle (die GOSALESDW Daten darin) mitwatsonx.data Beispiel.

Zur Registrierung IhresDb2 Datenquelle finden Sie unter IBMDb2. Verwenden Sie die folgenden Angaben bei der Registrierung desDb2 Datenquelle.

  • Datenbankname: Geben Sie den Datenbanknamen als BLUDB.
  • Hostname: Geben Sie den Hostnamen als db2w-sucqakq.us-south.db2w.cloud.ibm.com
  • Nutzername :db2inst
  • Passwort :Usertutorials1!
  • Hafen: 50001

VerknüpfenDb2 mitPresto (Java ) Motor

Nach der Registrierung desDb2 Datenbank müssen Sie den Katalog mit demPresto (Java ) Motor. Weitere Informationen finden Sie unter Einen Katalog einer Engine zuordnen.

Daten kopieren vonDb2 Datenbank zu Iceberg

Nachdem Sie den Katalog mit der Engine verknüpft haben, kopieren Sie Daten (eine einzelne Tabelle) ausDb2 zum Eisberg. Führen Sie dazu die folgenden Schritte aus:

  1. Wählen Sie im Navigationsmenü die Option Datenmanager. Erstellen Sie ein Schema innerhalb Iceberg_data Katalog. Weitere Informationen zum Erstellen eines Schemas finden Sie unter Schema erstellen.

  2. Wählen Sie im Navigationsmenü Abfrage-Arbeitsbereich.

  3. Schreiben Sie eine Abfrage zum Kopieren der Daten aus GOSALESDW Tabelle in derDb2 Datenbank und erstellen Sie eine neue Tabelle (hier SLS_SALES_FACT ) innen Iceberg Katalog.

    Beispielabfrage:

    create table "iceberg_data"."wxgosalesdw"."sls_sales_fact" as select * from "db2catalog". "GOSALESDW"."SLS_SALES_FACT";
    
  4. Drücke den Mit Anlasser laufen Schaltfläche, um die Abfrage auszuführen.

  5. Aktualisierung Iceberg_data Katalog, um die neue Tabelle anzuzeigen SLS_SALES_FACT.

Datenföderation

Nun werden die Verkaufsdaten aufgeteilt zwischenDb2 und Iceberg-Kataloge. Sie können die Abfrage von beiden ausführenDb2 und Iceberg, um die Daten zu analysieren und Erkenntnisse über die Einkaufsmethoden zu gewinnen, die mit den größten Bestellungen verbunden sind. Das zu tun:

  1. Von dem Abfrage-Arbeitsbereich führen Sie die folgende Abfrage aus, um herauszufinden, mit welcher Einkaufsmethode die größten Bestellungen verbunden sind.

    Sie können die folgende Beispielabfrage verwenden, um festzustellen, welche Einkaufsmethode mit den größten Bestellungen verbunden ist. Die Abfrage greift auf fünf Tabellen zu, von denen sich eine im Objektspeicher watsonx.data (iceberg_data) und die anderen vier in Db2 ( db2catalog ) befinden.

    Beispielabfrage:

    select pll.product_line_en as product,

    md.order_method_en as order_method,

    Summe(sf.quantity) als Summe

    in dem

    db2catalog.GOSALESDW.SLS_ORDER_METHOD_DIM as md,

    db2catalog.GOSALESDW.SLS_PRODUCT_DIM as pd,

    db2catalog.GOSALESDW.SLS_PRODUCT_LINE_LOOKUP as pll,

    db2catalog.GOSALESDW.SLS_PRODUCT_BRAND_LOOKUP as pbl,

    iceberg_data.wxgosalesdw.sls_sales_fact as sf

    wo

    pd.product_key = sf.product_key

    und md.order_method_key = sf.order_method_key

    und pll.product_line_code = pd.product_line_code

    und pbl.product_brand_code = pd.product_brand_code

    gruppieren nach pll.product_line_en, md.order_method_en

    Bestellung nach Produkt, order_method;

  2. Drücke den Ausführen auf Schaltfläche, um die Abfrage auszuführen.

  3. Wähle aus Ergebnismenge oder Einzelheiten Registerkarte, um das Ergebnis anzuzeigen.

  4. Klicken Sie auf den Link Erklären. Die Seite Erklären wird geöffnet, auf der die visuelle Erklärungsausgabe für die Abfrage angezeigt wird. Sie können durch die Visual-Explain-Ausgabe blättern, um die fünf ScanProject Blattknoten (hier werden fünf Tabellen in der Abfrage verwendet) in der Struktur anzuzeigen. Diese entsprechen den fünf zu lesenden Tabellen.

Mit diesen Funktionen kann Ihr Unternehmen intelligentere Betriebsabläufe vorantreiben, Einkaufsmethoden optimieren und letztendlich die gesamte Geschäftsleistung verbessern.