Conectando e consultando várias fontes de dados
Este tutorial orienta você no processo de uso de consultas federadas para analisar dados de vendas de uma grande empresa de varejo fictícia, que está armazenada em vários locais.
Introdução
Visão geral da federação de dados
A federação de dados é um processo de software que permite que vários bancos de dados trabalhem juntos. Ele permite combinar dados de várias fontes para obter insights. Ele permite que você acesse todos os seus dados em vários bancos de dados dispersos com uma única consulta.
Presto (Java ) capacidade de federação de dados do mecanismo
OPresto (Java ) as funções de consulta federada do mecanismo permitem que as organizações misturem facilmente dados de diversas fontes, incluindo bancos de dados atuais e novos dados emIBM® watsonx.data. Ao aproveitar a capacidade dewatsonx.data integrar-se comPresto (Java ), sua empresa agora pode combinar e analisar dados de diversas fontes de maneira integrada, obtendo insights mais profundos. Esta abordagem simplificada não só melhora a eficiência operacional, mas também capacita os tomadores de decisão com insights baseados em dados oportunos e precisos.
Cenário de caso de uso
- Analisando métodos de compra em múltiplas fontes de dados
- O objetivo deste caso de uso é analisar os métodos de compra associados aos maiores pedidos. Os dados de vendas estão disponíveis emDb2. Uma parte desses dados é movida para tabelas Iceberg dentrowatsonx.data. Os dados de vendas estão agora em dois lugares -Db2 ewatsonx.data e você precisa realizar umPresto (Java ) consulta de ambosDb2 e Iceberg para análise dos dados, visando identificar a forma de compra que está vinculada aos maiores pedidos.
O vídeo a seguir fornece um método visual para aprender os conceitos e as tarefas desta documentação.
Objetivo
- Registrando seuDb2 fonte de dados comwatsonx.data
- Mover parte dos dados de vendas deDb2 parawatsonx.data
- Executando consulta para recuperar insights
Antes de Iniciar
Este tutorial requer:
- Assinatura dewatsonx.data na nuvem.
- Disponibilidade do mecanismo Presto (Java)
- Db2 banco de dados com
GOSALESDW
dados - Credenciais deDb2 base de dados
Registrando seuDb2 fonte de dados
Registre oDb2 fonte de dados (que tem GOSALESDW
dados nele) comwatsonx.data instância.
Para cadastrar seuDb2 fonte de dados, consulte IBMDb2. Use os seguintes detalhes ao registrar oDb2 fonte de dados.
- Nome do banco de dados: Digite o nome do banco de dados como
BLUDB
. - Nome do host: Digite o nome do host como
db2w-sucqakq.us-south.db2w.cloud.ibm.com
- Nome de usuário :
db2inst
- Senha :
Usertutorials1!
- Porto :
50001
AssociandoDb2 comPresto (Java ) motor
Depois de registrar oDb2 banco de dados, você deve associar o catálogo aoPresto (Java ) motor. Para mais informações, veja Associando um catálogo a um mecanismo.
Copiando dados deDb2 banco de dados para Iceberg
Depois de associar o catálogo ao mecanismo, copie os dados (uma única tabela) deDb2 para o Iceberg. Para fazer isso, conclua as etapas a seguir:
-
No menu de navegação, selecione Gerenciador de dados. Crie um esquema dentro
Iceberg_data
Catálogo. Para obter mais informações sobre como criar um esquema, consulte Criando esquema. -
No menu de navegação, selecione Consultar espaço de trabalho.
-
Escreva uma consulta para copiar os dados
GOSALESDW
tabela presente noDb2 banco de dados e crie uma nova tabela (aquiSLS_SALES_FACT
) dentroIceberg
Catálogo.Consulta de exemplo:
create table "iceberg_data"."wxgosalesdw"."sls_sales_fact" as select * from "db2catalog". "GOSALESDW"."SLS_SALES_FACT";
-
Clique no Execute no arranque botão para executar a consulta.
-
Atualizar
Iceberg_data
catálogo para visualizar a nova tabelaSLS_SALES_FACT
.
Federação de dados
Agora, os dados de vendas são divididos entreDb2 e catálogos Iceberg. Você pode executar consultas de ambosDb2 e Iceberg para analisar os dados e gerar insights sobre os métodos de compra associados aos maiores pedidos. Fazer isso:
-
De Consultar espaço de trabalho, execute a consulta a seguir para entender qual método de compra está associado aos maiores pedidos.
Você pode usar a seguinte consulta de amostra para determinar qual método de compra está associado aos maiores pedidos. A consulta acessa cinco tabelas, uma das quais está no armazenamento de objetos watsonx.data (iceberg_data) e as outras quatro estão em Db2 ( db2catalog ).
Consulta de exemplo:
select pll.product_line_en as product,
md.order_method_en as order_method,
sum(sf.quantity) as total
a partir de
db2catalog.GOSALESDW.SLS_ORDER_METHOD_DIM as md,
db2catalog.GOSALESDW.SLS_PRODUCT_DIM as pd,
db2catalog.GOSALESDW.SLS_PRODUCT_LINE_LOOKUP as pll,
db2catalog.GOSALESDW.SLS_PRODUCT_BRAND_LOOKUP as pbl,
iceberg_data.wxgosalesdw.sls_sales_fact as sf
em que
pd.product_key = sf.product_key
e md.order_method_key = sf.order_method_key
e pll.product_line_code = pd.product_line_code
e pbl.product_brand_code = pd.product_brand_code
group by pll.product_line_en, md.order_method_en
order by product, order_method;
-
Clique no Continue botão para executar a consulta.
-
Selecione os Conjunto de resultados ou Detalhes guia para visualizar o resultado.
-
Clique no link Explain (Explicar ). A página Explain é aberta, exibindo a saída de explicação visual da consulta. Você pode percorrer a saída da explicação visual para ver os cinco ScanProject nós de folha (aqui, cinco tabelas são usadas na consulta) na árvore. Elas correspondem às cinco tabelas que estão sendo lidas.
Com esses recursos, sua empresa pode conduzir operações mais inteligentes, otimizar métodos de compra e, por fim, melhorar o desempenho geral dos negócios.