IBM Cloud Docs
Como começar a usar Watson Discovery

Como começar a usar Watson Discovery

Neste tutorial, introduzimos IBM Watson® Discovery e passeamos você por meio do projeto de amostra Discovery. Explorar o projeto de amostra é uma ótima maneira de fazer turnê e experimentar algumas das características do produto.

Antes de Iniciar

Escolha a etapa apropriada para concluir para sua implantação:

  • IBM Cloud Pak for DataIBM Software Hub Instale o site Discovery. Consulte Instalando o Discovery for Cloud Pak for Data.

  • IBM Cloud Complete as seguintes etapas:

    1. Inscreva-se em uma conta IBM Cloud ou faça login.

    2. Você pode usar um plano Plus por 30 dias sem nenhum custo. No entanto, para criar uma instância de plano Plus do serviço, é necessário ter uma conta paga.

      Para obter mais informações sobre a criação de uma conta paga, consulte Atualizando sua conta.

      Se você decidir interromper o uso do plano Plus e não quiser pagar por ele, exclua a instância do serviço antes do término do período de avaliação de 30 dias.

    3. Vá para a página Discovery recurso no catálogo IBM Cloud e crie uma instância de serviço de plano Plus.

Aberto Watson Discovery

IBM Cloud

Essas instruções se aplicam a todas as implementações gerenciadas, incluindo IBM Cloud Pak for Data como instâncias de Serviço.

  1. Clique na instância Discovery que você criou para acessar o painel do serviço.

  2. Na página Gerenciar, clique em Ativar o Watson Discovery.

Se for solicitado que você efetue login, forneça suas credenciais do IBM Cloud.

IBM Cloud Pak for Data IBM Software Hub

Estas instruções se aplicam a implementações Discovery:

  1. No menu principal do cliente Web, expanda Services (Serviços ) e clique em Instances (Instâncias ).

  2. Encontre sua instância e, em seguida, clique nele para abrir sua página de resumo.

    Você pode criar um máximo de 10 instâncias por implementação. Depois que você atingir o número máximo, o botão New instance não será exibido em IBM Cloud Pak for Data.

  3. Clique em Ativar ferramenta.

Abrir o projeto de amostra

Uma nova guia ou janela do navegador é aberta e a página My Projects é exibida.

Mostra a página principal Minha Projetos com um único azulejo do Projeto de Amostra.
My projects page of the Sample project

Para familiarar-se com o produto, você pode assistir a um vídeo abaixo de 3-minute visão geral clicando no link Assista a um vídeo da página inicial do produto.

Neste tutorial, você explora o projeto de amostra.

O projeto de amostra é um projeto embutido que é fornecido como um recurso para você explorar inicialmente o produto. O projeto de amostra é um tipo de projeto Retrieval de Documento. Os projetos de recuperação de documentos são usados para pesquisar e encontrar as respostas mais relevantes de seus dados.

  1. Clique em Projeto de Amostra.

    A página Improvar e customizar é exibida.

    Se você acabou de instalar o site Discovery, o projeto de amostra precisa de tempo para concluir o processamento dos documentos. Aguarde o processamento para finalizar antes de começar a experimentação. Você pode verificar o status do processamento de dados a partir da página Atividade, que é descrita na próxima etapa.

    Mostra a página Improvar e customizar para o Projeto de Amostra.
    Sample project Improve and customize page

Saiba sobre a coleta de amostra

Conheça maneiras de gerenciar e aprificar uma coleção explorando a coleta de amostra que está disponível com o projeto de amostra. A coleta de amostra consiste em um conjunto de documentos PDF de Suporte IBM.

  1. Clique no ícone Gerenciar coleções no painel de navegação.

    Quaisquer coleções em seu projeto são exibidas aqui. Este projeto tem apenas uma coleção.

    Mostra a página de coleções com a Coleção de Amostra apenas.
    Collections page in the Sample project

  2. Clique em Coleção de Amostra.

    A página Atividade é exibida. Essa página mostra o status da coleção. Por exemplo, ele mostra o número total de documentos e quando foi atualizado pela última vez. Se Discovery encontrar um problema quando um documento é carregado ou uma fonte de dados é rastejada, quaisquer mensagens associadas são exibidas aqui.

    Mostra a página Atividade para a Coleção de Amostra.
    Activities page in the Sample project

    Depois de criar uma coleção, você pode vir a esta página para encontrar informações sobre o status de processamento dos dados na coleção.

  3. Clique na guia Enriquecimentos.

    A página Enrichments mostra a você uma lista de enriquecimentos disponíveis. Os enriquecimentos tornam a informação significativa mais fácil de encontrar e retornar em buscas. Você pode aplicar enriquecimentos embutidos em sua coleção para alavancar poderosos Natural Language Understanding modelos que marcam termos, tais como palavras-chave comumente conhecidas.

    Mostra a página Enrichments para a Coleção de Amostra.
    Enrichments page of the Sample project

    O enriquecimento Entities é aplicado à coleta de amostra:

    Entidades
    Reconhece nouns adequados como pessoas, cidades e organizações que são mencionadas no conteúdo.

    Esse enriquecimento é aplicado automaticamente às coleções que são incluídas em projetos do tipo Recuperação de documento

  4. Para o enriquecimento Entidades v2, clique em 1x Campos selecionados.

    Uma lista de campos disponíveis é exibida e o campo text é selecionado. Esta seleção significa que o enriquecimento de Entidades foi aplicado ao conteúdo que foi indexado e adicionado a um campo denominado text quando os documentos da coleção foram processados.

    Mostra que o enriquecimento de Entidades é aplicado ao campo de texto.
    Entities enrichment being applied to the text field

    A partir desta página, você pode aplicar novos enriquecimentos em sua coleção ou alterar os campos onde um enriquecimento é aplicado.

    Um recurso poderoso do Discovery é que você pode adicionar seus próprios enriquecimentos personalizados, como dicionários, padrões e modelos de aprendizado de máquina. Quando você cria enriquecimentos personalizados, eles são listados nesta página também. Você pode gerenciar onde eles são usados a partir daqui.

    Para obter mais informações sobre enriquecimentos customizados, consulte Adicionando recursos específicos de domínio.

  5. Você vai aplicar outro enriquecimento para a coleção. Encontre o enriquecimento Palavras-chave em Inglês na lista e, em seguida, clique em Selecionar campos.

    O enriquecimento Palavras-chave reconhece termos significativos comumente conhecidos em seu conteúdo.

  6. Role a lista de campos até encontrar o campo text, e selecione-o.

    Mostra os campos em que você pode aplicar o enriquecimento Palavras-chave.
    Fields to which you can apply the Keywords enrichment

  7. Clique em Aplicar mudanças e processar novamente.

    Enquanto seus documentos estão sendo reprocessados para procurar e marcar palavras-chave, você pode continuar a explorar as ferramentas disponíveis para o gerenciamento de uma coleção.

  8. Clique em Identificar campos.

    A maioria dos conteúdos de um documento é indexada no campo text automaticamente. Você pode desejar indexar certos tipos de conteúdo em diferentes campos ou dividir documentos grandes para que o campo text contenha menos passagens por documento. Para isso, você pode ensinar Discovery a reconhecer campos importantes em seus documentos, aplicando um modelo Smart Document Understanding para sua coleção.

    O Smart Document Entendendo (SDU) é uma tecnologia que aprende sobre o conteúdo de um documento com base na estrutura do documento. Você pode aplicar um modelo SDU pré-construído ou criar um modelo SDU personalizado.

    Mostra as opções de modelo SDU.
    Smart Document Understanding model options

    Para criar um modelo SDU personalizado, você seleciona a opção Modelo treinado pelo usuário e, em seguida, anotar campos em seu documento. (Você não irá anotar documentos como parte deste tutorial.)

    Mostra a ferramenta Smart Document Understanding.
    Smart Document Understanding annotation tool

    Para obter mais informações sobre SDU, consulte Usando o Smart Document Understanding.

  9. Clique em Gerenciar campos.

    A página Gerenciar campos lista os campos indexados. A partir daqui, é possível incluir ou remover campos do índice. Você também pode dividir documentos grandes em muitos documentos menores.

    Mostra os campos no índice.
    Fields in the collection index

    Para obter mais informações sobre a divisão de documentos, consulte Divindo documentos para tornar os resultados da consulta mais sucintos.

Pesquisar o projeto de amostra

  1. Clique no ícone Aprimorar e personalizar no painel de navegação.

    A página Improve and customize (Melhorar e personalizar ) é onde você pode experimentar consultas e, em seguida, adicionar e testar personalizações para melhorar os resultados da consulta para o seu projeto. Uma lista de consultas de amostra é exibida para ajudá-lo a ser iniciado com envio de consultas de teste.

  2. Clique no botão Executar busca para IBM.

    Os resultados da consulta são exibidos.

  3. A partir de um dos resultados da consulta, clique em Visualizar passagens em documento.

    É mostrada uma pré-visualização do documento onde o resultado foi encontrado.

  4. Faça uma das seguintes coisas para explorar o resultado da pesquisa.

    1. Clique em Abrir visualização avançada.

      São exibidas informações de resumo úteis, como o número de ocorrências de quaisquer enriquecimentos que são detectados no documento.

    2. Selecione a entidade URL para destacar menções de URLs dentro do texto.

      Mostra a visualização de texto avançada com as entidades URL destacadas.
      Advanced view that shows entities that were recognized

    3. Para ver como as informações do documento são armazenadas em formato JSON, clique no menu Visualizar como a partir do cabeçalho da visualização e selecione JSON.

      Uma representação JSON do documento é exibida.

      Mostra a representação JSON do documento.
      JSON representation of the document

      Você pode explorar a representação JSON para ver informações que Discovery capturou do documento. Por exemplo, se você expandir a seção enriched_text e, em seguida, expandir a seção entities, você poderá ver menções de entidades que foram reconhecidas e marcadas pelo enriquecimento das Entidades.

      Mostra a seção entriched_text.entities do JSON.
      Shows the enrichment_text.entities section of the JSON representation

Personalize o projeto de amostra

Agora, vamos customizar a visão do resultado da pesquisa um pouco adicionando uma faceta. Uma faceta é uma forma de organizar e classificar documentos que compartilham padrões ou conteúdos semelhantes.

  1. A partir da página Improvar e customizar, envie a seguinte consulta de idioma natural:

    How do I install Discovery?
    
  2. Revise os resultados da consulta que são exibidos.

    Mostra os resultados da consulta para uma consulta de idioma natural com a faceta Top Entidades expandido.
    Top Entities facet results

    Observe que uma seção Principais Entidades é exibida. Você pode expandir as entidades e clicar em uma delas para filtrar os resultados da consulta para mostrar apenas aqueles resultados em que a entidade é mencionada. A seção Principais Entidades é uma faceta embutida. Ele usa informações que foram adicionadas aos documentos pelo enriquecimento das Entidades.

    Você adicionará sua própria faceta que usa o enriquecimento Palavras-chave que você aplicou na coleção em uma etapa anterior.

  3. No painel Ferramentas de aprimoramento, expanda Personalizar exibição e clique em Facetas.

    Mostra a seção de exibição de Customize expandida no painel de ferramentas de Melhoramento.
    Customize display options

  4. Clique em Nova faceta e, em seguida, clique no botão Dos campos existentes em uma coleção.

  5. Escolha enriched_text.keywords.mentions.text, mude a etiqueta para Keywords e, em seguida, clique em Aplicar.

    Mostra o painel de faceta onde uma faceta de palavra-chave está sendo adicionada.
    Creating a Keywords-based facet

    Lembre-se da representação JSON do documento que você olhou anteriormente? Agora que o enriquecimento de Palavras-chave é aplicado ao campo text, e os documentos são reprocessados, qualquer menção de palavra-chave encontrada no campo text estão incluídas na representação JSON do documento.

    O campo que você escolheu para usar para a faceta (enriched_text.keywords.mentions.text) reflete onde o texto da palavra-chave é armazenado em JSON.

    "enriched_{field_name}": [
      "keywords" : [
        "mentions" : [
          "text": "Cloud Pak"
        ]
      ]
    ]
    
  6. A nova faceta é exibida. Você pode clicar em uma palavra-chave para filtrar os documentos para incluir apenas aqueles resultados que mencionam a palavra-chave.

    Mostra como a palavra-chave facet olha.
    Keywords facet

Você adicionou com sucesso um enriquecimento NLU embutido que reconhece palavras-chave nos documentos de coleta de amostras. Em seguida, adicionou uma faceta que usa o enriquecimento de palavras-chave para deixar você filtrar os documentos por palavra-chave.

Compartilhar o projeto de amostra

  1. Clique em Integrar e implementar a partir do painel de navegação.

    A partir daqui, você pode compartilhar seu projeto com colegas e implantá-lo.

  2. Siga as instruções na tela para adicionar um usuário e, em seguida, envie as credenciais de login e o link fornecido ao seu colega.

    Mostra a página Integrar e implementar.
    Integrate and deploy page

    Depois de construir seu próprio aplicativo de busca e estiver pronto para implantá-lo é possível utilizar componentes de interface de usuário pré-construídos ou construir um aplicativo personalizado.

    • Clique em Informações da API. A partir desta página, você pode obter o ID do projeto para o seu projeto. Você precisa do ID do projeto para usar a API Discovery. Você também precisa da instância de serviço URL e da chave de API. Os detalhes da credencial estão disponíveis na página Gerenciar de sua instância de serviço em IBM Cloud.

    • Clique em UI Components para encontrar links para o código pronto-a-usar que você pode usar para criar um aplicativo de busca completo mais rápido.

Inclua seu próprio conteúdo

Agora que você sabe mais sobre alguns recursos do produto, você está pronto para avaliar os dados que deseja pesquisar.

É tudo sobre os dados. Reveja os tipos de conteúdo que você possui que deseja que sua solução de busca possa alavancar.

Origens de dados suportadas

A tabela a seguir mostra as fontes de dados suportadas para cada tipo de implementação.

Fontes de dados suportadas
Esta tabela tem cabeçalhos de linha e coluna. Os cabeçalhos de linha identificam fontes de dados suportadas. Os cabeçalhos da coluna identificam as diferentes opções de tipo de implementação do produto Para entender quais fontes de dados estão disponíveis para o seu tipo de implementação, vá para a linha que descreve a fonte de dados, e encontre as colunas para o tipo de implementação que você está interessado.
Origem de dados IBM Cloud IBM Cloud Pak for Data
Box Ícone de visto Ícone de visto
Banco de dados (IBM Data Virtualization, IBM Db2, Microsoft SQL, Oracle, Postgres) Ícone de visto
FileNet P8 Ícone de visto
HCL Notes Ícone de visto
IBM Cloud Object Storage Ícone de visto
Sistema de Arquivo Local Ícone de visto
Salesforce Ícone de visto Ícone de visto
Microsoft SharePoint Online Ícone de visto Ícone de visto
Microsoft SharePoint No Local Ícone de visto Ícone de visto
Monitoramento Ícone de visto Ícone de visto
Microsoft Windows sistema de arquivos Ícone de visto

Não tem certeza do que você pode construir?

Para obter mais informações sobre os tipos de soluções de busca que você pode construir, veja Comece obter valor a partir de seus dados.

É possível acessar a documentação do produto a qualquer momento selecionando o ícone Ajuda ícone Ajuda no cabeçalho da página da interface com o usuário do produto. O conteúdo da ajuda é personalizado para fornecer informações que estão relacionadas ao que você está fazendo no produto.

Não importa o que você constrói, o passo um é criar um projeto. Decida qual o tipo de projeto melhor se ajusta às suas necessidades.

Se nenhum dos tipos existentes for bastante certo, você pode escolher Nenhum dos anteriores para criar um projeto personalizado em vez disso.

Descrições do projeto

casos de uso do tipo de projeto
Necessidade Objetivo Tipo de Projeto
Desejo extrair dados para suportar a automação de tarefas repetitivas de processamento de documentos. Eu quero entender rapidamente quais dados são extraídos de meus documentos e melhorar os dados aplicando enriquecimentos. Processamento de documento inteligente
Qual documento contém a resposta para a minha pergunta? Encontre informações significativas em fontes que contenham uma mistura de dados estruturados e não estruturados, e supere-a em um aplicativo de pesquisa corporativa independente ou no campo de busca de um aplicativo de negócios. Document Retrieval
Onde está a parte do contrato que eu preciso para a minha tarefa? Extraia rapidamente informações críticas de contratos. Recuperação de Documentos para Contratos
Quero que o chatbot que estou construindo use o conhecimento que tenho. Dê um acesso rápido a um assistente virtual a informações técnicas que são armazenadas em várias fontes de dados externas e formatos de documentos para responder às perguntas do cliente. Conversational Search
Eu quero descobrir insights que eu não sabia perguntar sobre. Obtenha insights a partir da análise de padrões ou realize análise de causa raiz. Mineração de conteúdo

Para obter mais informações, consulte Criando projetos.