IBM Cloud Docs
Primeros pasos con Watson Discovery

Primeros pasos con Watson Discovery

En esta guía de aprendizaje, presentamos IBM Watson® Discovery y le guiamos por el proyecto de ejemplo Discovery. Explorar el proyecto de ejemplo es una gran forma de recorrer y probar algunas de las características del producto.

Antes de empezar

Elija el paso adecuado para completar el despliegue:

  • IBM Cloud Pak for Data instale xml-ph-0000@deepl.internal IBM Software Hub Instalar Discovery. Consulte Instalación de Discovery for Cloud Pak for Data.

  • IBM Cloud Complete los pasos siguientes:

    1. Regístrese para obtener una cuenta IBM Cloud o inicie sesión.

    2. Puede utilizar un plan Plus durante 30 días sin coste alguno. Sin embargo, para crear una instancia de plan Plus del servicio, debe tener una cuenta de pago.

      Para obtener más información sobre la creación de una cuenta de pago, consulte Actualización de la cuenta.

      Si decide dejar de utilizar el plan Plus y no quiere pagarlo, elimine la instancia del servicio antes de que finalice el periodo de prueba de 30 días.

    3. Vaya a la página RecursoDiscovery en el catálogo IBM Cloud y cree una instancia de servicio del plan Plus.

Abrir Watson Discovery

IBM Cloud

Estas instrucciones se aplican a todos los despliegues gestionados, incluyendo IBM Cloud Pak for Data como instancias de servicio.

  1. Haga clic en la instancia de Discovery que ha creado para ir al panel de control del servicio.

  2. En la página Gestionar, pulse Iniciar Watson Discovery.

Si se le solicita que inicie una sesión, proporcione sus credenciales de IBM Cloud.

IBM Cloud Pak for Data IBM Software Hub

Estas instrucciones se aplican a los despliegues de Discovery:

  1. En el menú principal del cliente web, expanda Servicios y, a continuación, haga clic en Instancias.

  2. Busque la instancia y, a continuación, púlselo para abrir su página de resumen.

    Puede crear un máximo de 10 instancias por implementación. Después de alcanzar el número máximo, el botón Nueva instancia no se muestra en IBM Cloud Pak for Data.

  3. Pulse Iniciar herramienta.

Abrir el proyecto de ejemplo

Se abre una nueva pestaña o ventana del navegador y se muestra la página Mis proyectos.

Muestra la página principal Mis proyectos con un único mosaico Proyecto de ejemplo.
My projects page of the Sample project

Para familiarizarse con el producto, puede ver un vídeo de visión general de menos de 3 minutos pulsando el enlace Ver un vídeo desde la página de inicio del producto.

En esta guía de aprendizaje, explora el proyecto de ejemplo.

El proyecto de ejemplo es un proyecto incorporado que se proporciona como recurso para que inicialmente explore el producto. El proyecto de ejemplo es un tipo de proyecto Recuperación de documentos. Los proyectos de recuperación de documentos se utilizan para buscar y encontrar las respuestas más relevantes a partir de sus datos.

  1. Pulse Proyecto de ejemplo.

    Se muestra la página Mejorar y personalizar.

    Si acaba de instalar Discovery, el Proyecto de muestra necesita tiempo para terminar de procesar los documentos. Espere a que finalice el proceso antes de empezar a experimentar. Puede comprobar el estado del proceso de datos desde la página Actividad, que se describe en el paso siguiente.

    Muestra la página Mejorar y personalizar para el proyecto de ejemplo.
    Sample project Improve and customize page

Información sobre la colección de ejemplo

Conozca las formas de gestionar y mejorar una colección explorando la colección de ejemplo que está disponible con el proyecto de ejemplo. La colección de ejemplo consta de un conjunto de documentos PDF de soporte de IBM cargados.

  1. Haga clic en el icono Gestionar colecciones en el panel de navegación.

    Las colecciones del proyecto se muestran aquí. Este proyecto sólo tiene una colección.

    Muestra la página de colecciones sólo con la recopilación de ejemplo.
    Collections page in the Sample project

  2. Pulse Colección de ejemplo.

    Se muestra la página Actividad. Esta página muestra el estado de la recogida. Por ejemplo, muestra el número total de documentos y cuándo se actualizó por última vez. Si el descubrimiento encuentra un problema cuando se carga un documento o se rastrea un origen de datos, los mensajes asociados se muestran aquí.

    Muestra la página Actividad de la colección de ejemplos.
    Activities page in the Sample project

    Después de crear una colección, puede llegar a esta página para buscar información sobre el estado de proceso de los datos de la colección.

  3. Pulse el separador Enriquecimientos.

    La página Enriquecimientos muestra una lista de los enriquecimientos disponibles. Los enriquecimientos hacen que la información significativa sea más fácil de encontrar y devolver en las búsquedas. Puede aplicar enriquecimientos incorporados a la colección para aprovechar los potentes modelos de Natural Language Understanding que etiquetan términos como, por ejemplo, palabras clave conocidas comúnmente.

    Muestra la página Enriquecimientos de la colección de ejemplos.
    Enrichments page of the Sample project

    El enriquecimiento Entidades se aplica a la colección de ejemplo:

    Entidades
    Reconoce nombres adecuados como personas, ciudades y organizaciones que se mencionan en el contenido.

    Este enriquecimiento se aplica automáticamente a las colecciones que se añaden a proyectos del tipo Recuperación de documentos.

  4. Para el enriquecimiento Entidades v2, pulse 1x Campos seleccionados.

    Se visualiza una lista de campos disponibles y se selecciona el campo text. Esta selección significa que el enriquecimiento Entidades se ha aplicado al contenido que se ha indexado y se ha añadido a un campo denominado text cuando se han procesado los documentos de la colección.

    Muestra que el enriquecimiento Entidades se aplica al campo de texto.
    Entities enrichment being applied to the text field

    Desde esta página, puede aplicar nuevos enriquecimientos a la colección o cambiar los campos donde se aplica un enriquecimiento.

    Una característica potente de Discovery es que puede añadir sus propios enriquecimientos personalizados, como diccionarios, patrones y modelos de aprendizaje automático. Cuando crea enriquecimientos personalizados, también se listan en esta página. Puede gestionar dónde se utilizan desde aquí.

    Para obtener más información sobre los enriquecimientos personalizados, consulte Adición de recursos específicos de dominio.

  5. Va a aplicar otro enriquecimiento a la colección. Busque el enriquecimiento Palabras clave en la lista y, a continuación, pulse Seleccionar campos.

    El enriquecimiento de palabras clave reconoce términos conocidos comúnmente significativos en su contenido.

  6. Desplácese por la lista de campos hasta que encuentre el campo text y selecciónelo.

    Muestra los campos en los que se puede aplicar el enriquecimiento de palabra clave.
    Fields to which you can apply the Keywords enrichment

  7. Pulse Aplicar cambios y volver a procesar.

    Mientras los documentos se están reprocesando para buscar y etiquetar palabras clave, puede continuar explorando las herramientas disponibles para gestionar una colección.

  8. Pulse Identificar campos.

    La mayor parte del contenido de un documento se indexa automáticamente en el campo text. Es posible que desee indexar determinados tipos de contenido en campos diferentes o dividir documentos grandes para que el campo text contenga menos pasajes por documento. Para ello, puede enseñar a Discovery a reconocer campos importantes en los documentos aplicando un modelo de Smart Document Understanding a la colección.

    Smart Document Understanding (SDU) es una tecnología que aprende sobre el contenido de un documento basado en la estructura del documento. Puede aplicar un modelo SDU preconstruido o crear un modelo SDU personalizado.

    Muestra las opciones de modelo de SDU.
    Smart Document Understanding model options

    Para crear un modelo SDU personalizado, seleccione la opción Modelo entrenado por el usuario y, a continuación, anote los campos en el documento. (No anotará documentos como parte de esta guía de aprendizaje.)

    Muestra la herramienta Smart Document Understanding.
    Smart Document Understanding annotation tool

    Para obtener más información sobre SDU, consulte Utilización de Smart Document Understanding.

  9. Pulse Gestionar campos.

    La página Gestionar campos lista los campos indexados. Desde aquí, puede incluir o eliminar campos del índice. También puede dividir documentos grandes en muchos documentos más pequeños.

    Muestra los campos en el índice.
    Fields in the collection index

    Para obtener más información sobre la división de documentos, consulte División de documentos para que los resultados de la consulta sean más sucintos.

Buscar en el proyecto de ejemplo

  1. Haga clic en el icono Mejorar y personalizar del panel de navegación.

    La página Mejorar y personalizar es donde puede probar consultas y, a continuación, añadir y probar personalizaciones para mejorar los resultados de la consulta para su proyecto. Se visualiza una lista de consultas de ejemplo para ayudarle a empezar a enviar consultas de prueba.

  2. Pulse el botón Ejecutar búsqueda para IBM.

    Se visualizan los resultados de la consulta.

  3. En uno de los resultados de la consulta, pulse Ver pasajes del documento.

    Se muestra una vista previa del documento donde se ha encontrado el resultado.

  4. Realice una de las siguientes acciones para explorar el resultado de la búsqueda.

    1. Haga clic en Abrir vista avanzada.

      Se muestra información de resumen útil, como el número de apariciones de cualquier enriquecimiento que se detecte en el documento.

    2. Seleccione la entidad URL para resaltar menciones de URL dentro del texto.

      Muestra la vista de texto avanzada con las entidades de e URL s resaltadas.
      Advanced view that shows entities that were recognized

    3. Para ver cómo se almacena la información del documento en formato JSON, pulse el menú Ver como en la cabecera de vista y seleccione JSON.

      Se muestra una representación JSON del documento.

      Muestra la representación JSON del documento.
      JSON representation of the document

      Puede explorar la representación JSON para ver la información que ha capturado el descubrimiento del documento. Por ejemplo, si expande la sección enriched_text y, a continuación, expande la sección entities, puede ver menciones de entidades reconocidas y etiquetadas por el enriquecimiento Entidades.

      Muestra la sección entriched_text.entities del JSON.
      Shows the enrichment_text.entities section of the JSON representation

Personalizar el proyecto de ejemplo

Ahora, vamos a personalizar un poco la vista de resultados de búsqueda añadiendo una faceta. Una faceta es una forma de organizar y clasificar documentos que comparten patrones o contenido similares.

  1. En la página Mejorar y personalizar, envíe la siguiente consulta de lenguaje natural:

    How do I install Discovery?
    
  2. Revise los resultados de la consulta que se muestran.

    Muestra los resultados de la consulta para una consulta en lenguaje natural con la faceta Entidades principales expandida.
    Top Entities facet results

    Observe que se muestra una sección Entidades principales. Puede expandir las entidades y pulsar una de ellas para filtrar los resultados de la consulta para mostrar sólo los resultados en los que se menciona la entidad. La sección Entidades principales es una faceta incorporada. Utiliza la información que se ha añadido a los documentos mediante el enriquecimiento Entidades.

    Añadirá su propia faceta que utiliza el enriquecimiento de palabras clave que ha aplicado a la colección en un paso anterior.

  3. En el panel Herramientas de mejora, expanda Personalizar visualización y, a continuación, haga clic en Facetas.

    Muestra la sección de visualización Personalizar expandida en el panel Herramientas de mejora.
    Customize display options

  4. Haga clic en Nueva faceta y, a continuación, en el botón Desde campos existentes en una colección.

  5. Elija enriched_text.keywords.mentions.text, cambie la etiqueta a Keywords y, a continuación, pulse Aplicar.

    Muestra el panel de faceta donde se está añadiendo una faceta de palabra clave.
    Creating a Keywords-based facet

    ¿Recuerda la representación JSON del documento que ha examinado anteriormente? Ahora que el enriquecimiento de palabras clave se aplica al campo text y los documentos se vuelven a procesar, las menciones de palabra clave que se encuentren en el campo text se incluyen en la representación JSON del documento.

    El campo que ha seleccionado para utilizar para la faceta (enriched_text.keywords.mentions.text) refleja dónde se almacena el texto de la palabra clave en JSON.

    "enriched_{field_name}": [
      "keywords" : [
        "mentions" : [
          "text": "Cloud Pak"
        ]
      ]
    ]
    
  6. Se muestra la nueva faceta. Puede pulsar una palabra clave para filtrar los documentos para incluir sólo los resultados que mencionan la palabra clave.

    Muestra el aspecto de la faceta de palabra clave.
    Keywords facet

Ha añadido correctamente un enriquecimiento NLU incorporado que reconoce palabras clave en los documentos de colección de ejemplo. A continuación, ha añadido una faceta que utiliza el enriquecimiento de palabras clave para permitir filtrar los documentos por palabra clave.

Compartir el proyecto de ejemplo

  1. Pulse Integrar y desplegar en el panel de navegación.

    Desde aquí, puede compartir su proyecto con sus colegas e implementarlo.

  2. Siga las instrucciones en pantalla para agregar un usuario y, a continuación, envíe las credenciales de inicio de sesión y el enlace proporcionado a su colega.

    Muestra la página Integrar y desplegar.
    Integrate and deploy page

    Después de crear su propia aplicación de búsqueda y estar preparado para desplegarla, puede utilizar componentes de interfaz de usuario precompilados o crear una aplicación personalizada.

    • Pulse Información de API. Desde esta página, puede obtener el ID de proyecto para el proyecto. Necesita el ID de proyecto para utilizar la API de descubrimiento. También necesita la instancia de servicio URL y la clave API. Los detalles de las credenciales están disponibles en la página Administrar de su instancia de servicio en IBM Cloud.

    • Pulse Componentes de interfaz de usuario para buscar enlaces a código listo para utilizar que puede utilizar para crear una aplicación de búsqueda con todas las características más rápidamente.

Añadir su propio contenido

Ahora que sabe más sobre algunas de las características del producto, está listo para evaluar los datos que desea buscar.

Todo se trata de los datos. Revise los tipos de contenido que posee y que desea que su solución de búsqueda pueda aprovechar.

Orígenes de datos soportados

La tabla siguiente muestra los orígenes de datos soportados para cada tipo de despliegue.

Orígenes de datos soportados
Esta tabla tiene cabeceras de fila y columna. Las cabeceras de fila identifican los orígenes de datos soportados. Las cabeceras de columna identifican las distintas opciones de tipo de despliegue de producto. Para comprender qué orígenes de datos están disponibles para el tipo de despliegue, vaya a la fila que describe el origen de datos y busque las columnas para el tipo de despliegue en el que está interesado.
Origen de datos IBM Cloud IBM Cloud Pak for Data
Box Icono de marca de selección Icono de marca de selección
Base de datos (IBM Data Virtualization, IBM Db2, Microsoft SQL, Oracle, Postgres) Icono de marca de selección
FileNet P8 Icono de marca de selección
HCL Notes Icono de marca de selección
IBM Cloud Object Storage Icono de marca de selección
Sistema de archivos local Icono de marca de selección
Salesforce Icono de marca de selección Icono de marca de selección
Microsoft SharePoint Online Icono de marca de selección Icono de marca de selección
Local de Microsoft SharePoint Icono de marca de selección Icono de marca de selección
Sitio web Icono de marca de selección Icono de marca de selección
Microsoft Windows sistema de archivos Icono de marca de selección

¿No está seguro de lo que puede construir?

Para obtener más información sobre los tipos de soluciones de búsqueda que puede crear, consulte Empezar a obtener valor de los datos.

Puede acceder a la documentación del producto en cualquier momento seleccionando el icono de ayuda icono de ayuda en la cabecera de página de la interfaz de usuario del producto. El contenido de la ayuda se personaliza para proporcionar información relacionada con lo que está haciendo en el producto.

No importa lo que construya, el paso uno es crear un proyecto. Decida qué tipo de proyecto se ajusta mejor a sus necesidades.

Si ninguno de los tipos existentes es correcto, puede elegir Ninguno de los anteriores para crear un proyecto personalizado en su lugar.

Descripciones de proyecto

Casos de uso de tipo de proyecto
Necesidad Objetivo Tipo proyecto
Deseo extraer datos para dar soporte a la automatización de tareas repetitivas de proceso de documentos. Quiero comprender rápidamente qué datos se extraen de mis documentos y mejorar los datos aplicando enriquecimientos. Proceso de documentos inteligentes
¿Qué documento contiene la respuesta a mi pregunta? Busque información significativa en fuentes que contengan una combinación de datos estructurados y no estructurados, y que la emerja en una aplicación de búsqueda empresarial autónoma o en el campo de búsqueda de una aplicación empresarial. Recuperación de documentos
¿Dónde está la parte del contrato que necesito para mi tarea? Extraiga rápidamente información crítica de los contratos. Recuperación de documentos para contratos
Quiero que el chatbot que estoy construyendo utilice el conocimiento que poseo. Otorgue a un asistente virtual acceso rápido a la información técnica que se almacena en diversos orígenes de datos externos y formatos de documento para responder a las preguntas del cliente. Búsqueda de conversación
Quiero descubrir información sobre la que no sabía que preguntar. Obtenga información de valor a partir del análisis de patrones o realice el análisis de causa raíz. Content Mining

Para obtener más información, consulte Creación de proyectos.