Primeros pasos con Watson Discovery
En esta guía de aprendizaje, presentamos IBM Watson® Discovery y le guiamos por el proyecto de ejemplo Discovery. Explorar el proyecto de ejemplo es una gran forma de recorrer y probar algunas de las características del producto.
Abrir Watson Discovery
IBM Cloud
Estas instrucciones se aplican a todos los despliegues gestionados, incluyendo IBM Cloud Pak for Data como instancias de servicio.
-
Haga clic en la instancia de Discovery que ha creado para ir al panel de control del servicio.
-
En la página Gestionar, pulse Iniciar Watson Discovery.
Si se le solicita que inicie una sesión, proporcione sus credenciales de IBM Cloud.
IBM Cloud Pak for Data IBM Software Hub
Estas instrucciones se aplican a los despliegues de Discovery:
-
En el menú principal del cliente web, expanda Servicios y, a continuación, haga clic en Instancias.
-
Busque la instancia y, a continuación, púlselo para abrir su página de resumen.
Puede crear un máximo de 10 instancias por implementación. Después de alcanzar el número máximo, el botón Nueva instancia no se muestra en IBM Cloud Pak for Data.
-
Pulse Iniciar herramienta.
Abrir el proyecto de ejemplo
Se abre una nueva pestaña o ventana del navegador y se muestra la página Mis proyectos.

Para familiarizarse con el producto, puede ver un vídeo de visión general de menos de 3 minutos pulsando el enlace Ver un vídeo desde la página de inicio del producto.
En esta guía de aprendizaje, explora el proyecto de ejemplo.
El proyecto de ejemplo es un proyecto incorporado que se proporciona como recurso para que inicialmente explore el producto. El proyecto de ejemplo es un tipo de proyecto Recuperación de documentos. Los proyectos de recuperación de documentos se utilizan para buscar y encontrar las respuestas más relevantes a partir de sus datos.
-
Pulse Proyecto de ejemplo.
Se muestra la página Mejorar y personalizar.
Si acaba de instalar Discovery, el Proyecto de muestra necesita tiempo para terminar de procesar los documentos. Espere a que finalice el proceso antes de empezar a experimentar. Puede comprobar el estado del proceso de datos desde la página Actividad, que se describe en el paso siguiente.
Sample project Improve and customize page
Información sobre la colección de ejemplo
Conozca las formas de gestionar y mejorar una colección explorando la colección de ejemplo que está disponible con el proyecto de ejemplo. La colección de ejemplo consta de un conjunto de documentos PDF de soporte de IBM cargados.
-
Haga clic en el icono Gestionar colecciones en el panel de navegación.
Las colecciones del proyecto se muestran aquí. Este proyecto sólo tiene una colección.
Collections page in the Sample project -
Pulse Colección de ejemplo.
Se muestra la página Actividad. Esta página muestra el estado de la recogida. Por ejemplo, muestra el número total de documentos y cuándo se actualizó por última vez. Si el descubrimiento encuentra un problema cuando se carga un documento o se rastrea un origen de datos, los mensajes asociados se muestran aquí.
Activities page in the Sample project Después de crear una colección, puede llegar a esta página para buscar información sobre el estado de proceso de los datos de la colección.
-
Pulse el separador Enriquecimientos.
La página Enriquecimientos muestra una lista de los enriquecimientos disponibles. Los enriquecimientos hacen que la información significativa sea más fácil de encontrar y devolver en las búsquedas. Puede aplicar enriquecimientos incorporados a la colección para aprovechar los potentes modelos de Natural Language Understanding que etiquetan términos como, por ejemplo, palabras clave conocidas comúnmente.
Enrichments page of the Sample project El enriquecimiento Entidades se aplica a la colección de ejemplo:
- Entidades
- Reconoce nombres adecuados como personas, ciudades y organizaciones que se mencionan en el contenido.
Este enriquecimiento se aplica automáticamente a las colecciones que se añaden a proyectos del tipo Recuperación de documentos.
-
Para el enriquecimiento Entidades v2, pulse 1x Campos seleccionados.
Se visualiza una lista de campos disponibles y se selecciona el campo
text
. Esta selección significa que el enriquecimiento Entidades se ha aplicado al contenido que se ha indexado y se ha añadido a un campo denominadotext
cuando se han procesado los documentos de la colección.Entities enrichment being applied to the text field Desde esta página, puede aplicar nuevos enriquecimientos a la colección o cambiar los campos donde se aplica un enriquecimiento.
Una característica potente de Discovery es que puede añadir sus propios enriquecimientos personalizados, como diccionarios, patrones y modelos de aprendizaje automático. Cuando crea enriquecimientos personalizados, también se listan en esta página. Puede gestionar dónde se utilizan desde aquí.
Para obtener más información sobre los enriquecimientos personalizados, consulte Adición de recursos específicos de dominio.
-
Va a aplicar otro enriquecimiento a la colección. Busque el enriquecimiento Palabras clave en la lista y, a continuación, pulse Seleccionar campos.
El enriquecimiento de palabras clave reconoce términos conocidos comúnmente significativos en su contenido.
-
Desplácese por la lista de campos hasta que encuentre el campo
text
y selecciónelo.Fields to which you can apply the Keywords enrichment -
Pulse Aplicar cambios y volver a procesar.
Mientras los documentos se están reprocesando para buscar y etiquetar palabras clave, puede continuar explorando las herramientas disponibles para gestionar una colección.
-
Pulse Identificar campos.
La mayor parte del contenido de un documento se indexa automáticamente en el campo
text
. Es posible que desee indexar determinados tipos de contenido en campos diferentes o dividir documentos grandes para que el campotext
contenga menos pasajes por documento. Para ello, puede enseñar a Discovery a reconocer campos importantes en los documentos aplicando un modelo de Smart Document Understanding a la colección.Smart Document Understanding (SDU) es una tecnología que aprende sobre el contenido de un documento basado en la estructura del documento. Puede aplicar un modelo SDU preconstruido o crear un modelo SDU personalizado.
Smart Document Understanding model options Para crear un modelo SDU personalizado, seleccione la opción Modelo entrenado por el usuario y, a continuación, anote los campos en el documento. (No anotará documentos como parte de esta guía de aprendizaje.)
Smart Document Understanding annotation tool Para obtener más información sobre SDU, consulte Utilización de Smart Document Understanding.
-
Pulse Gestionar campos.
La página Gestionar campos lista los campos indexados. Desde aquí, puede incluir o eliminar campos del índice. También puede dividir documentos grandes en muchos documentos más pequeños.
Fields in the collection index Para obtener más información sobre la división de documentos, consulte División de documentos para que los resultados de la consulta sean más sucintos.
Buscar en el proyecto de ejemplo
-
Haga clic en el icono Mejorar y personalizar del panel de navegación.
La página Mejorar y personalizar es donde puede probar consultas y, a continuación, añadir y probar personalizaciones para mejorar los resultados de la consulta para su proyecto. Se visualiza una lista de consultas de ejemplo para ayudarle a empezar a enviar consultas de prueba.
-
Pulse el botón Ejecutar búsqueda para
IBM
.Se visualizan los resultados de la consulta.
-
En uno de los resultados de la consulta, pulse Ver pasajes del documento.
Se muestra una vista previa del documento donde se ha encontrado el resultado.
-
Realice una de las siguientes acciones para explorar el resultado de la búsqueda.
-
Haga clic en Abrir vista avanzada.
Se muestra información de resumen útil, como el número de apariciones de cualquier enriquecimiento que se detecte en el documento.
-
Seleccione la entidad
URL
para resaltar menciones de URL dentro del texto.Advanced view that shows entities that were recognized -
Para ver cómo se almacena la información del documento en formato JSON, pulse el menú Ver como en la cabecera de vista y seleccione JSON.
Se muestra una representación JSON del documento.
JSON representation of the document Puede explorar la representación JSON para ver la información que ha capturado el descubrimiento del documento. Por ejemplo, si expande la sección
enriched_text
y, a continuación, expande la secciónentities
, puede ver menciones de entidades reconocidas y etiquetadas por el enriquecimiento Entidades.Shows the enrichment_text.entities section of the JSON representation
-
Personalizar el proyecto de ejemplo
Ahora, vamos a personalizar un poco la vista de resultados de búsqueda añadiendo una faceta. Una faceta es una forma de organizar y clasificar documentos que comparten patrones o contenido similares.
-
En la página Mejorar y personalizar, envíe la siguiente consulta de lenguaje natural:
How do I install Discovery?
-
Revise los resultados de la consulta que se muestran.
Top Entities facet results Observe que se muestra una sección Entidades principales. Puede expandir las entidades y pulsar una de ellas para filtrar los resultados de la consulta para mostrar sólo los resultados en los que se menciona la entidad. La sección Entidades principales es una faceta incorporada. Utiliza la información que se ha añadido a los documentos mediante el enriquecimiento Entidades.
Añadirá su propia faceta que utiliza el enriquecimiento de palabras clave que ha aplicado a la colección en un paso anterior.
-
En el panel Herramientas de mejora, expanda Personalizar visualización y, a continuación, haga clic en Facetas.
Customize display options -
Haga clic en Nueva faceta y, a continuación, en el botón Desde campos existentes en una colección.
-
Elija
enriched_text.keywords.mentions.text
, cambie la etiqueta aKeywords
y, a continuación, pulse Aplicar.Creating a Keywords-based facet ¿Recuerda la representación JSON del documento que ha examinado anteriormente? Ahora que el enriquecimiento de palabras clave se aplica al campo
text
y los documentos se vuelven a procesar, las menciones de palabra clave que se encuentren en el campotext
se incluyen en la representación JSON del documento.El campo que ha seleccionado para utilizar para la faceta (
enriched_text.keywords.mentions.text
) refleja dónde se almacena el texto de la palabra clave en JSON."enriched_{field_name}": [ "keywords" : [ "mentions" : [ "text": "Cloud Pak" ] ] ]
-
Se muestra la nueva faceta. Puede pulsar una palabra clave para filtrar los documentos para incluir sólo los resultados que mencionan la palabra clave.
Keywords facet
Ha añadido correctamente un enriquecimiento NLU incorporado que reconoce palabras clave en los documentos de colección de ejemplo. A continuación, ha añadido una faceta que utiliza el enriquecimiento de palabras clave para permitir filtrar los documentos por palabra clave.
Compartir el proyecto de ejemplo
-
Pulse Integrar y desplegar en el panel de navegación.
Desde aquí, puede compartir su proyecto con sus colegas e implementarlo.
-
Siga las instrucciones en pantalla para agregar un usuario y, a continuación, envíe las credenciales de inicio de sesión y el enlace proporcionado a su colega.
Integrate and deploy page Después de crear su propia aplicación de búsqueda y estar preparado para desplegarla, puede utilizar componentes de interfaz de usuario precompilados o crear una aplicación personalizada.
-
Pulse Información de API. Desde esta página, puede obtener el ID de proyecto para el proyecto. Necesita el ID de proyecto para utilizar la API de descubrimiento. También necesita la instancia de servicio URL y la clave API. Los detalles de las credenciales están disponibles en la página Administrar de su instancia de servicio en IBM Cloud.
-
Pulse Componentes de interfaz de usuario para buscar enlaces a código listo para utilizar que puede utilizar para crear una aplicación de búsqueda con todas las características más rápidamente.
-
Añadir su propio contenido
Ahora que sabe más sobre algunas de las características del producto, está listo para evaluar los datos que desea buscar.
Todo se trata de los datos. Revise los tipos de contenido que posee y que desea que su solución de búsqueda pueda aprovechar.
Orígenes de datos soportados
La tabla siguiente muestra los orígenes de datos soportados para cada tipo de despliegue.
Origen de datos | IBM Cloud | IBM Cloud Pak for Data |
---|---|---|
Box | ||
Base de datos (IBM Data Virtualization, IBM Db2, Microsoft SQL, Oracle, Postgres) | ||
FileNet P8 | ||
HCL Notes | ||
IBM Cloud Object Storage | ||
Sistema de archivos local | ||
Salesforce | ||
Microsoft SharePoint Online | ||
Local de Microsoft SharePoint | ||
Sitio web | ||
Microsoft Windows sistema de archivos |
¿No está seguro de lo que puede construir?
Para obtener más información sobre los tipos de soluciones de búsqueda que puede crear, consulte Empezar a obtener valor de los datos.
Puede acceder a la documentación del producto en cualquier momento seleccionando el icono de ayuda en la cabecera de página de la interfaz de usuario del producto. El contenido de la ayuda se
personaliza para proporcionar información relacionada con lo que está haciendo en el producto.
No importa lo que construya, el paso uno es crear un proyecto. Decida qué tipo de proyecto se ajusta mejor a sus necesidades.
Si ninguno de los tipos existentes es correcto, puede elegir Ninguno de los anteriores para crear un proyecto personalizado en su lugar.
Descripciones de proyecto
Necesidad | Objetivo | Tipo proyecto |
---|---|---|
Deseo extraer datos para dar soporte a la automatización de tareas repetitivas de proceso de documentos. | Quiero comprender rápidamente qué datos se extraen de mis documentos y mejorar los datos aplicando enriquecimientos. | Proceso de documentos inteligentes |
¿Qué documento contiene la respuesta a mi pregunta? | Busque información significativa en fuentes que contengan una combinación de datos estructurados y no estructurados, y que la emerja en una aplicación de búsqueda empresarial autónoma o en el campo de búsqueda de una aplicación empresarial. | Recuperación de documentos |
¿Dónde está la parte del contrato que necesito para mi tarea? | Extraiga rápidamente información crítica de los contratos. | Recuperación de documentos para contratos |
Quiero que el chatbot que estoy construyendo utilice el conocimiento que poseo. | Otorgue a un asistente virtual acceso rápido a la información técnica que se almacena en diversos orígenes de datos externos y formatos de documento para responder a las preguntas del cliente. | Búsqueda de conversación |
Quiero descubrir información sobre la que no sabía que preguntar. | Obtenga información de valor a partir del análisis de patrones o realice el análisis de causa raíz. | Content Mining |
Para obtener más información, consulte Creación de proyectos.