IBM Cloud Docs
Creación de un modelo basado en reglas (Experimental)

Esta documentación es para IBM Watson® Knowledge Studio en IBM Cloud®. Para ver la documentación de la versión anterior de Knowledge Studio en IBM Marketplace, pulse este enlace.

Creación de un modelo basado en reglas (Experimental)

Esta guía de aprendizaje le ayuda a comprender cómo crear un modelo basado en reglas que puede utilizar para buscar patrones de texto que defina en los documentos.

Los modelos basados en reglas son experimentales y no están pensados para su uso en despliegues de producción. El soporte para los modelos se puede interrumpir tras un aviso con poco tiempo.

Creará un modelo que puede buscar texto en documentos que coincida con el patrón month day, year. Por ejemplo, el modelo podría encontrar la fecha de referencia May 1, 2010. Antes de definir el propio patrón de reglas, creará artefactos que le ayudarán a crear el patrón, incluida una clase de diccionario que reconoce las menciones de meses y una clase de expresión regular que reconoce las menciones de años en el texto.

Objetivos de aprendizaje

Cuando haya completado esta guía de aprendizaje sabrá cómo realizar las tareas siguientes:

  • Crear clases
  • Añadir documentos para definir reglas
  • Asociar diccionarios con clases
  • Definir expresiones regulares para capturar secuencias de caracteres
  • Definir reglas

Tardará aproximadamente 30 minutos en terminar esta guía de aprendizaje. Si explora otros conceptos relacionados con esta guía de aprendizaje, el tiempo puede ser mayor.

Antes de empezar

  • Está utilizando un navegador soportado. Para obtener más información, consulte Requisitos del navegador.
  • Ha completado correctamente Iniciación a Knowledge Studio, que cubre la creación de un espacio de trabajo, la creación de un sistema de tipos y la adición de un diccionario.
  • Debe tener al menos un ID de usuario en el rol de Admin o Gestor de proyectos. Para obtener información sobre los roles de usuario, consulte Roles de usuario en Knowledge Studio.

Resultados

Después de crear el modelo basado en reglas, puede utilizarlo de una de las siguientes formas para encontrar patrones de texto en los documentos:

Lección 1: Adición de un diccionario de meses

En esta lección, aprenderá a añadir un diccionario a un espacio de trabajo en Knowledge Studio. El diccionario contiene términos relacionados con los meses del año.

Acerca de esta tarea

En una lección posterior, definirá una clase basándose en este diccionario. Cuando cree tal clase, todos los términos de este diccionario que se encuentran en documentos se anotarán automáticamente como una mención del tipo de clase asociado. Para obtener más información sobre los diccionarios, consulte Adición de diccionarios a un espacio de trabajo.

Procedimiento

  1. Descargue el dictionary-items-month.csv archivo icono Enlace externo en el sistema. Este archivo contiene términos de diccionario en formato CSV que resultan adecuados para cargar en un diccionario de Knowledge Studio.

  2. Pulse Activos > Diccionarios.

  3. Pulse el botón Crear diccionario para añadir un diccionario.

  4. En el campo Nombre, escriba Month dictionary y pulse Guardar para crear el diccionario. El nuevo diccionario se creará y se abrirá automáticamente para su edición.

  5. En el panel del diccionario, pulse Cargar.

  6. Seleccione el archivo dictionary-items-month.csv desde su sistema y pulse Cargar.

    Los términos del archivo se importan en el diccionario.

Lección 2: Adición de documentos de ejemplo

En esta lección, aprenderá a añadir documentos con patrones lingüísticos que ilustran los tipos de reglas que desea definir.

Acerca de esta tarea

Para obtener más información sobre la adición de documentos, consulte Añadir documentos para definir reglas.

Procedimiento

  1. Descargue el documents-new.csvarchivo icono Enlace externo en el sistema. Este archivo contiene documentos de ejemplo adecuados para cargarse.

  2. Pulse Modelo basado en reglas > Reglas.

  3. Pulse el icono Añadir un documento, que se encuentra junto a la cabecera de la página Documentos.

  4. Pulse el separador Cargar archivo CSV.

  5. Pulse para buscar el archivo documents-new.csv que ha descargado en el sistema anteriormente, y luego pulse Cargar.

    Se mostrará un conjunto de documentos en la página Documentos principal.

    Muestra tres de los catorce documentos que se han añadido al editor de reglas. Muestra el título del documento y un extracto del principio de cada documento. También hay un icono de supresión junto a cada documento que se puede utilizar para suprimir el documento.

Lección 3: Creación de clases

En esta lección, aprenderá a definir clases que utilizará al definir una regla.

Acerca de esta tarea

Para obtener más información sobre las clases, consulte Reglas.

Procedimiento

  1. Desde la página Reglas del espacio de trabajo, pulse el icono Añadir una clase junto a la cabecera Clase en el panel del lado derecho.

  2. Escriba DictMonth como el nombre de clase y, a continuación, pulse Añadir.

    La nueva clase se visualiza en el panel lateral Clases.

Lección 4: Asociación de un diccionario con una clase

En esta lección, aprenderá a utilizar un diccionario en el editor de reglas.

Procedimiento

  1. Pulse Modelo basado en reglas > Reglas y, a continuación, pulse el separador Diccionarios.

  2. Seleccione el Diccionario de meses que ha creado previamente.

  3. Desde la lista Clases, seleccione DictMonth y luego pulse Guardar.

    La clase está asociada con el diccionario.

    Muestra que la clase DictMonth está asociada al diccionario Month en el panel Diccionarios de la página Reglas.

Resultados

Para documentos asociados con el editor de reglas, las referencias a los términos del diccionario se anotan como menciones de clase DictMonth. Verá la prueba de que estas referencias se han anotado en la siguiente lección.

Lección 5: Búsqueda de anotaciones de clases en documentos

En esta lección, aprenderá a buscar anotaciones de clases en los documentos del editor de reglas.

Procedimiento

  1. Seleccione Modelo basado en reglas > Reglas.

  2. Desde el panel Clases, busque la clase DictMonth que ha definido anteriormente, y pulse el icono Buscar anotaciones en documentos que está junto a ella.

    La página Buscar anotaciones se visualizará y mostrará todos los documentos que contienen referencias de texto a meses.

  3. Pulse el documento Technology - computerworld.com para ver el documento completo. Observe que el texto February está resaltado, lo que significa que fue anotado como una mención de la clase DictMonth.

Lección 6: Definición de una expresión regular

En esta lección, aprenderá a definir una expresión regular.

Acerca de esta tarea

Definirá una expresión regular que pueda buscar patrones de año como 2009.

Para obtener más información sobre cómo definir expresiones regulares, consulte Definición de una regla.

Procedimiento

  1. En la página Reglas, pulse el icono Añadir una clase ![The "Add a class" icon](images/wks_tut_dict_add.jpg "El icono "Añadir una clase"") junto a Clase en el panel lateral derecho.

  2. Escriba RegExpYear como el nombre de clase, y pulse Añadir.

  3. Pulse el separador Expresión regular, y luego pulse el icono Crear una expresión regular junto a la cabecera Expresiones regulares.

  4. Pulse Añadir entrada.

  5. En el campo Expresión regular, especifique la expresión siguiente, que encuentra años entre 1900 y 2099:

    (?:(?:19|20)[0-9]{2})
    
  6. Establezca Señales de palabras mínimas en 1 y Señales de palabras máximas en 1.

  7. Pulse Añadir para guardar la entrada de la expresión regular.

  8. Escriba MyYearExp como nombre de expresión regular, y luego, desde el menú Clases, seleccione la clase RegExpYear que ha definido anteriormente.

  9. Pulse Guardar.

    Después de guardar la expresión regular, se aplicará automáticamente a los documentos de ejemplo. Las cadenas de texto que siguen al patrón definido en la expresión regular se anotan como menciones de la clase RegExpYear.

  10. Para comprobar si la expresión que ha definido está capturando apariciones de tiempo correctamente, puede buscar menciones. Pulse el icono Buscar anotaciones en documentos junto a la clase RegExpYear en el panel Clases.

    ![Shows the hovering over the magnifying glass icon next to the "RegExpYear" class in the Class panel of the Rules page.](images/rule-regex-add5.png "Muestra el cursor pasando por encima del icono de lupa junto a la clase" RegExpYear" en el panel Clase de la página Reglas").

    Se mostrará la página Buscar anotaciones. Las apariciones de las menciones de año están resaltadas en los documentos de ejemplo en los que se dan.

    Muestra ocho anotaciones de años resaltadas en extractos de los documentos de ejemplo.

Lección 7: Definición de una regla

En esta lección, aprenderá a definir una regla.

Acerca de esta tarea

Ya ha definido una clase basada en diccionario para anotar menciones de meses. También ha definido una expresión regular que busca valores numéricos que representan un año. Ahora, definirá una regla que captura la secuencia de un mes seguida por un número, una coma y luego un año. Definirá una regla para expresiones de fecha como September 21, 2016.

Para obtener más información sobre cómo definir reglas, consulte Definición de una regla.

Procedimiento

  1. Seleccione Modelo basado en reglas > Reglas y abra el documento Technology - computerworld.com.

  2. Seleccione el texto February 3, 2009 en el documento. Asegúrese de seleccionar también la coma.

    ![Shows the text "February 3, 2009" selected in the document.](images/rule-add1.png "Muestra el texto "3 de febrero de 2009" seleccionado en el documento.")

  3. Pulse el icono Añadir una regla.

    El editor de reglas muestra una representación del patrón de reglas especificado.

    El texto February 3, 2009 es visible. Una línea sólida que conecta las células en la representación identifica qué células son actualmente parte del patrón.

    • La clase DictMonth forma parte del patrón de reglas en lugar del texto February. Esta selección es preferible porque desea que el modelo busque cualquier mes anotado por la clase DictMonth como la primera señal del patrón de fecha en lugar de solo el texto February.
    • Al final de la regla, el año 2009 ya está anotado como una mención de la clase RegExpYear. La clase RegExpYear forma parte del patrón de reglas en lugar del número 2009. Esta selección es preferible también porque desea que el modelo busque cualquier año anotado por la clase RegExpYear como la última señal del patrón de fecha en lugar de solo el texto específico 2009.

    El número 3 y la coma (,) que hay después se muestran como las señales segunda y tercera en el patrón. A medida que se especifique el patrón, el modelo buscará solo apariciones de fechas que especifican el tercer día de un mes. Deseamos que el modelo busque fechas que especifiquen cualquier día del mes, por lo que cambiaremos a continuación los valores de las características para la señal día.

  4. Sobre la celda de día 3, pulse el icono Texto para abrir los valores de las características para la señal.

    Muestra el usuario pulsando el icono Valores de característica de texto.

    Actualmente, se establece la regla para que coincida con el texto exacto, 3. En su lugar, queremos que coincida con cualquier número.

  5. Cambie el valor de la característica a numérico seleccionando Tipo de carácter: numérico y, a continuación, borre la selección Texto: 3.

    ![Shows the user clicking the "Character Type : Number" option as the feature setting for the "3" token.](images/rule-add5.png "Muestra el usuario pulsando la opción "Tipo de carácter: Número"como valor de característica para la señal "3".")

    Ha cambiado la definición para la célula de número 3.

    ![Shows the cell that represents the "3" token now has a "Character Type" icon above it to indicate that any numeric value can match that token in the pattern.](images/rule-add6.png "Muestra que la célula que representa la señal "3" ahora tiene un icono "Tipo de carácter" encima para indicar que cualquier valor numérico puede coincidir con ese símbolo en el patrón").

    El icono Tipo de carácter indica que en lugar de exigir que el número sea igual a 3 exactamente, puede ser cualquier número.

  6. No cambie ningún valor para la señal coma.

    Queremos que la tercera señal del patrón sea una coma, por lo que el valor de la característica actual de texto : , es apropiado. Además del valor de una característica, cada señal tiene un valor repetido. El valor repetido especifica cuántas veces se puede repetir la señal en el texto para que coincida con el patrón. El valor de repetición actual de Necesario (Exactamente 1) es apropiado.

    ![Shows the repeat setting for the comma token which is set to "Exactly 1".](images/rule-add7.png "Muestra el valor de repetición para la señal de coma que se establece en "Exactamente 1".")

  7. Asigne una clase para representar el patrón DictMonth + numeric token + comma + RegExpYear.

    Observe las cuatro células vacías que representan las cuatro señales que ha seleccionado en el documento. Para seleccionar todas las células, seleccione la primera y, a continuación, pulse Mayús + pulse cada célula adicional. Escriba RuleDate como el nombre de clase y, a continuación, púlselo para crear la nueva clase.

    ![Shows that all four cells in the top row have been selected and the span is being defined as the "RuleDate" class.](images/rule-add8.png "Muestra que se han seleccionado las cuatro células de la fila superior y que se está definiendo la distribución como la clase "RuleDate".")

  8. En el campo Nombre de regla, escriba MyDateRule y pulse Guardar.

    Después de guardar la regla, se aplicará automáticamente a los documentos de ejemplo. Si el documento Technology - computerworld.com sigue estando abierto en el editor de reglas, verá que el texto February 3, 2009 del documento ahora está anotado como una mención de la clase RuleDate.

    ![Shows text from the "Technology - computerworld.com" document with only the text "February 3, 2009" annotated as a mention of the "RuleDate" class.](images/rule-add10.png "Muestra texto del documento "Tecnología - computerworld.com" con únicamente el texto "3 de febrero de 2009" anotado como una mención de la clase "RuleDate".")

    Puede buscar todas las apariciones de las menciones de clase RuleDate en los documentos de ejemplo pulsando el icono Anotación de búsqueda en documentos Una lupa para representar una búsqueda situada junto a la clase RuleDate en el panel Clase. Es una buena práctica comprobar que todas las fechas se capturan correctamente para confirmar que ha definido el patrón correctamente.

    ![Shows the "Find Annotations" page with two documents that contain dates that match the rule pattern you just defined.](images/rule-add11.png "Muestra la página "Buscar anotaciones" con dos documentos que contienen fechas que coinciden con el patrón de reglas que acaba de definir.")

Lección 8: Creación de un modelo basado en reglas

En esta lección, aprenderá a crear un modelo basado en reglas.

Acerca de esta tarea

Para obtener más información sobre la creación de un modelo basado en reglas, consulte Creación del modelo basado en reglas.

Procedimiento

  1. Seleccione Modelo basado en reglas > Versiones y pulse el separador Correlación de tipos de modelos basados en reglas.

  2. Correlacione la clase RuleDate con la entidad DATE del sistema de tipos.

    1. Busque la entidad DATE y pulse Editar.

      ![Shows the user clicking Edit for the "DATE" entity type in the "Rule-based model type mapping" tab.](images/rule-anno2.png "Muestra el usuario pulsando Editar para el tipo de entidad "DATE" en la pestaña" Correlación de tipo de modelo basado en regla".")

    2. Elija la clase RuleDate en la lista y pulse Guardar.

      ![Shows the user choosing the "RuleDate" class from the list.](images/rule-anno3.png "Muestra el usuario que elige la clase "RuleDate" en la lista.")

  3. Para preanotar conjuntos de documentos o conjuntos de anotaciones con el modelo basado en reglas:

    • En la página Modelo de aprendizaje automático > Preanotación, pulse Ejecutar preanotadores.
    • Seleccione Modelo basado en reglas y luego pulse Siguiente.
    • Seleccione el conjunto de documentos que ha añadido al corpus, documents-ml.csv, y pulse Ejecutar.

    Atención: ejecute el modelo basado en reglas como un preanotador sólo en documentos que no estaban ya anotados por usuarios físicos (personas).

Resumen de la guía de aprendizaje

A la vez que aprendía sobre Knowledge Studio, ha creado un modelo basado en reglas.

Lecciones aprendidas

Al completar esta guía de aprendizaje, habrá aprendido los siguientes conceptos:

  • Clases
  • Expresiones regulares
  • Reglas