Esta documentación es para IBM Watson® Knowledge Studio en IBM Cloud®. Para ver la documentación de la versión anterior de Knowledge Studio en IBM Marketplace, pulse este enlace.
Creación de un modelo basado en reglas (Experimental)
Esta guía de aprendizaje le ayuda a comprender cómo crear un modelo basado en reglas que puede utilizar para buscar patrones de texto que defina en los documentos.
Los modelos basados en reglas son experimentales y no están pensados para su uso en despliegues de producción. El soporte para los modelos se puede interrumpir tras un aviso con poco tiempo.
Creará un modelo que puede buscar texto en documentos que coincida con el patrón month day, year
. Por ejemplo, el modelo podría encontrar la fecha de referencia May 1, 2010. Antes de definir el propio patrón de reglas, creará
artefactos que le ayudarán a crear el patrón, incluida una clase de diccionario que reconoce las menciones de meses y una clase de expresión regular que reconoce las menciones de años en el texto.
Objetivos de aprendizaje
Cuando haya completado esta guía de aprendizaje sabrá cómo realizar las tareas siguientes:
- Crear clases
- Añadir documentos para definir reglas
- Asociar diccionarios con clases
- Definir expresiones regulares para capturar secuencias de caracteres
- Definir reglas
Tardará aproximadamente 30 minutos en terminar esta guía de aprendizaje. Si explora otros conceptos relacionados con esta guía de aprendizaje, el tiempo puede ser mayor.
Antes de empezar
- Está utilizando un navegador soportado. Para obtener más información, consulte Requisitos del navegador.
- Ha completado correctamente Iniciación a Knowledge Studio, que cubre la creación de un espacio de trabajo, la creación de un sistema de tipos y la adición de un diccionario.
- Debe tener al menos un ID de usuario en el rol de Admin o Gestor de proyectos. Para obtener información sobre los roles de usuario, consulte Roles de usuario en Knowledge Studio.
Resultados
Después de crear el modelo basado en reglas, puede utilizarlo de una de las siguientes formas para encontrar patrones de texto en los documentos:
- Preanote los documentos antes de crear un modelo de aprendizaje automático.
- Despliegue o exporte el modelo a otros servicios o productos de Watson.
Lección 1: Adición de un diccionario de meses
En esta lección, aprenderá a añadir un diccionario a un espacio de trabajo en Knowledge Studio. El diccionario contiene términos relacionados con los meses del año.
Acerca de esta tarea
En una lección posterior, definirá una clase basándose en este diccionario. Cuando cree tal clase, todos los términos de este diccionario que se encuentran en documentos se anotarán automáticamente como una mención del tipo de clase asociado. Para obtener más información sobre los diccionarios, consulte Adición de diccionarios a un espacio de trabajo.
Procedimiento
-
Descargue el
dictionary-items-month.csv
archivoen el sistema. Este archivo contiene términos de diccionario en formato CSV que resultan adecuados para cargar en un diccionario de Knowledge Studio.
-
Pulse Activos > Diccionarios.
-
Pulse el botón Crear diccionario para añadir un diccionario.
-
En el campo Nombre, escriba
Month dictionary
y pulse Guardar para crear el diccionario. El nuevo diccionario se creará y se abrirá automáticamente para su edición. -
En el panel del diccionario, pulse Cargar.
-
Seleccione el archivo
dictionary-items-month.csv
desde su sistema y pulse Cargar.Los términos del archivo se importan en el diccionario.
Lección 2: Adición de documentos de ejemplo
En esta lección, aprenderá a añadir documentos con patrones lingüísticos que ilustran los tipos de reglas que desea definir.
Acerca de esta tarea
Para obtener más información sobre la adición de documentos, consulte Añadir documentos para definir reglas.
Procedimiento
-
Descargue el
documents-new.csv
archivoen el sistema. Este archivo contiene documentos de ejemplo adecuados para cargarse.
-
Pulse Modelo basado en reglas > Reglas.
-
Pulse el icono Añadir un documento, que se encuentra junto a la cabecera de la página Documentos.
-
Pulse el separador Cargar archivo CSV.
-
Pulse para buscar el archivo
documents-new.csv
que ha descargado en el sistema anteriormente, y luego pulse Cargar.Se mostrará un conjunto de documentos en la página Documentos principal.
Lección 3: Creación de clases
En esta lección, aprenderá a definir clases que utilizará al definir una regla.
Acerca de esta tarea
Para obtener más información sobre las clases, consulte Reglas.
Procedimiento
-
Desde la página Reglas del espacio de trabajo, pulse el icono Añadir una clase junto a la cabecera Clase en el panel del lado derecho.
-
Escriba
DictMonth
como el nombre de clase y, a continuación, pulse Añadir.La nueva clase se visualiza en el panel lateral Clases.
Lección 4: Asociación de un diccionario con una clase
En esta lección, aprenderá a utilizar un diccionario en el editor de reglas.
Procedimiento
-
Pulse Modelo basado en reglas > Reglas y, a continuación, pulse el separador Diccionarios.
-
Seleccione el Diccionario de meses que ha creado previamente.
-
Desde la lista Clases, seleccione
DictMonth
y luego pulse Guardar.La clase está asociada con el diccionario.
Resultados
Para documentos asociados con el editor de reglas, las referencias a los términos del diccionario se anotan como menciones de clase DictMonth
. Verá la prueba de que estas referencias se han anotado en la siguiente lección.
Lección 5: Búsqueda de anotaciones de clases en documentos
En esta lección, aprenderá a buscar anotaciones de clases en los documentos del editor de reglas.
Procedimiento
-
Seleccione Modelo basado en reglas > Reglas.
-
Desde el panel Clases, busque la clase
DictMonth
que ha definido anteriormente, y pulse el icono Buscar anotaciones en documentos que está junto a ella.La página Buscar anotaciones se visualizará y mostrará todos los documentos que contienen referencias de texto a meses.
-
Pulse el documento
Technology - computerworld.com
para ver el documento completo. Observe que el textoFebruary
está resaltado, lo que significa que fue anotado como una mención de la claseDictMonth
.
Lección 6: Definición de una expresión regular
En esta lección, aprenderá a definir una expresión regular.
Acerca de esta tarea
Definirá una expresión regular que pueda buscar patrones de año como 2009
.
Para obtener más información sobre cómo definir expresiones regulares, consulte Definición de una regla.
Procedimiento
-
En la página Reglas, pulse el icono Añadir una clase  junto a Clase en el panel lateral derecho.
-
Escriba
RegExpYear
como el nombre de clase, y pulse Añadir. -
Pulse el separador Expresión regular, y luego pulse el icono Crear una expresión regular junto a la cabecera Expresiones regulares.
-
Pulse Añadir entrada.
-
En el campo Expresión regular, especifique la expresión siguiente, que encuentra años entre
1900
y2099
:(?:(?:19|20)[0-9]{2})
-
Establezca Señales de palabras mínimas en
1
y Señales de palabras máximas en1
. -
Pulse Añadir para guardar la entrada de la expresión regular.
-
Escriba
MyYearExp
como nombre de expresión regular, y luego, desde el menú Clases, seleccione la claseRegExpYear
que ha definido anteriormente. -
Pulse Guardar.
Después de guardar la expresión regular, se aplicará automáticamente a los documentos de ejemplo. Las cadenas de texto que siguen al patrón definido en la expresión regular se anotan como menciones de la clase
RegExpYear
. -
Para comprobar si la expresión que ha definido está capturando apariciones de tiempo correctamente, puede buscar menciones. Pulse el icono Buscar anotaciones en documentos junto a la clase
RegExpYear
en el panel Clases..
Se mostrará la página Buscar anotaciones. Las apariciones de las menciones de año están resaltadas en los documentos de ejemplo en los que se dan.
Lección 7: Definición de una regla
En esta lección, aprenderá a definir una regla.
Acerca de esta tarea
Ya ha definido una clase basada en diccionario para anotar menciones de meses. También ha definido una expresión regular que busca valores numéricos que representan un año. Ahora, definirá una regla que captura la secuencia de un mes seguida por un número, una coma y luego un año. Definirá una regla para expresiones de fecha como September 21, 2016.
Para obtener más información sobre cómo definir reglas, consulte Definición de una regla.
Procedimiento
-
Seleccione Modelo basado en reglas > Reglas y abra el documento
Technology - computerworld.com
. -
Seleccione el texto
February 3, 2009
en el documento. Asegúrese de seleccionar también la coma.
-
Pulse el icono Añadir una regla.
El editor de reglas muestra una representación del patrón de reglas especificado.
El texto
February 3, 2009
es visible. Una línea sólida que conecta las células en la representación identifica qué células son actualmente parte del patrón.- La clase
DictMonth
forma parte del patrón de reglas en lugar del textoFebruary
. Esta selección es preferible porque desea que el modelo busque cualquier mes anotado por la claseDictMonth
como la primera señal del patrón de fecha en lugar de solo el textoFebruary
. - Al final de la regla, el año
2009
ya está anotado como una mención de la claseRegExpYear
. La claseRegExpYear
forma parte del patrón de reglas en lugar del número 2009. Esta selección es preferible también porque desea que el modelo busque cualquier año anotado por la claseRegExpYear
como la última señal del patrón de fecha en lugar de solo el texto específico2009
.
El número 3 y la coma (,) que hay después se muestran como las señales segunda y tercera en el patrón. A medida que se especifique el patrón, el modelo buscará solo apariciones de fechas que especifican el tercer día de un mes. Deseamos que el modelo busque fechas que especifiquen cualquier día del mes, por lo que cambiaremos a continuación los valores de las características para la señal día.
- La clase
-
Sobre la celda de día
3
, pulse el icono Texto para abrir los valores de las características para la señal.Actualmente, se establece la regla para que coincida con el texto exacto,
3
. En su lugar, queremos que coincida con cualquier número. -
Cambie el valor de la característica a numérico seleccionando Tipo de carácter: numérico y, a continuación, borre la selección Texto: 3.

Ha cambiado la definición para la célula de número
3
..
El icono Tipo de carácter indica que en lugar de exigir que el número sea igual a 3 exactamente, puede ser cualquier número.
-
No cambie ningún valor para la señal coma.
Queremos que la tercera señal del patrón sea una coma, por lo que el valor de la característica actual de texto : , es apropiado. Además del valor de una característica, cada señal tiene un valor repetido. El valor repetido especifica cuántas veces se puede repetir la señal en el texto para que coincida con el patrón. El valor de repetición actual de Necesario (Exactamente 1) es apropiado.

-
Asigne una clase para representar el patrón
DictMonth + numeric token + comma + RegExpYear
.Observe las cuatro células vacías que representan las cuatro señales que ha seleccionado en el documento. Para seleccionar todas las células, seleccione la primera y, a continuación, pulse Mayús + pulse cada célula adicional. Escriba
RuleDate
como el nombre de clase y, a continuación, púlselo para crear la nueva clase.
-
En el campo Nombre de regla, escriba
MyDateRule
y pulse Guardar.Después de guardar la regla, se aplicará automáticamente a los documentos de ejemplo. Si el documento
Technology - computerworld.com
sigue estando abierto en el editor de reglas, verá que el textoFebruary 3, 2009
del documento ahora está anotado como una mención de la clase RuleDate.
Puede buscar todas las apariciones de las menciones de clase
RuleDate
en los documentos de ejemplo pulsando el icono Anotación de búsqueda en documentossituada junto a la clase
RuleDate
en el panel Clase. Es una buena práctica comprobar que todas las fechas se capturan correctamente para confirmar que ha definido el patrón correctamente.
Lección 8: Creación de un modelo basado en reglas
En esta lección, aprenderá a crear un modelo basado en reglas.
Acerca de esta tarea
Para obtener más información sobre la creación de un modelo basado en reglas, consulte Creación del modelo basado en reglas.
Procedimiento
-
Seleccione Modelo basado en reglas > Versiones y pulse el separador Correlación de tipos de modelos basados en reglas.
-
Correlacione la clase
RuleDate
con la entidadDATE
del sistema de tipos.-
Busque la entidad
DATE
y pulse Editar.
-
Elija la clase
RuleDate
en la lista y pulse Guardar.
-
-
Para preanotar conjuntos de documentos o conjuntos de anotaciones con el modelo basado en reglas:
- En la página Modelo de aprendizaje automático > Preanotación, pulse Ejecutar preanotadores.
- Seleccione Modelo basado en reglas y luego pulse Siguiente.
- Seleccione el conjunto de documentos que ha añadido al corpus,
documents-ml.csv
, y pulse Ejecutar.
Atención: ejecute el modelo basado en reglas como un preanotador sólo en documentos que no estaban ya anotados por usuarios físicos (personas).
Resumen de la guía de aprendizaje
A la vez que aprendía sobre Knowledge Studio, ha creado un modelo basado en reglas.
Lecciones aprendidas
Al completar esta guía de aprendizaje, habrá aprendido los siguientes conceptos:
- Clases
- Expresiones regulares
- Reglas