Migración de soluciones de Knowledge Studio
Utilice modelos personalizados y otros recursos que ha creado en Knowledge Studio migrándolos a Discovery.
Utilización de un modelo tal cual
Para empezar a utilizar el modelo Knowledge Studio inmediatamente, exporte el modelo desde Knowledge Studio e impórtelo a Discovery como enriquecimiento de aprendizaje automático.
Cuando importa un modelo Knowledge Studio para utilizarlo tal cual en Discovery, los tipos de entidad de nivel raíz que se han definido en el modelo se pueden reconocer cuando aparecen en los documentos. Las menciones de subtipos de entidad que se producen se identifican como menciones del tipo de entidad padre. Las propias entidades de subtipo no se conservan. Si desea que el modelo continúe distinguiendo entre distintos subtipos de una entidad, debe realizar pasos adicionales. Para obtener más información, consulte Retención de información de subtipo.
No puede continuar actualizando un modelo que importa como enriquecimiento de ML.
Los siguientes tipos de modelos se pueden importar y utilizar tal cual:
- Modelos basados en reglas creados en Knowledge Studio que encuentran entidades en documentos basados en reglas que defina. (Formato de archivo: .pear)
- Modelos de aprendizaje automático creados en Knowledge Studio que comprenden los matices lingüísticos, el significado y las relaciones específicas de su sector (formato de archivo: .zip)
Los modelos que puede añadir dependen del tipo de despliegue:
- IBM Cloud Puede añadir modelos creados con una instancia de IBM Watson® Knowledge Studio alojada únicamente en IBM Cloud.
- IBM Cloud Pak for Data puede añadir modelos que se crearon con una instancia de xml-ph-0000@deepl.internal alojada en xml-ph-0001@deepl.internal o xml-ph-00 IBM Software Hub Puede añadir modelos que se hayan creado con una instancia de IBM Watson® Knowledge Studio alojada en IBM Cloud Pak® for Data o IBM Cloud.
Para obtener más información, consulte Utilización de modelos ML importados para buscar términos personalizados.
Utilización de un corpus como datos de entrenamiento
Discovery tiene una herramienta de extractor de entidad que puede utilizar para definir un sistema de tipos. La interfaz de usuario del extractor de entidad es similar a la interfaz de usuario de Knowledge Studio que se utiliza para anotar documentos que se añaden al corpus para un modelo de aprendizaje automático. Sin embargo, en Knowledge Studio, sólo define entidades de nivel raíz, no subtipos ni relaciones.
Como alternativa a importar un modelo Knowledge Studio tal cual y aplicarlo como enriquecimiento, también puede importar un corpus Knowledge Studio. Cuando añade un corpus Knowledge Studio a la herramienta de extractor de entidad Discovery, las entidades de nivel raíz del corpus se representan como entidades nuevas en el espacio de trabajo de extractor de entidad Discovery. Los subtipos de entidad no se reconocen. Aunque, puede realizar pasos adicionales para retener información de subtipo.
Las relaciones y correferencias del modelo de aprendizaje automático Knowledge Studio no están representadas, ni hay diccionarios personalizados asociados con el modelo.
Cosas a tener en cuenta al elegir si importar un modelo o importar un corpus:
- Puede continuar editando el sistema de tipos al importar el corpus. Cuando importa un modelo entrenado, no puede editarlo posteriormente en Discovery.
- Un modelo importado que se aplica a una colección como enriquecimiento puede reconocer cualquier subtipo de entidad, relación e información de correferencia que el modelo original se haya entrenado para reconocer además de las entidades de nivel raíz. Un enriquecimiento de extractor de entidad sólo puede buscar y etiquetar entidades.
Para obtener más información, consulte Importación de un corpus de Knowledge Studio.
Retención de información de subtipo
Cuando importa un modelo Knowledge Studio a Discovery, los subtipos definidos en el modelo se identifican como menciones del tipo de entidad padre. Las propias entidades de subtipo no se conservan. Para conservar la información de subtipo, debe aplanar el sistema de tipos convirtiendo los subtipos de entidad en nuevos tipos de entidad de nivel raíz.
Siga estos pasos sólo si está seguro de que las distinciones de subtipo añaden un valor significativo al modelo. En muchos casos de uso, el uso de los tipos de entidad de nivel raíz es suficiente.
No puede utilizar este procedimiento para retener subtipos si alguno de los documentos del corpus se ha anotado previamente con el servicio Natural Language Understanding. Asegúrese de que el sistema de tipos aplanados no supera el número permitido de tipos de entidad para el plan. Para obtener más información, consulte Límites de extractor de entidad.
Por ejemplo, el modelo puede tener tipos de entidad con la jerarquía siguiente:
APPLIANCES
FURNITURE
PATIO
LIVING
DINING
Una versión aplanada del sistema de tipo tiene este aspecto:
APPLIANCES
FURNITURE_NONE
FURNITURE_PATIO
FURNITURE_LIVING
FURNITURE_DINING
Un enfoque útil para aplanar el sistema de tipos implica los cambios siguientes:
- Añada la etiqueta de tipo de entidad padre (
FURNITURE
) como prefijo a la etiqueta de cada subtipo hijo para producir una nueva entidad de nivel raíz que conserve la relación jerárquica en su etiqueta. Por ejemplo,FURNITURE_PATIO
,FURNITURE_LIVING
yFURNITURE_DINING
. - Añada la palabra NONE a la etiqueta de entidad de nivel raíz padre para identificarla como padre. Por ejemplo,
FURNITURE_NONE
. - Deje sin modificar las etiquetas de los tipos de entidad que no tienen subtipos. Por ejemplo, la etiqueta
APPLIANCES
no cambia.
Para conservar la información de subtipo de entidad, realice los pasos siguientes:
-
Asegúrese de que la anotación y el entrenamiento del modelo Knowledge Studio se hayan completado y de que el modelo esté listo para desplegarse.
-
Exporte el sistema de tipos que se ha utilizado para anotar los documentos del corpus desde Knowledge Studio como archivo .json.
Siga los pasos adecuados para exportar en función del tipo de despliegue Knowledge Studio:
- IBM CloudCarga de recursos desde otro espacio de trabajo
- IBM Cloud Pak for DataIBM Software HubCargar recursos desde otro espacio de trabajo
-
Modifique el archivo JSON del sistema de tipos. Para cada subtipo, añada un nuevo tipo de entidad de nivel raíz.
Por ejemplo, el sistema de tipos original puede contener los tipos siguientes:
{ "id":"b9d6caa2-90ac-47ff-91f6-2149b8ffcf20", "label":"FURNITURE", "sireProp":{ "mentionType":null, "subtypes":["PATIO","LIVING","DINING"], "roles":["b9d6caa2-90ac-47ff-91f6-2149b8ffcf20","93ba1f27-173f-4714-b31e-77bdd8cb9932"], "clazz":null, "color":"black", "hotkey":"m", "backGroundColor":"#00FFFF", "active":true, "roleOnly":false}, "creationDate":1610611788484, "source":null, "modifiedDate":0, "typeType":null, "typeClass":null, "typeVersion":null, "typeDesc":null, "typeSuperType":null, "typeSuperTypeId":null, "typeCreateDate":null, "typeUpdateDate":null, "typeProvenance":null, "alchemyAPITypes":null, "nluAPITypes":null},
Para convertir los subtipos a nuevos tipos de nivel raíz, realice el cambio siguiente:
{ "id":"b9d6caa2-90ac-47ff-91f6-2149b8ffcf20", "label":"FURNITURE_NONE", "sireProp":{ "mentionType":null, "subtypes":null, "roles":["b9d6caa2-90ac-47ff-91f6-2149b8ffcf20","93ba1f27-173f-4714-b31e-77bdd8cb9932"], "clazz":null, "and so on" } }, { "id":"b9d6caa2-90ac-47ff-91f6-2149b8ffcf20", "label":"FURNITURE_PATIO", "sireProp":{ "mentionType":null, "subtypes":null, "roles":["b9d6caa2-90ac-47ff-91f6-2149b8ffcf20","93ba1f27-173f-4714-b31e-77bdd8cb9932"], "clazz":null, "and so on" } }, { "id":"b9d6caa2-90ac-47ff-91f6-2149b8ffcf20", "label":"FURNITURE_LIVING", "sireProp":{ "mentionType":null, "subtypes":null, "roles":["b9d6caa2-90ac-47ff-91f6-2149b8ffcf20","93ba1f27-173f-4714-b31e-77bdd8cb9932"], "clazz":null, "and so on" } }, { "id":"b9d6caa2-90ac-47ff-91f6-2149b8ffcf20", "label":"FURNITURE_DINING", "sireProp":{ "mentionType":null, "subtypes":null, "roles":["b9d6caa2-90ac-47ff-91f6-2149b8ffcf20","93ba1f27-173f-4714-b31e-77bdd8cb9932"], "clazz":null, "and so on" } },
-
Asigne un ID exclusivo a cada nuevo tipo de entidad de nivel raíz.
-
Exporte el corpus para el modelo de aprendizaje automático desde Knowledge Studio como un archivo comprimido.
Siga los pasos adecuados para exportar en función del tipo de despliegue Knowledge Studio:
- IBM CloudCarga de recursos desde otro espacio de trabajo
- IBM Cloud Pak for DataIBM Software HubCargar recursos desde otro espacio de trabajo
-
En el corpus descargado, para todas las menciones con un subtipo definido, actualice la información de tipo de la mención para especificar el nuevo tipo de entidad de nivel raíz.
Por ejemplo, el sistema de tipos original puede incluir la mención de subtipo
PATIO
:{ "id" : "Blogs_shopper.com_dc5cf4764d91f87575b17ac8a5268462.en-M92", "source" : "IMPORT", "properties" : { "SIRE_ENTITY_CLASS" : "SPC", "SIRE_MENTION_CLASS" : "SPC", "SIRE_ENTITY_LEVEL" : "NONE", "SIRE_ENTITY_SUBTYPE" : "PATIO", "SIRE_MENTION_ROLE" : "FURNITURE", "SIRE_MENTION_TYPE" : "NONE" }, "type" : "FURNITURE", "begin" : 3221, "end" : 3234, "inCoref" : false },
Sustituya el valor de
SIRE_MENTION_ROLE
ytype
para la mención con la nueva etiqueta de entidad de nivel raíz, como por ejemploFURNITURE_PATIO
. EspecifiqueNONE
como valor deSIRE_ENTITY_SUBTYPE
.{ "id" : "Blogs_shopper.com_dc5cf4764d91f87575b17ac8a5268462.en-M92", "source" : "IMPORT", "properties" : { "SIRE_ENTITY_CLASS" : "SPC", "SIRE_MENTION_CLASS" : "SPC", "SIRE_ENTITY_LEVEL" : "NONE", "SIRE_ENTITY_SUBTYPE" : "NONE", "SIRE_MENTION_ROLE" : "FURNITURE_PATIO", "SIRE_MENTION_TYPE" : "NONE" }, "type" : "FURNITURE_PATIO", "begin" : 3221, "end" : 3234, "inCoref" : false },
No olvide cambiar el nombre de las etiquetas de mención padre.
Por ejemplo, busque menciones que especifiquen
"SIRE_ENTITY_SUBTYPE" : "OTHER"
y, a continuación, cambie el valor deOTHER
aNONE
.Cambie el valor de
SIRE_MENTION_ROLE
ytype
para la mención a la nueva etiqueta de tipo de entidad padre.Por ejemplo, cambie los valores
SIRE_MENTION_ROLE
ytype
para estas menciones deFURNITURE
aFURNITURE_NONE
, ySIRE_ENTITY_SUBTYPE
aNONE
.{ "id" : "Sports_herald.com_be99aca94a7cff5abb74476b844a11b6.en-M75", "source" : "IMPORT", "properties" : { "SIRE_MENTION_CLASS" : "SPC", "SIRE_ENTITY_LEVEL" : "NONE", "SIRE_ENTITY_SUBTYPE" : "NONE", "SIRE_ENTITY_CLASS" : "SPC", "SIRE_MENTION_TYPE" : "NONE", "SIRE_MENTION_ROLE" : "FURNITURE_NONE" }, "type" : "FURNITURE_NONE", "begin" : 2063, "end" : 2071, "inCoref" : false },
-
Añada anotaciones para las relaciones que faltan en función de los nuevos tipos de entidad aplanados.
-
Cree un espacio de trabajo Knowledge Studio y, a continuación, cargue el sistema de tipos convertido.
Siga los pasos adecuados para cargar un sistema de tipos basado en el tipo de despliegue Knowledge Studio:
- IBM CloudAdición de un sistema de tipos al espacio de trabajo
- IBM Cloud Pak for DataIBM Software HubAñadir un sistema de tipos al espacio de trabajo
-
Cargue los documentos anotados en el espacio de trabajo. Conservar la estructura de archivos original de los datos exportados. Asegúrese de que el archivo comprimido tenga el mismo directorio de nivel raíz que el archivo exportado original, por ejemplo.
Siga los pasos adecuados para cargar documentos basados en el tipo de despliegue Knowledge Studio:
- IBM CloudAdición de documentos a un espacio de trabajo
- IBM Cloud Pak for DataIBM Software HubAñadir documentos a un espacio de trabajo
-
En Knowledge Studio, pulse Entrenar para volver a entrenar el modelo.
Para obtener más información, consulte el tema correspondiente a su tipo de implementación:
- IBM CloudEntrenamiento del modelo de aprendizaje automático
- IBM Cloud Pak for DataIBM Software HubEntrenamiento del modelo de aprendizaje automático
-
Ahora, está preparado para exportar el modelo desde Knowledge Studio e importarlo a Discovery para utilizar el modelo como enriquecimiento de aprendizaje automático.
Para obtener más información, consulte Utilización de modelos ML importados para buscar términos personalizados.