IBM Cloud Docs
Treinando o modelo de aprendizado de máquina

Essa documentação destina-se ao IBM Watson® Knowledge Studio no IBM Cloud®. Para ver a documentação para a versão anterior do Knowledge Studio no IBM Marketplace, clique neste link.

Treinando o modelo de aprendizado de máquina

No IBM Watson® Knowledge Studio, a criação do modelo de aprendizado de máquina envolve treinar o modelo de aprendizado de máquina e avaliar o quanto o modelo foi bem executado ao anotar dados de teste e dados ocultos.

Criando um modelo de aprendizado de máquina

Ao criar um modelo de aprendizado de máquina, você seleciona os conjuntos de documentos que deseja usar para treinar o modelo e especifica a porcentagem de documentos que devem ser usados como dados de treinamento, dados de teste e dados ocultos.

Sobre essa tarefa

Ao explorar as métricas de desempenho, é possível identificar maneiras de melhorar a precisão do modelo.

Restrição: somente três modelos de aprendizado de máquina podem ser treinados de cada vez por instância do Knowledge Studio. Se a sua instância contiver múltiplas áreas de trabalho e o número de modelos de aprendizado de máquina que estão sendo treinados em outras áreas de trabalho já totalizar 3, então sua solicitação para treinar o modelo de aprendizado de máquina em sua área de trabalho será enfileirada até que os outros processos de treinamento estejam prontos.

Procedimento

Para criar um modelo de aprendizado de máquina:

  1. Efetue login como um administrador do Knowledge Studio e selecione a sua área de trabalho.

  2. Selecione ** Modelo de Aprendizado de Máquina ** > ** Desempenho **.

  3. Verifique se todos os conjuntos de documentos foram aprovados e se todos os conflitos de anotação foram resolvidos por meio de adjudicação. Somente documentos que se tornaram verdade absoluta por meio de adjudicação ou aprovação podem ser usados para treinar o modelo.

  4. Clique em Treinar e avaliar.

  5. Opcional: para especificar como você deseja alocar documentos de seus conjuntos de documentos para serem usados pelo treinamento de nível do sistema, teste ou conjuntos cegos, clique em Editar configurações.

    Veja Gerenciamento de conjunto de documentos para ajudar a determinar quais razões aplicar.

  6. Clique em Treinar para treinar o modelo ou em Treinar & avaliar para treinar o modelo, avaliar as anotações incluídas pelo modelo de aprendizado de máquina e analisar as estatísticas de desempenho.

    Importante: O treinamento de um modelo de aprendizado de máquina pode levar vários minutos ou várias horas, dependendo do número de anotações humanas que existem e o número total de palavras em todos os documentos.

  7. Selecione os conjuntos de documentos que você deseja usar para treinar o modelo.

    Nota: os conjuntos de documentos devem conter pelo menos 10 documentos anotados.

  8. Depois que o modelo é criado, selecione uma das ações a seguir:

Opção Descrição
Log Visualize o arquivo de log para ver se algum problema ocorreu.
Detalhes Visualize as estatísticas de desempenho de anotação, mude os conjuntos de documentos que você deseja usar
          para treinar e testar o modelo e crie versões de captura instantânea dos artefatos de
          modelo. |

| Exportar | Se você tiver um plano Padrão ou um plano Premium, será possível exportar um arquivo ZIP para seu sistema local que contém os componentes que são necessários para que o modelo seja executado em um ambiente de tempo de execução de aprendizado de máquina, como Watson Explorer. |

Avaliando anotações incluídas pelo modelo

É possível comparar a visualização de verdade absoluta para anotações incluídas por anotadores humanos com as anotações incluídas pelo modelo.

Procedimento

Para avaliar as anotações incluídas pelo modelo:

  1. Selecione Modelo de aprendizado de máquina > Desempenho > Treinar e avaliar. A página Conjuntos de treinamento/teste/cego é exibida.
  2. Clique em Visualizar verdade absoluta para o conjunto de treinamento ou conjunto de testes para ver as anotações que foram incluídas por meio de pré-anotação e por anotadores humanos. O editor de verdade absoluta é aberto. Clique para abrir documentos individuais e ver como as menções, relações e menções correferenciadas foram anotadas.
  3. Na página Desempenho, clique em Visualizar resultados de decodificação para ver as anotações que o modelo de aprendizado de máquina incluiu em documentos no conjunto de testes. Esse botão estará disponível somente depois que você avaliar o modelo. Ao visualizar os resultados, é possível ver o quão bem o modelo de aprendizado de máquina rotulou as menções, relações e menções correferenciadas nos dados de teste.
  4. Se você deseja mudar como os documentos são divididos entre conjuntos de treinamento, de teste e de dados ocultos, clique em Desempenho > Treinar e avaliar > Editar configurações. Por exemplo, se os resultados iniciais parecem aceitáveis, você pode desejar aumentar o número de documentos no conjunto de testes para testar melhor os resultados do modelo de aprendizado de máquina. É possível mudar a razão sobre como os documentos são divididos automaticamente para propósitos diferentes ou é possível selecionar conjuntos de documentos específicos para usar como dados de treinamento, dados de teste e dados ocultos.
  5. Se você tiver feito alguma mudança, clique em Treinar & avaliar para retreinar o modelo e reavaliar as anotações.

Excluindo um modelo de aprendizado de máquina

Não é possível excluir um modelo de aprendizado de máquina.

É possível excluir a área de trabalho usada para desenvolver o modelo, mas não é possível excluir o modelo propriamente dito. Excluir um modelo não é a melhor abordagem. Em vez disso, atualize ou substitua os artefatos que são usados para treinar o modelo. Mesmo se o modelo não está produzindo os resultados esperados, é possível continuar a refiná-lo. Cada vez que você cria uma nova versão, o modelo é construído novamente. É possível editar artefatos como dicionários e o sistema de tipos e escolher usar diferentes conjuntos de anotações ao treinar a próxima versão.