IBM Cloud Docs
Notas de versão do site Discovery para IBM Cloud

Notas de versão do site Discovery para IBM Cloud

Aprenda sobre recursos e mudanças que foram incluídos para cada liberação e atualização do software do produto

IBM Cloud

Essas informações se aplicam somente às instâncias gerenciadas do IBM Watson® Discovery que estão hospedadas no IBM Cloud ou que foram provisionadas com o IBM Cloud Pak for Data as a Service. Para obter informações sobre lançamentos e atualizações para implantações instaladas, consulte Notas de versão do IBM Watson® Discovery Cartridge para IBM Cloud Pak® for Data.

Anúncio de descontinuação do recurso de rastreamento da Web de sites dinâmicos

O recurso de rastreamento dinâmico de sites na Web, controlado pelo alternador Execute JavaScript during crawl nas configurações de rastreamento, está obsoleto e será removido até setembro de 2025.

Ação necessária para preservar qualquer índice existente

Para evitar a perda de seu índice existente, é essencial:

  • Desativar o Execute JavaScript durante o crawl switcher. Para desativar o alternador, vá para a página Gerenciar coleções, abra a coleção que usa o rastreamento dinâmico de sites na Web e clique na guia Configurações de processamento. Em Specify where you want to crawl (Especifique onde você deseja rastrear ), clique no ícone de edição de cada URL e des ative o alternador Execute JavaScript during crawl (Executar durante o rastreamento ).

  • Suspender todos os rastreamentos programados que usam o recurso de rastreamento dinâmico de sites da Web

Depois que o Execute JavaScript during crawl switcher for desativado, ele não poderá ser ativado novamente.

Consequências de não desativar o switcher

Se você não desativar o alternador, ele será automaticamente desativado até setembro de 2025, e os rastreamentos da Web agendados a seguir serão suspensos. Essa ação impede que o índice existente seja substituído por um índice reduzido, que depende de como o JavaScript é usado no site rastreado. Os rastreamentos suspensos não serão retomados até que sejam reconfigurados na interface do usuário.

Impacto nos rastreamentos programados da Web

Os rastreamentos programados da Web que não usam o recurso de rastreamento dinâmico de sites continuarão a ser executados normalmente, sem interrupções.

29 de fevereiro de 2024

Novo tipo de projeto Intelligent Document Processing (IDP)
O tipo de projeto IDP é o novo tipo de projeto padrão no Discovery. Use o tipo de projeto de IDP para entender rapidamente quais dados são extraídos de seus documentos em uma visualização de documento rica e também melhorar os dados aplicando enriquecimentos Para obter mais informações, consulte Intelligent Document Processing.

29 de janeiro de 2024.

Ativar lematização em vez de lematização para normalização ao criar uma coleção
Agora é possível selecionar lematização em vez de lematização para normalizar palavras no índice e consultas. Para obter mais informações, consulte Ativando stemming para dados não selecionados.

16 de novembro de 2023

APIs para obter detalhes da coleção, listar documentos e obter detalhes do documento agora são suportadas em planos Premium de instâncias gerenciadas do IBM-Cloud
Nos planos Premium, as APIs são suportadas para coleções criadas após 16 de novembro de 2023. Se você quiser obter informações sobre uma coleção criada anteriormente, acione um processo que execute a etapa de conversão de ingestão nos documentos. Por exemplo, é possível ativar as APIs fazendo mudanças nas páginas Identificar campos, Gerenciar campos, Configurações CSVou Configurações de processamento (como configurações OCR) ou aplicando um modelo Smart Document Understanding para a coleção mais antiga.

Para obter mais informações sobre a nova API, consulte o documentação de referência da API.

7 de novembro de 2023. "

Visualizar dados para coleções
É possível visualizar um documento em uma coleção.. Para visualizar dados na visualização de documento avançada, navegue para a página Gerenciar coleções, e clique em Visualizar dados no ladrilho da coleção Como alternativa, é possível abrir uma coleção que você deseja visualizar e clicar em Visualizar dados

4 de outubro de 2023. "

O recurso de reconhecimento de caractere ótico (OCR) para texto de idioma hebraico em imagens é um recurso beta no Discovery

Quando o OCR é ativado, a extração de texto e a extração de texto identificada pelo OCR têm limitações para o idioma hebraico Essas limitações podem incluir o seguinte:.

  • Ordem de palavra imprecisa para extração de texto simples
  • O conteúdo extraído nos formatos de texto e html apresenta o texto em ordem de palavras diferente
  • Pontuação e novas linhas são colocadas incorretamente no texto.
  • A ordem de texto dentro de uma palavra é revertida dependendo das configurações de coleção
  • Texto ausente, texto ordenado incorretamente ou ambos podem ocorrer quando uma página contém texto simples e texto de imagem.
Exportar dados rotulados para um extrator de entidade

É possível exportar os dados rotulados para um extrator de entidade para treinamento ou construção de grandes modelos de linguagem (LLMs). Para obter mais informações, consulte Exportando dados rotulados para um extrator de entidade

Localize termos que deseja rotular como exemplos de entidade em um documento.

Agora é possível procurar termos que deseja rotular como exemplos de entidade em um documento. Também é possível localizar exemplos de entidade rotulados e não rotulados e corrigir quaisquer inconsistidades de rotulagem Para obter mais informações, consulte Procurando exemplos usando palavras-chave.

Recurso de enriquecimento externo para anotar documentos com um modelo de sua escolha..

Por meio de uma interface de webhook, é possível usar modelos customizados ou modelos de base avançados e outros modelos de terceiros para enriquecer seus documentos em uma coleta. Para obter mais informações, consulte API de enriquecimento externo..

O enriquecimento Part of Speech não está mais disponível para nenhum tipo de projeto diferente do Content Mining

O enriquecimento Parte do discurso foi usado para sugestão de dicionário. No entanto, a sugestão de dicionário foi atualizada e agora pode funcionar sem o enriquecimento Parte do discurso aplicado. Para projetos de mineração de conteúdo, o enriquecimento Parte do discurso está disponível como antes.

21 de setembro de 2023

Atualizado o tokenizer para todos os idiomas

O tokenizer atualizado pode afetar a ordem de classificação de resultados para determinadas consultas Se você observar quaisquer diferenças de classificação nos resultados da consulta, poderá reindexar os documentos na coleção. A descoberta converteu palavras em tokens quando alimenta e armazena dados no índice e no tempo de execução quando analisa consultas que são enviadas por usuários. Ao reindexar a coleta, você assegura que seus documentos sejam indexados com o mesmo tokenizer usado para consultas correspondentes.

Para reindexar documentos, abra a página Gerenciar Coleção, escolha uma coleção e navegue até a guia Enriquecimentos Selecione um campo para enriquecer e, em seguida, limpe o campo.. Em seguida, clique em Aplicar mudanças e reprocessar e aguarde os documentos na coleção serem reprocessados.

15 de agosto de 2023.

Opção para aplicar ou remover um planejamento de crawl
Essa opção é útil para aplicar ou remover facilmente um planejamento de crawl e também para parar um crawl.. Para obter mais informações, consulte Opções de planejamento do Crawl

9 de agosto de 2023.

Agora é possível especificar campos dos quais extrair conteúdo ao consultar dados da IU
A capacidade de especificar campos permite melhorar os resultados da procura quando o conteúdo não é indexado nos campos padrão. O conteúdo pode não ser indexado nos campos padrão ao alimentar arquivos estruturados ou ao aplicar um modelo do Smart Document Understanding. Para obter mais informações, consulte Excerto indisponível
Enriquecimentos na visualização de documento avançado para PDFs são destacados em cores distintas
Ao selecionar diversos enriquecimentos na visualização de documento avançado para PDFs, cada tipo de enriquecimento é destacado no documento com cores distintas. Enriquecimentos sobrepostos também são destacados em uma cor distinta.

26 de julho de 2023

Agora é possível especificar uma data e hora customizada para o planejamento de crawl
Essa opção é útil se você desejar evitar a carga pesada em um sistema de destino durante o horário comercial Para obter mais informações, consulte Opções de planejamento do Crawl

10 de Junho de 2023

Todos os enriquecimentos de Entidades usam o sistema de tipos Entidades v2
Natural Language Understanding Entidades v1 não é mais suportado. Instâncias do IBM Cloud que foram criadas antes de 2 de junho de 2021 e do Discovery for IBM Cloud Pak for Data 2.x implementações usadas versão 1 do Natural Language Understanding sistema de tipos de entidades para coleções em inglês e coreano. Agora, todas as coleções usam apenas a versão 2 do sistema de tipos de entidades Natural Language Understanding.
Os classificadores são identificados com mais clareza
A página Enriquecimentos lista enriquecimentos do classificador como classificador de texto ou classificador de documento.

16 de maio de 2023

Ferramenta aprimorada para criar modelos treinados pelo usuário do Smart Document Understanding (SDU)
A ferramenta SDU que você usa para anotar documentos ao criar um modelo SDU treinado pelo usuário agora usa a estrutura React UI. Esta atualização não altera o comportamento da ferramenta, mas torna-a mais responsiva.
Agora é possível definir as normalizações JSON usando a API Collections
Os métodos Criar uma coleção e Atualizar uma coleção agora suportam a inclusão de objetos conversions e normalizations que podem ser especificados para aplicar operações de normalização aos documentos na coleção... Por exemplo, é possível definir uma operação para copiar ou mesclar um campo para outro na representação JSON dos documentos. O objeto conversions define operações de normalização que ocorrem durante a ingestão e o objeto normalizations define operações de normalização que ocorrem após os enriquecimentos serem aplicados. Para obter mais informações, consulte a Referência da API de Coleções

31 de março de 2023

Atualizar para a versão da API

A versão da API atual (v2) é agora de 2023-03-31 Uma alteração foi feita nesta versão.

Alterado como os campos nomeados document_id são manipulados...

Se você incluir um arquivo JSON que contenha um campo denominado document_id em uma coleta, o campo será ignorado O sistema designa um novo ID de documento exclusivo para o documento quando ele é incluído no índice Para designar um ID de documento a um documento, independentemente de seu tipo de arquivo, use o método Atualizar documento da API.

Previously, when you uploaded a JSON file with a field named document_id from the product user interface or by using the Add document API method, the document ID from the file was shown as the document_id value in query results. However, a different document ID was assigned to the document, and the assigned ID had to be used for certain other tasks, such as deleting the document. If your application relies on the previous behavior, specify a version number earlier than 2023-03-31, such as 2020-08-30, in your API calls.

2 de março de 2023

Agora é possível especificar os tipos de arquivos a serem incluídos em uma coleção
Quando você se conecta a uma origem de dados externa, é possível limitar os tipos de arquivos a serem incluídos na coleção da origem de dados externa. Por exemplo, é possível optar por incluir apenas arquivos PDF de uma origem de dados do Box.

21 de fevereiro de 2023

A tecnologia de reconhecimento de caractere ótico v2 é usada

A versão mais recente (OCR v2) é usada automaticamente quando você ativa o OCR para coleções em inglês, alemão, francês, espanhol, holandês, português do Brasil e hebraico em todos os planos de serviços do IBM Cloud.

O novo modelo de reconhecimento de caractere ótico foi desenvolvido pela IBM Research para ser melhor na extração de texto de documentos escaneados e outras imagens que têm as limitações a seguir:

  • Imagens de baixa qualidade devido a configurações incorretas do scanner, resolução insuficiente, iluminação ruim (como captura móvel), perda de foco, páginas desalinhadas e documentos mal impressos
  • Documentos com fontes irregulares ou uma variedade de cores, tamanhos de fontes e planos de fundo
Os limites do extrator de entidade foram alterados

O número de documentos permitidos nos dados de treinamento para o plano Plus aumentou de 100 para 200.

O número de tipos de entidade que você pode criar por plano diminuiu.

  • Para planos Premium, o limite mudou de 75 para 18.
  • Para planos Enterprise, o limite mudou de 50 para 18.
  • Para planos Plus, o limite mudou de 20 para 12.
O operador de variação de sequência agora funciona com frases

Ao incluir o operador de variação de sequência com entrada de consulta que contém uma frase, a variação é aplicada a cada palavra na frase. Por exemplo, "tom cat"~1 corresponde top hat além de tom cat. Para obter mais informações sobre os operadores do Discovery Query Language, consulte Operadores de consulta.

10 de fevereiro de 2023.

O extrator de entidade está geralmente disponível

O enriquecimento Extrair entidades traz a poderosa capacidade de construir um sistema de tipos customizado no Discovery. Use a ferramenta para rotular exemplos de entidade dentro de seus dados de mercado para construir um modelo de aprendizado de máquina que o Discovery pode usar para reconhecer termos significativos para seus negócios. Já construiu um sistema de tipos de entidade no Knowledge Studio? É possível usar o corpus de Knowledge Studio como um ponto de início para seus dados de treinamento do extrator de entidade Discovery. Para obter mais informações, consulte Extrator de entidade..

Se você criou um enriquecimento do extrator de entidade para propósitos de teste quando o recurso estava na liberação beta, agora que ele está geralmente disponível, ele contará para o seu limite de modelo customizado O enriquecimento do extrator de entidade incorre em encargos se ele for ou não aplicado a uma coleção.

7 de fevereiro de 2023.

O suporte para crawls por hora foi removido

Não é mais possível optar por efetuar crawl de uma origem de dados a cada hora Se uma coleção existente for configurada para efetuar crawl por hora, você será solicitado a alterar o crawl planejado na próxima vez em que editar as configurações do conector

Não é mais possível ativar a extração de FAQ para uma coleção

A caixa de seleção para ativar ou desativar o recurso de extração de FAQ beta foi removida. A extração de FAQ era um recurso beta que capturava pares de perguntas e respostas da origem de dados conforme era submetido a crawl. A extração de FAQ gerou um novo subdocumento para cada par e armazenou a questão no campo title e a resposta no campo text

Não é possível aplicar a extração de FAQ a novas coleções

Quaisquer coleções existentes com extração de FAQ ativada retêm documentos de FAQ em seus índices até que a coleção seja reprocessada. Nesse momento, a maior parte dos subdocumentos do par de perguntas e respostas são excluídos.. No entanto, quaisquer subdocumentos de FAQ que foram gerados de arquivos de origem HTML ou TXT permanecem. Para remover esses subdocumentos, acesse a página Gerenciar dados para excluí-los. Todos os subdocumentos que são gerados a partir de um documento pai têm o mesmo valor metadata.parent_document_id.

Se você precisar de uma maneira de extrair pares de perguntas e respostas de documentos de origem que usam um estilo consistente e formatação para perguntas e respostas, será possível usar a ferramenta Smart Document Understanding para anotar os pares. Para obter mais informações, consulte Usando o Smart Document Understanding

25 de janeiro de 2023.

Configure um conector de armazenamento de dados do Microsoft SharePoint Online que tenha permissão de Leitura

Quando você cria um conector Microsoft SharePoint Online para efetuar crawl em uma origem de dados SharePoint usando Open Authentication v2, o aplicativo corporativo que é criado pela Descoberta para fazer a conexão requer somente a permissão Read. O aplicativo corporativo que foi configurado para você anteriormente precisou da permissão Gravar.

Se desejar atualizar um conector existente para que seja possível usar a nova configuração de permissão de Leitura, deve-se primeiro excluir o aplicativo corporativo existente.

Para obter mais informações, consulte Microsoft SharePoint Online.

Anúncio de descontinuação de extração de FAQ

O recurso de extração de FAQ beta que detecta e extrai pares de perguntas e respostas de documentos está sendo removido O suporte para o recurso terminará em 1Q 2023

6 de dezembro de 2022.

Agora é possível parar um crawl de origem de dados
É possível parar um crawl que esteja em andamento ou planejado para ocorrer no futuro. Para obter mais informações, consulte Parando um crawl..

O item a seguir é um problema conhecido:

Os crawls planejados da origem de dados do Box não estão atualizando documentos
Devido a um problema na API de Eventos do Box, as mudanças que ocorrem entre crawls em documentos que são armazenados no Box não são detectadas e selecionadas pela coleção de Descoberta durante as redescobertas planejadas. Para assegurar que sua coleta esteja atualizada, pare e reinicie o crawl.

1 de dezembro de 2022

O plano Plus suporta menos extratores de entidade
O número máximo de extratores de entidade que podem ser criados com um plano Plus foi reduzido de 6 para 3

12 de novembro de 2022. "

Os usuários do Discovery podem ter problemas com documentos em coleções em que o OCR está ativado que foram incluídos ou processados entre 1 e 11 de novembro

Entre 1 de novembro e 11 de novembro de 2022, alguns projetos com reconhecimento ótico de caracteres (OCR) habilitados, incluindo projetos de Recuperação de Documentos para Contratos, tiveram problemas. Os problemas foram relacionados a uma nova versão do recurso de reconhecimento de caractere ótico (OCR v2) que foi ativado automaticamente para coleções em inglês, alemão, francês, espanhol, holandês, português do Brasil e hebraico durante esse período. A nova versão altera os limites de sentença de maneiras que podem impactar negativamente outras funções, incluindo a identificação de elemento em contratos e a visualização de rotulagem de documento na ferramenta extrator de entidade.

Se você tiver algum desses problemas com documentos que foram incluídos ou processados durante esse período, reverta a versão do OCR que é aplicada aos documentos. A partir de 12 de novembro de 2022, o OCR v1 é aplicado a todas as coleções em que o OCR está ativado.. Para voltar a usar o OCR v1, faça uma mudança que reprocessará os documentos afetados Por exemplo, é possível incluir novamente documentos que foram incluídos durante o intervalo de tempo para processá-los. Ou é possível reprocessar uma coleção inteira

Para reprocessar uma coleção, na página Gerenciar coleções, abra a coleção e, então, acesse a guia Configurações de processamento. Expanda a seção Mais configurações de processamento, configure o comutador OCR como Off e, em seguida, configure-o novamente como On. Clique em Aplicar mudanças e reprocessar para reprocessar sua coleta..

2 de novembro de 2022

Uma nova e melhorada tecnologia de reconhecimento óptico de caracteres está disponível

Uma nova versão da tecnologia de reconhecimento óptico de caracteres já está disponível. Esta versão mais recente (OCR v2) é usada automaticamente quando você ativa o OCR para coleções em inglês, alemão, francês, espanhol, holandês, português do Brasil e hebraico em todos os planos de serviços do IBM Cloud. O novo modelo de reconhecimento de caractere ótico foi desenvolvido pela IBM Research para ser melhor na extração de texto de documentos escaneados e outras imagens que têm as limitações a seguir:

  • Imagens de baixa qualidade devido a configurações incorretas do scanner, resolução insuficiente, iluminação ruim (como captura móvel), perda de foco, páginas desalinhadas e documentos mal impressos
  • Documentos com fontes irregulares ou uma variedade de cores, tamanhos de fontes e planos de fundo

1 de novembro de 2022

O extrator de entidade carrega os primeiros 40.000 caracteres de documentos de dados de treinamento
Até mesmo documentos extra longos da coleção que você usa para definir exemplos de entidade customizados são carregados na visualização de documento da ferramenta No entanto, apenas os primeiros 40.000 caracteres, que são aproximadamente 15 -20 páginas são exibidos. O restante do conteúdo do arquivo é truncado Você saberá se o seu documento está truncado porque uma notificação é exibida na visualização do documento Para obter mais informações, consulte Extrator de entidade..
É possível definir a configuração de passagens por documento para ser maior que uma
Foi corrigido um erro que impedia que você usasse as configurações da barra de procura na interface com o usuário do produto para aumentar o número máximo de passagens para retornar por documento. Para obter mais informações, consulte Como passagens são derivadas.
Documentação de agregação de consulta melhorada
A documentação que descreve os tipos de agregação que podem ser especificados no parâmetro de agregação de consulta foi atualizada. Para obter mais informações, consulte Consultar agregações.

30 de setembro de 2022.

Os planos Lite não estão mais disponíveis no data center de Londres
Os planos Lite foram descontinuados Não é possível criar novas instâncias de serviço que usem o tipo de plano Lite em qualquer local, incluindo Londres Use o novo plano Plus e a sua avaliação gratuita de 30 dias associada para explorar novos recursos e uma maneira mais simples de construir que esteja disponível com a versão mais recente do produto

22 de Setembro de 2022

O plano Plus suporta mais extratores de entidade
O número máximo de extratores de entidade que você pode criar com um plano Plus aumentou de 3 para 6..
Não é possível aplicar um modelo Smart Document Understanding a arquivos do Microsoft Excel
A qualidade da análise estrutural que pode ser produzida para arquivos do Excel não é suficiente. A partir de 22 de setembro de 2022, não é possível aplicar um modelo de SDU a arquivos do Excel Essa mudança não impacta os arquivos do Excel em coleções em que um modelo SDU foi aplicado antes de 22 de setembro de 2022

16 de setembro de 2022.

A visualização do documento no contexto agora está disponível para arquivos PDF que têm crawl efetuado
Ao clicar para visualizar uma passagem de um resultado da procura que é extraído de um documento PDF, uma página de visualização de documento é exibida mostrando a passagem retornada no contexto da página PDF original. A visualização no contexto está disponível para arquivos PDF aos quais um modelo de Smart Document Understanding é aplicado

15 de agosto de 2022

Os SDKs foram atualizados para refletir as mudanças mais recentes da API.

As mudanças da API doDiscovery v2 a seguir agora são refletidas nos SDKs:

  • Use the new document classifier API to get, add, update, or delete a document classifier.

  • A new document status API is available. You can use it to get a list of the documents in a collection and to get details about a single document.

  • You can now get, add, and remove a stop words or expansion list for a collection.

  • A smart_document_understanding field is returned with the Get collection method. This new field specifies whether an SDU model is enabled for the collection and indicates the model type.

  • A similar parameter is available from the Query method. Use it to find documents that are similar to documents of interest to you.

  • The suggested_refinements parameter of the Query method is deprecated. The suggested_refinements parameter was used to identify dynamic facets from Premium plan data.

8 de agosto de 2022.

Documentos maiores podem ser submetidos a crawl
Os tamanhos máximos de arquivo que são permitidos para documentos submetidos a crawl aumentaram para planos Premium. Também aumentou para os conectores Box, IBM Cloud Object Storage e Salesforce. Para obter mais informações, consulte Limites de tamanho do arquivo

2 de agosto de 2022

O suporte à autenticação IAM foi adicionado ao conector IBM Cloud Object Storage
Agora você pode optar por se autenticar com o serviço IBM Cloud Identity and Access Management (IAM). Para obter mais informações, consulte IBM Cloud Object Storage.

28 de julho de 2022.

atualizações da API

As mudanças a seguir foram feitas na API doDiscovery v2.

Novos campos estão disponíveis:

  • Um campo smart_document_understanding é retornado com o método Get collection. Esse novo campo especifica se um modelo de SDU está ativado para a coleção e indica o tipo de modelo
  • Um parâmetro similar está disponível no método Query. Use-o para localizar documentos semelhantes aos documentos de seu interesse.

O parâmetro suggested_refinements do método Query foi descontinuado O parâmetro suggested_refinements foi usado para identificar aspectos dinâmicos dos dados do plano Premium.

Anúncio de descontinuação do Discovery v1

Watson Discovery v1 está sendo descontinuado. Os clientes existentes que usam o Watson Discovery v1 são convidados a migrar para o Watson Discovery v2 antes da data de término de suporte de 11 de julho de 2023. Término de suporte significa que nenhuma instância do v1 funcionará em ou após 11 de julho de 2023 Para obter mais informações sobre migração, consulte Obtendo o máximo do Discovery.

11 de julho de 2022.

A visualização avançada do documento destaca ainda mais enriquecimentos

Além dos enriquecimentos integrados de Entidades e Palavras-chave que são reconhecidos pelos modelos do Watson Natural Language Processing, a visualização de documento avançada agora destaca os seguintes tipos de enriquecimentos:

  • Termos do dicionário customizado
  • Termos ou números que correspondem aos padrões de expressão regular definidos
  • Entidades customizadas e relacionamentos que são definidos pelo aprendizado de máquina do Watson Knowledge Studio e modelos baseados em regras
  • Entidades customizadas que são definidas usando a ferramenta extrator de entidade que está disponível como um recurso beta

Para obter mais informações sobre os enriquecimentos que podem ser incluídos em seus documentos, consulte Incluindo recursos específicos do domínio

30 de junho de 2022

Mudança de suporte do SDK Watson

O suporte para os SDKs a seguir é fornecido pela comunidade Watson de desenvolvedores em vez de IBM:

  • Acessar
  • Ruby
  • Swift
  • Unity

Para obter mais informações, consulte Watson SDKs..

1º de junho de 2022

A ferramenta extrator de entidade agora é mais fácil de usar
A interface com o usuário foi reprojetada para suportar melhor o fluxo de trabalho de incluir tipos de entidade e rotular exemplos deles. Como parte do novo design, o recurso de rotulagem em massa agora está ativado por padrão, a visualização de documentos é mais fácil de localizar e usar, a área de janela de sugestões é mais responsiva e é possível rastrear as pontuações de métricas em várias execuções de treinamento.. Para obter mais informações sobre o extrator de entidade, consulte Customização dos termos que o Discovery pode reconhecer.
O extrator de entidade agora está disponível em mais planos e idiomas
O recurso beta do extrator de entidade agora está disponível para os usuários dos planos Plus e Enterprise, além dos planos Premium O enriquecimento do extrator é suportado para coleções em idiomas diferentes do inglês..
Quando você remove um URL inicial de um conector de rastreamento da Web, seus documentos associados são excluídos
O conector de crawl da web foi atualizado A partir das coleções que você criar depois de abril de 2022, se você remover um URL inicial da configuração de rastreamento da Web, todos os documentos indexados derivados do conteúdo da página da Web nesse URL serão excluídos com o próximo rastreamento. Para obter mais informações, consulte Web crawl.

16 de maio de 2022

Métodos de API incluídos para trabalhar com palavras vazias e listas de expansão
Agora é possível obter, incluir e remover palavras vazias ou lista de expansão para uma coleção programaticamente. Para obter mais informações, consulte os métodos Modificações da consulta

13 de maio de 2022

Uma visualização JSON melhorada está disponível
Agora é possível usar teclas do teclado para tabular por elementos na visualização. A nova visualização JSON também numera as ocorrências de elementos em cada objeto JSON, o que facilita o rastreamento de informações e a leitura de totais em uma visão rápida.

20 de abril de 2022

A API de análise é suportada em implementações do plano Enterprise

Use a API do Analyze para processar um arquivo JSON de acordo com as definições de configuração de uma coleção e, em seguida, retorne o arquivo para uso em tempo real sem armazená-lo na coleção A API do Analyze era suportada apenas em implementações instaladas anteriormente Para obter mais informações, consulte API de análise.

Uma nova API de status do documento está disponível

Use a nova API de status do documento para obter programaticamente uma lista dos documentos em uma coleção e para obter detalhes sobre um único documento. As observações a seguir se aplicam a esta versão:

  • A API é suportada para coleções que são criadas após o dia 23 de março de 2022.

    Se quiser obter informações de status sobre uma coleção que foi criada anteriormente, acione um processo que execute a etapa de conversão de ingestão nos documentos. Por exemplo, é possível ativar a API fazendo mudanças nas páginas Identificar campos, Gerenciar campos, Configurações CSVou Configurações de processamento (como configurações de extração OCR ou FAQ) ou aplicando um modelo Smart Document Understanding à coleção mais antiga.

  • A API está disponível apenas nas instâncias do plano Plus e Enterprise.

Para obter mais informações sobre a nova API, consulte o documentação de referência da API.

Mais mensagens são mostradas para mantê-lo informado sobre o status do processamento de documentos

Foi corrigido um problema que anteriormente impedia que mensagens informativas fossem exibidas sobre o status de conversão e indexação de documentos durante o processo de ingestão.. Agora que o problema foi corrigido, você pode ver mais mensagens do que o normal ao incluir ou reprocessar documentos. Este aumento é esperado. Nada que você fez causou o aumento de mensagens.

6 de abril de 2022

A telha do projeto tem um menu mais intuitivo
O bloco do projeto foi atualizado para incluir um menu overflow que pode ser usado para executar ações, como excluir ou renomear um projeto.

30 de março de 2022

Uma nova API do classificador de documento está disponível.

Use o novo classificador de documento para obter, incluir ou excluir programaticamente um classificador de documento. Os métodos de classificação de documentos são compatíveis com as instâncias instaladas ( IBM Cloud Pak for Data ) ou com as instâncias dos planos Premium ou Enterprise gerenciados pelo IBM Cloud.

Para obter mais informações sobre a nova API, consulte o documentação de referência da API. Para obter mais informações sobre como incluir um classificador de documento usando a interface com o usuário do produto, consulte Classificando documentos.

21 de março de 2022

Visualize enriquecimentos localizados em seus documentos

Quando você clica para visualizar a passagem de um resultado da procura, uma página de visualização de documento é exibida mostrando uma representação do documento original no qual o resultado da procura foi localizado. Para a maioria dos tipos de documentos, é possível abrir uma nova visualização avançada do documento para ver informações de resumo úteis, como o número de ocorrências de quaisquer enriquecimentos que são detectadas no documento Também é possível selecionar um dos enriquecimentos para destacar cada ocorrência do elemento dentro do texto do documento

Atualmente, apenas os enriquecimentos de Entidades e Palavras-chave são listados

Formato melhorado dos resultados da pesquisa a partir de documentos PDF

Ao clicar para visualizar uma passagem de um resultado da procura que é extraído de um documento PDF, uma página de visualização de documento é exibida mostrando a passagem retornada no contexto da página PDF original.

A visualização no contexto está disponível para arquivos PDF aos quais um modelo de Smart Document Understanding é aplicado A visualização avançada não funciona em imagens, ou seja, não funciona em documentos PDF digitalizados. A visualização no contexto está disponível para PDFs em todos os idiomas; no entanto, o destaque de enriquecimento pode estar desalinhado em alguns idiomas

Envie seus comentários

Compartilhe suas opiniões e ideias conosco a qualquer momento clicando no botão Compartilhar feedback no cabeçalho da página da interface com o usuário do produto.

10 de março de 2022

Gerenciar os dados em uma coleção a partir da nova página Gerenciar dados
Agora é possível acessar a página Gerenciar dados para uma coleção na área de janela de navegação Gerenciar coleções. Vá lá para ver uma lista dos documentos em sua coleção e obter uma visualização rápida de informações sobre os documentos. Você também pode excluir documentos de uma coleção com apenas alguns cliques. Para obter mais informações, consulte Excluindo conteúdo dos resultados da consulta..

15 de fevereiro de 2022

Um mecanismo de autenticação alternativo está disponível para conectores do Microsoft Sharepoint Online
Agora é possível usar o Open Authentication para conectar-se ao Microsoft SharePoint diretamente ao configurar um novo conector IBM Cloud. A opção Conectar-se com a Microsoft que usa Open Authentication para autenticar com a origem de dados externa é um recurso beta. Para obter mais informações, consulte Microsoft SharePoint Online

7 de janeiro de 2022

Faça upgrade do Plus para o Enterprise sem ajuda
É possível executar um upgrade no local de um plano Plus para um plano Enterprise. Para obter mais informações, consulte Fazendo upgrade

6 de dezembro de 2021

O crawl de páginas da web com conteúdo dinâmico agora está geralmente disponível
O recurso Executar JavaScript durante o crawl foi introduzido como um recurso beta, mas agora está geralmente disponível. Para obter mais informações, consulte Web crawl.
Capturando as informações da ACL do SharePoint a partir de documentos submetidos a crawl
Agora é possível configurar o crawl da origem de dados para armazenar informações da ACL como metadados nos documentos que são incluídos em sua coleção do SharePoint Online Para obter mais informações, consulte Microsoft SharePoint Online
É possível incluir mais documentos nos dados de treinamento do modelo do extrator de entidade beta
Se você incluiu e rotulou 20 documentos para treinar um modelo e agora deseja continuar melhorando o desempenho do modelo, é possível incluir mais documentos. Inclua os documentos adicionais para a coleção que você está usando para treinar o modelo Depois de rotular os primeiros 20 documentos e o modelo estar atualizado com quaisquer mudanças, é possível escolher continuar rotulando documentos. Os novos documentos incluídos na coleção são carregados. É possível rotulá-los para aumentar os dados do treinamento e, em seguida, treinar novamente o seu modelo Para obter mais informações, consulte Customizando os termos que o Discovery pode reconhecer.
Fazer logout de Discovery
É possível efetuar logout da instância de serviço do Discovery a qualquer momento clicando em Logout no menu do perfil do usuário que está disponível no cabeçalho da página da interface com o usuário do produto.

18 de novembro de 2021

O plano Enterprise agora está disponível em qualquer lugar
O plano Enterprise está disponível em todos os locais do data center. Dimensione e proteja seu aplicativo Discovery com suporte e desempenho de nível empresarial e aborde mais casos de uso, incluindo análise de contratos e mineração de conteúdo para explorar insights em documentos. Para obter mais informações, consulte Planos de precificação do Discovery.

11 de novembro de 2021

Novos locais para o plano Enterprise agora disponíveis
O plano Enterprise está disponível nos locais de Frankfurt, Londres, Sydney e Tóquio, além do local de Dallas.

3 de novembro de 2021. "

Novo plano Enterprise
Dimensione e proteja seu aplicativo Discovery com suporte e desempenho de nível empresarial e aborde mais casos de uso, incluindo análise de contratos e mineração de conteúdo para explorar insights em documentos. Atualmente, o plano Enterprise está disponível apenas no local de Dallas. Para obter mais informações, consulte Planos de precificação do Discovery.
Novo enriquecimento do extrator de entidade beta
O enriquecimento Extrair entidades traz a poderosa capacidade de construir um sistema de tipos customizado no Discovery. Use a ferramenta para rotular exemplos de entidade dentro de seus dados de mercado para construir um modelo de aprendizado de máquina que o Discovery pode usar para reconhecer termos significativos para seus negócios. Atualmente, esse recurso beta está disponível para projetos no idioma inglês que são criados apenas em instâncias de serviço do plano Premium Para obter mais informações, consulte Customizando os termos que o Discovery pode reconhecer.
Nova guia Links úteis
A página inicial inclui uma guia Links úteis que possui links rápidos para documentação, um site da comunidade e outros recursos.
Melhores opções de seleção de campo
Quando você aplica um enriquecimento a um campo ou escolhe um campo para usar como a origem para um aspecto, os campos que são exibidos para você escolher agora incluem apenas campos que são opções válidas Anteriormente, a lista incluíam campos que não eram opções válidas.

14 de outubro de 2021

Nova página inicial do Discovery
Uma nova página inicial é exibida ao iniciar Discovery e fornece acesso rápido a um vídeo de visão geral do produto e tours. É possível reduzir o banner de boas-vindas da página inicial para ver mais projetos..
Nova seção de uso do plano
Mantenha-se informado sobre o uso do plano e verifique seu uso com relação aos limites para o seu tipo de plano na página Limites do plano e uso No cabeçalho da página do produto, clique no ícone do usuário Ícone do usuário A seção Uso mostra um resumo curto.. Clique em Visualizar todos para ver as informações de uso para todas as categorias de limites do plano
Alterar para configurações de ortografia na Procura
A configuração de correção ortográfica foi alterada de ser ativada automaticamente em novos projetos para ser desativada por padrão Se você desejar alertar os usuários quando eles escreverem um termo incorretamente em sua consulta, ative Sugestões de ortografia. Para obter mais informações, consulte Customizando a Barra de Procura
Disponibilidade de Visitas guiadas melhorada
O botão Tours guiados agora está disponível no cabeçalho da página do produto, o que os torna acessíveis a partir de qualquer lugar. Anteriormente, ele estava disponível apenas na página Meus Projetos

1º de outubro de 2021

Alterar para planos Lite e Avançado em todos os locais..
Os planos Lite e Avançado foram descontinuados Não é possível criar novas instâncias de serviço que usam os tipos de plano Lite ou Advanced nos locais de Dallas, Frankfurt, Londres, Sydney, Tóquio e Washington DC. Quaisquer planos Lite e Advanced existentes continuam a funcionar corretamente e continuam a ser suportados. Você pode fazer upgrade de um plano Lite para um plano Advanced. Use o novo plano Plus e a sua avaliação gratuita de 30 dias associada para explorar novos recursos e uma maneira mais simples de construir que esteja disponível com a versão mais recente do produto

24 de setembro de 2021

Nova pontuação para enriquecimentos de NLU
Pontuações de relevância e confiança são exibidas para enriquecimentos de NLU que são retornados pela procura. Por exemplo, ao abrir a visualização JSON da visualização do documento a partir de um resultado da consulta, é possível ver pontuações de confiança para menções de Entidades e pontuações de relevância para menções de Palavra-chave.

9 de setembro de 2021

Nova localização para o plano Plus
O plano Plus agora está disponível no local de Sydney. Use o novo plano Plus e a sua avaliação gratuita de 30 dias associada para explorar novos recursos e uma maneira mais simples de construir que esteja disponível com a versão mais recente do produto Para obter mais informações, consulte Obtendo o máximo do Discovery.
Alterar para planos Lite e Avançado na maioria dos locais
Os planos Lite e Avançado foram descontinuados Não é possível criar novas instâncias de serviço que usam os tipos de plano Lite ou Avançado nos locais de Dallas, Frankfurt, Londres, Sydney, Tóquio ou Washington DC. Quaisquer planos Lite e Advanced existentes continuam a funcionar corretamente e continuam a ser suportados. Você pode fazer upgrade de um plano Lite para um plano Advanced.

26 de agosto de 2021

Novos locais para o plano Plus
Agora, o plano Plus está disponível nos locais de Londres e Washington DC, além de Dallas, Frankfurt e Tóquio.
Mudar para planos Lite e Avançado em alguns locais
Não é possível criar novas instâncias de serviço que usam os tipos de plano Lite ou Advanced nos locais de Dallas, Frankfurt, Londres, Tóquio ou Washington DC. Quaisquer planos Lite e Advanced existentes continuam a funcionar corretamente e continuam a ser suportados. Você pode fazer upgrade de um plano Lite para um plano Advanced.
Novo recurso de descoberta de resposta.
A descoberta de resposta agora está disponível para implementações gerenciadas. Use a descoberta de resposta quando você desejar retornar uma resposta concisa para uma pergunta Para obter mais informações, consulte Locação de resposta

16 de agosto de 2021

Novos locais para o plano Plus
O plano Plus agora está disponível nos locais de Frankfurt e Tóquio, além de Dallas.
Mudar para planos Lite e Avançado em alguns locais
Os planos Lite e Avançado não são mais oferecidos Não é possível criar novas instâncias de serviço que usam os tipos de plano Lite ou Advanced nos locais Dallas, Frankfurt ou Tóquio. Quaisquer planos Lite e Advanced existentes continuam a funcionar corretamente e continuam a ser suportados. Você pode fazer upgrade de um plano Lite para um plano Advanced.

27 de julho de 2021

Limite de tamanho do documento melhorado
O limite de tamanho do documento é aumentado Para coleções de planos Premium, agora é possível fazer upload de arquivos com até 50 MB em vez de 32 MB. Para obter mais informações, consulte Limites de documentos

23 de julho de 2021

Conector Online do SharePoint melhorado
O conector da origem de dados Microsoft SharePoint Online agora aceita qualquer sintaxe de ID do usuário do Azure Active Directory válida; o formato do ID do usuário não precisa corresponder à sintaxe <admin_user>@.onmicrosoft.com. Para obter mais informações, consulte Microsoft SharePoint Online

16 de julho de 2021

Novo crawl da web de website dinâmico beta
O rastreador da Web agora pode rastrear sites dinâmicos que usam JavaScript para renderizar o conteúdo. Se você ativar esse recurso beta, o tempo gasto para efetuar crawl no site aumentará. Para obter mais informações, consulte Web crawl.

23 de junho de 2021

Novo plano Plus
Use o novo plano Plus e a sua avaliação gratuita de 30 dias associada para explorar novos recursos e uma maneira mais simples de construir que esteja disponível com a versão mais recente do produto Atualmente, o plano Plus está disponível no local de Dallas. Para obter mais informações, consulte Obtendo o máximo do Discovery.
Mudança para planos Lite e Avançado..
Os planos Lite e Avançado não são mais oferecidos Não é possível criar novas instâncias de serviço que usam os tipos de plano Lite ou Avançado no local de Dallas Quaisquer planos Lite e Advanced existentes continuam a funcionar corretamente e continuam a ser suportados. Você pode fazer upgrade de um plano Lite para um plano Advanced.

Lembrete de descontinuação do terminal

Mude para o terminal de API do Discovery

Como parte do trabalho feito para suportar totalmente a autenticação do Identity and Access Management (IAM), o terminal que você usa para acessar seu serviço Discovery programaticamente está mudando. Os URLs de endpoint antigos estão obsoletos e serão retirados em 26 de maio de 2021. Atualize as chamadas de API para usar as novas URLs.

O padrão do ponto de extremidade URL mudou de gateway-{location}.watsonplatform.net/discovery/api/ para api.{location}.discovery.watson.cloud.ibm.com/. O domínio, a localização e o identificador de oferta são diferentes no novo terminal. Para obter mais informações, consulte Atualização de URLs de endpoints em watsonplatform.net.

Se as credenciais da API de sua instância de serviço usarem o endpoint antigo, crie uma nova credencial e comece a usá-la hoje mesmo. Depois de atualizar seus aplicativos customizados para usar a nova credencial, você poderá excluir a antiga.

19 de março de 2021

Conector de crawl da web melhorado
É possível usar o tipo de coleção de crawl da web para se conectar ao conteúdo armazenado em um website interno da empresa. Para obter mais informações, consulte Web crawl.

4 de março de 2021

Novo recurso arrastar e soltar ao fazer upload
Agora, as coleções de upload suportam arrastar e soltar documentos antes e durante o upload de documentos Para obter mais informações, consulte Fazendo upload dos dados

17 de dezembro de 2020

Exibição de data e hora melhorada na guia Atividade
Cada coleção agora exibe a data e hora da Próxima sincronização planejada para na guia Atividade da página Gerenciar coleções.
Nova extração beta de perguntas mais frequentes
Liberada a extração de FAQ do recurso beta. A extração de FAQ extrai automaticamente pares de perguntas e respostas de documentos de FAQ (perguntas mais frequentes) e páginas da web para que seu aplicativo retorne respostas mais precisas. Para obter mais informações, consulte Extração de FAQ. Para obter uma instrução que explique os recursos beta, consulte Recursos beta.

3 de dezembro de 2020

Novo Content Intelligence
Agora você pode aplicar o enriquecimento de Contratos a um projeto de Recuperação de Documentos ao criá-lo. O enriquecimento Contratos pode ser usado para classificar termos do contrato, partes, datas de vigência e muito mais dentro de seus documentos. Para obter mais informações, consulte Recuperação de Documento para Contratos

10 de novembro de 2020

Novo conector do Box.
Sistemas do Crawl Box Para obter mais informações, consulte Box.
Novo conector do SharePoint 2016 On-Premise
Crawl SharePoint 2016 Sistemas Locais. Para obter mais informações, consulte SharePoint 2016 On-Premises.
O conector Box não é executado no Safari
Para obter mais informações, consulte Box connector.
Conversão de metadados
Se a propriedade metadata for convertida em uma matriz no índice, o documento não poderá ser excluído com o uso do método Delete labeled data API. Para obter mais informações, consulte a Referência de API.

30 de outubro de 2020

Suporte a novos idiomas para bósnio, croata, hindi e sérvio
Suporte básico ao idioma agora disponível para bósnio, croata, hindi e sérvio. Para obter mais informações, consulte Suporte ao idioma .
Enriquecimento de novos padrões beta
A versão beta do enriquecimento de padrões usa a indução de padrões para ajudá-lo a ensinar o Discovery a reconhecer padrões em seus dados. A indução de padrão gera padrões de extração dos exemplos especificados. Depois que você especificar um pequeno número de exemplos, o Discovery sugerirá regras adicionais que serão verificadas para concluir o padrão. É possível usar a indução de padrão como um enriquecimento ou para criar uma máscara. Para obter mais informações, consulte Padrões e Criando um aspecto identificando um padrão.. Para obter uma instrução que explique os recursos beta, consulte Recursos beta.
Alterar para projetos de Recuperação de Documento
Em novos projetos de Recuperação de documento, a definição de consulta suggested refinements agora é configurada como false por padrão. Anteriormente ela era configurada como true.

14 de setembro de 2020

Novo modelo pré-treinado para SDU
Um novo modelo pré-treinado está disponível no Smart Document Understanding para projetos de Recuperação de documento. Esse modelo será ideal se você precisar extrair dados de documentos que incluam um grande número de tabelas. Para obter mais informações, consulte Identificando campos.

30 de agosto de 2020

Atualizar para a versão da API
A versão da API atual (v2) agora é 2020-08-30.. A mudança a seguir foi feita com esta versão:
Alterar para objeto 'options'
O método List enriquecimentos não retorna mais o objeto options por enriquecimento. Use o método Get para retornar o objeto options para um único enriquecimento.

16 de julho de 2020

Nova liberação para instâncias Premium
Essa liberação está disponível para instâncias Premium do Discovery na IBM Cloud criadas depois de 16 de julho de 2020. Para instâncias Premium criadas antes dessa data e para todos os planos Lite e Advanced, consulte Introdução ao Discovery.
Mude para IBM Cloud Premium
O plano Premium está agora geralmente disponível.
Nova interface baseada em projeto
A interface do usuário baseada em projetos inclui configurações otimizadas para três casos de uso comuns: Recuperação de documentos, pesquisa de conversação e mineração de conteúdo. Para obter mais informações, consulte Criando projetos.
Novo aplicativo de mineração de conteúdo
Esse recurso totalmente novo do Watson Discovery permite que você encontre insights em seus dados quando talvez nem saiba a pergunta a ser feita. O poderoso conjunto de ferramentas de correlação ajudará a desbloquear valor de grandes conjuntos de dados não estruturados. Para obter detalhes, consulte Analisando seus dados com o aplicativo Content Mining.
Novas tabelas como respostas
Os trechos de texto não são úteis se forem encontrados em uma tabela, portanto, o site Discovery retorna uma tabela formatada como resposta se a sua pergunta for melhor respondida por uma tabela. Para obter mais informações, consulte Recuperação de tabela.
Novo recurso de procura dinâmica utilizando máscara
As consultas subespecificadas são comuns A Procura utilizando máscara dinâmica categoriza automaticamente seus resultados da procura em máscaras de inteligência sem treinamento, entendendo como elas são usadas nas sentenças. Consulte Máscaras em projetos de Recuperação de documento.
Novos componentes reutilizáveis
Não é mais necessário construir um aplicativo Discovery do zero. Ele agora vem pronto para utilização com componentes React de software livre reutilizáveis. Ao configurar o aplicativo Discovery, você está usando os componentes reais. A partir daí, você simplesmente implementa para obter um aplicativo Discovery customizado. Consulte Construindo e implementando componentes.
Novo recurso de vocabulário de domínio
Você pode criar uma faceta para seus usuários sem um dicionário. Use o vocabulário do domínio para criar uma faceta poderosa com nosso entendimento de como os dados são usados em apenas 5 minutos. Consulte Máscaras.
Novo treinamento de relevância
É possível treinar em um nível de projeto Discovery classifica a melhor resposta independentemente da origem / coleção de dados. Consulte Melhorando a relevância do resultado com o treinamento.
Novo corretor ortográfico integrado
O Discovery possui sugestões de ortografia integradas. Consulte Descrições de parâmetros..
Conclusão automática melhorada
Discovery inclui autocompletar (type-ahead) para pesquisas, bem como um componente reutilizável para fornecer esse recurso aos seus usuários finais.
Novo suporte para 12 idiomas
O suporte ao idioma do Discovery agora está disponível em 12 idiomas adicionais. Para obter a lista completa, consulte Suporte ao idioma.
Cloud Object Storage limitação do conector
Ao conectar a uma origem de dados IBM Cloud® Object Storage, apenas os primeiros 75 depósitos para uma determinada credencial são exibidos.
Versão da API atual
A versão da API (v2) é 2019-11-29.
Alterar para recursos nesta liberação
A Deduplicação não está disponível nesta liberação.
A Detecção de anomalias não é oferecida.
IBM Watson® Discovery News não está mais incluído.
Vários enriquecimentos de Entendimento de língua natural do Watson não estão disponíveis neste momento (Extração de entidade, Extração de relação, Extração de palavra-chave, Classificação de categoria, Identificação de conceito, Extração de função semântica, Análise de sentimentos, Análise de emoções)
As fontes de dados SharePoint 2016 On-Premises e Box não estão disponíveis no momento.