Definir um conjunto finito de termos com um dicionário.
Reconhecer termos e sinônimos para termos que são significativos para você, como os nomes de produtos que você vende.
Ajude Discovery encontre termos que tenham significado para o seu caso de uso adicionando um dicionário. Você pode definir vários sinônimos para um termo ou um conjunto de palavras na mesma categoria.
Você pode criar um dicionário adicionando os termos um por um ou fazendo o upload de um arquivo CSV que lista os termos.
Para adicionar termos de dicionário um a um, complete as seguintes etapas:
-
A partir da seção Conceitos de domínio Teach do painel Ferramentas de Melhoramento, escolha Dicionários.
-
Clique em Novo.
-
Nomeia seu dicionário.
Por exemplo,
Transportation. -
Escolha o idioma. Um dicionário pode conter termos em apenas uma língua.
-
Opcional: Expanda Opções Avançadase edite o nome do facet para o dicionário.
Facetas são usadas para categorizar documentos. Um usuário pode escolher um tipo de faceta para estreitar seus resultados de pesquisa. O nome do dicionário em letras minúsculas é usado como nome de faceta por padrão. Você pode querer mudar a faceta para ser maiús-revirada.
-
Digite um termo e, em seguida, selecione o botão + para adicioná-lo.
Por exemplo
vehicleeengine.Em dicionários em inglês, especifique os termos do dicionário em minúsmina. Só use maiúsculas se quiser Discovery para ignorar menções minúsculas do termo quando elas ocorrem em texto. Quando os termos são analisados para determinar se são ocorrências do enriquecimento do dicionário, usa-se a forma de superfície do termo com correspondência de uppercase. Por exemplo, uma entrada
vehicleno dicionário resulta em anotações paravehicle,VehicleouVEHICLEmenciona quando elas ocorrem em texto. Para uma entradaSatno dicionário, são adicionadas anotações paraSatouSAT, mas não parasat.A correspondência de dicionário é casa-sensível para o árabe, chinês, coreano, japonês e hebraico.
-
Para adicionar sinônimos para o termo, clique no ícone Editar e, em seguida, insira sinônimos no campo Outros termos. Separe vários sinônimos com uma vírgula. Clique em Salvar termo.
O dicionário pode conter termos e seus sinônimos ou uma categoria e termos que pertencem à categoria.
Para o termo
vehicle, é possível especificar sinônimos comocar,automobile,sedan,convertible,station wagone assim por diante. Paraengine, é possível especificargasket,carburetor,pistonevalves.Tenha cuidado para não adicionar muitos sinônimos. Teste o impacto de quaisquer sinônimos que você adicionar. Quando você testar, use dados que são diferentes dos dados que você usa para derivar os sinônimos.
-
Continue incluindo termos.
Termos semelhantes de todas as coleções no projeto atual são sugeridos como novas entradas.
Os termos sugeridos são obtidos de um campo denominado text. Se o campo de texto estiver ausente, um campo com o maior valor de cadeia e o maior número de valores distintos será escolhido. Sugestões não serão exibidas se não houver documentos ou a coleção não tiver campos com dados de texto.
-
Clique em Salvar dicionário.
-
Escolha as coleções e campos em que deseja aplicar o dicionário e, em seguida, clique em Aplicar.
Exemplo
Um dicionário de transporte é adicionado a um projeto.
A faceta resultante que é criada para o dicionário é exibida na página de pesquisa.
O documento onde o enriquecimento é aplicado contém a seguinte frase:
Some car fluids can be acidic, such as battery fluid.
O trecho JSON a seguir ilustra como uma menção de enriquecimento de dicionário de Transportation é armazenada quando o termo car, que é um sinônimo para a entrada de dicionário vehicle, é encontrado no documento. Nesta
coleção, o enriquecimento do dicionário é aplicado ao campo text, portanto, a menção é listada na matriz entities que está na matriz enriched_text.
{
"enriched_text": [
{
"entities": [
{
"model_name": "Dictionary:.Transportation",
"mentions": [
{
"confidence": 1,
"location": {
"end": 91122,
"begin": 91119
},
"text": "car"
}
],
"text": "vehicle",
"type": "Transportation"
}
]
}
]
}
Upload de termos de dicionário
Para adicionar um dicionário de um arquivo CSV, conclua as etapas a seguir:
-
Crie um arquivo CSV que contenha os termos do dicionário que você deseja adicionar.
Use a codificação UTF-8. Especifique uma entrada por linha.
-
Para definir um conjunto de termos sinônimos, use a sintaxe a seguir:
<term>,<synonym>,<synonym>,<synonym>,...Por exemplo:
vehicle,car,automobile,sedan,convertible,station wagonA entrada neste exemplo cria uma entrada de dicionário
vehicle. Quando o enriquecimento do dicionário é aplicado a um documento, quaisquer menções devehicle,car,automobile,sedan,convertibleoustation wagonsão marcadas como instâncias da entrada do dicionáriovehicle. -
Para definir um conjunto de termos na mesma categoria, use a sintaxe a seguir:
<category>,<related-term>,<related-term>,...Por exemplo:
engine,gasket,carburetor,piston,valvesA entrada neste exemplo cria uma entrada de dicionário
engine. Quando o enriquecimento do dicionário é aplicado a um documento, quaisquer menções deengine,gasket,carburetor,pistonouvalvessão marcadas como instâncias da entrada do dicionárioengine.
-
-
A partir da seção Conceitos de domínio Teach do painel Ferramentas de Melhoramento, escolha Dicionários.
-
Clique em ** Upload **.
-
Nomeia seu dicionário e escolha o idioma que foi usado no arquivo CSV.
-
Opcional: Expanda Opções avançadase especifique editar o nome do facet para o dicionário. Facetas são usadas para categorizar documentos. Um usuário pode escolher um tipo de faceta para estreitar suas buscas. O nome do dicionário em letras minúsculas é usado como nome de faceta por padrão. Você pode querer mudar a faceta para ser maiús-revirada.
-
Clique Em Upload para navegar pelo arquivo CSV que você criou anteriormente.
-
Clique em Criar.
-
Escolha as coleções e campos em que deseja aplicar o dicionário e, em seguida, clique em Aplicar.
Se você adicionar um dicionário usando a API de Enriquecimento, depois de aplicar o enriquecimento do dicionário gerado pela API em um campo, o dicionário será exibido na página Dictionaries. No entanto, não é possível editar o dicionário gerado pela API a partir da ferramenta de dicionário na interface com o usuário do produto.
Para excluir um dicionário, você deve usar o método Excluir um enriquecimento da API Discovery v2.
Os enriquecimentos de dicionário que você adiciona a um projeto podem ser aplicados em coleções em outros projetos na mesma instância de serviço. Na verdade, você pode aplicá-los em coleções em um projeto de Mineração de Conteúdo a partir do aplicativo de Mineração de Conteúdo implementado.
Limites de dicionário
O número de dicionários e entradas de termo que você pode criar por instância de serviço depende do seu tipo de plano Discovery.
| Plano | Número de dicionários por instância de serviço | Número de entradas de termo por dicionário | Número de termos para quais sugestões podem ser geradas |
|---|---|---|---|
| Cloud Pak for Data | Ilimitada | Ilimitada | 1.000 |
| Premium | 200 | 10.000 | 1.000 |
| Enterprise | 200 | 10.000 | 1.000 |
| Mais (inclui Trial) | 20 | 1.000 | 50 |