IBM Cloud Docs
Aggiunta di sfaccettature

Aggiunta di sfaccettature

Per aiutarti ad analizzare i risultati dell'elaborazione linguistica e dell'analisi del testo, Discovery organizza e classifica i documenti che condividono modelli o contenuti simili.

Le sfaccettature aiutano a filtrare i documenti in modo da poter eseguire più rapidamente analisi approfondite. Sia che stiate cercando di trovare il proverbiale ago nel pagliaio o di scoprire tendenze inaspettate, iniziare con le sfaccettature può accelerare il processo di ricerca.

  • Per i progetti Content Mining, le sfaccettature vengono estratte dalla raccolta in base alle informazioni sulle parti del discorso (catturate dall'arricchimento Part of Speech che viene applicato di default ai progetti di questo tipo). È inoltre possibile visualizzare le sfaccettature derivate dai metadati presenti nei documenti.

    ![Sfaccettature predefinite nei](images/cmdeffacetsnhtsa.png "di Content Mining*La pagina Migliora e personalizza che mostra le sfaccettature delle parti del discorso estratte per impostazione " caption-side="bottom"}"){: caption="

  • Per i progetti Document Retrieval, le sfaccettature vengono estratte dalla collezione in base alle entità riconosciute (che sono catturate dall'arricchimento Entities, applicato per impostazione predefinita ai progetti di questo tipo).

    Watson Discovery "Customize display" section
    Top Entities facet

Per ulteriori informazioni sugli arricchimenti Entità e Parte del discorso, vedere Applicazione di arricchimenti precostituiti. Per ulteriori informazioni sugli arricchimenti applicati ai progetti per impostazione predefinita, vedere Impostazioni predefinite del progetto.

Creazione di sfaccettature

Per ulteriori informazioni su come aggiungere sfaccettature a un progetto di Content Mining, vedere Aggiungi sfaccettature.

Per altri tipi di progetto, è possibile creare sfaccettature nei seguenti modi:

Creare una sfaccettatura da campi esistenti in una collezione

Quando si applicano gli arricchimenti a una raccolta, vengono aggiunti nuovi campi all'indice. Le informazioni riconosciute dall'arricchimento vengono memorizzate in questi nuovi campi. È possibile utilizzare i campi di arricchimento come fonte per le faccette.

Ad esempio, se si applica l'arricchimento precostituito Parole chiave, è possibile creare una sfaccettatura basata sulle parole chiave presenti nella raccolta. Durante l'elaborazione del documento, l'arricchimento delle parole chiave riconosce tutte le menzioni di parole chiave che si verificano e memorizza le informazioni su di esse in una serie di campi che iniziano con il prefisso enriched_{field_name}.keywords. Per creare una sfaccettatura di parole chiave, aggiungere una sfaccettatura che prende le sue categorie dal campo in cui sono memorizzate le menzioni delle parole chiave, il campo enriched_{field_name}.keywords.mentions.text. Per ulteriori informazioni sull'arricchimento Parole chiave, vedere Applicazione di arricchimenti precostituiti.

Allo stesso modo, è possibile utilizzare i campi generati dagli arricchimenti specifici del dominio come fonte della faccetta. Infatti, quando si crea un arricchimento Espressione regolare, è possibile definire una sfaccettatura con cui classificare le menzioni di espressioni riconosciute. Per ulteriori informazioni, vedere Aggiungi risorse specifiche del dominio.

Per aggiungere una sfaccettatura da campi esistenti, completare i seguenti passaggi:

  1. Nella pagina Migliora e personalizza, fare clic su Personalizza visualizzazione, quindi su Sfaccettature.

  2. Fate clic su Nuova sfaccettatura > Da campi esistenti in una raccolta.

  3. Scegliere il campo che si desidera utilizzare per la sfaccettatura, ad esempio enriched_text.entities.type. Aggiungere l'etichetta della sfaccettatura e scegliere un'opzione di controllo del filtro.

  4. Opzionale: è possibile regolare il numero massimo di valori delle sfaccettature da visualizzare.

    Il numero massimo è la somma del numero di valori delle sfaccettature che vengono visualizzati per ogni tipo di sfaccettatura. Per impostazione predefinita, vengono visualizzati un totale di 10 valori di sfaccettatura.

  5. Man mano che si testa la sfaccettatura, è possibile regolare le opzioni.

Creazione di un facet mediante la creazione di un dizionario

Aggiungete una sfaccettatura per raggruppare un insieme di termini che hanno un significato speciale per il vostro caso d'uso, creando un dizionario.

Ad esempio, il proprietario di un negozio di abbigliamento al dettaglio raccoglie le recensioni dei clienti e vuole essere in grado di individuare eventuali reclami ricorrenti per identificare gli articoli da dismettere. Il proprietario può creare un dizionario per aiutare a riconoscere ed etichettare le menzioni di specifici articoli di abbigliamento nel testo della recensione. Per supportare l'obiettivo di filtrare i feedback dei clienti in base al tipo di articolo di abbigliamento, il proprietario potrebbe aggiungere voci simili a quelle elencate nella tabella seguente.

Esempio di voci del dizionario
Voce del dizionario Sinonimi Nome del dizionario
camicia top, button-down, tunica, camicetta, t-shirt, manica lunga, manica corta, serbatoio clothing
pants pantaloni, jeans, leggings, felpe, pinocchietti, culottes, pantaloni, chinos clothing

Una recensione che dice This long-sleeve is so badly proportioned. Who has arms that long! viene restituita quando si filtrano i documenti in base alla sfaccettatura clothing.

Per creare una sfaccettatura mediante la creazione di un dizionario, eseguire i seguenti passaggi:

  1. Nella pagina Migliora e personalizza, fare clic su Personalizza visualizzazione, quindi su Sfaccettature.

  2. Fai clic su New facet > By creating a dictionary.

  3. Inserire un nome per la sfaccettatura e creare un dizionario dei termini che si desidera categorizzare.

    Dopo aver salvato il dizionario, il nome che hai utilizzato per l'etichetta del facet viene visualizzato nell'elenco di facet.

  4. Quando verifichi il facet, puoi aggiungere altri termini al dizionario che hai creato selezionando Teach domain concepts > Dictionaries.

    Il dizionario creato viene visualizzato nell'elenco della pagina Dizionari. Per ulteriori informazioni, vedere Dizionari.

Creare una sfaccettatura identificando un modello

Patterns è una funzione beta e supporta solo documenti in lingua inglese.

IBM Cloud IBM Cloud solo

Questa opzione è disponibile solo per le distribuzioni gestite e nei progetti Recupero documenti e Ricerca conversazionale.

La funzione Schemi utilizza l'induzione di schemi per insegnare a Discovery a riconoscere gli schemi nei dati. L'induzione di pattern genera modelli di estrazione da esempi forniti dall'utente. Dopo aver specificato alcuni esempi, Discovery suggerisce altre regole da verificare per completare lo schema.

Il riconoscimento dei modelli funziona meglio su testi con una struttura coerente in termini di caratteri, lunghezza, testo o valori numerici. Esempi di modelli che si possono insegnare a Discovery per identificare i documenti:

  • Tutti i numeri standard ISO, ad esempio ISO 45001, ISO 22000
  • Tutti gli importi in valuta, per esempio $50.5 million, 29 dollars, $29.00
  • Tutte le date, per esempio 8 September 2019, June 12, 2020

Se avete bisogno di identificare termini o testi specifici, create una sfaccettatura come parte di una voce di dizionario. Ad esempio, utilizzare una faccetta dizionario per raggruppare i seguenti tipi di informazioni:

  • Tutti i prodotti della stessa famiglia, Cloud Pak for Data, Cloud Pak for Automation, Cloud Pak for Security
  • Tutti i termini nella stessa categoria, carburetor, piston, valves

Per ulteriori informazioni, vedere Creazione di una sfaccettatura tramite la creazione di un dizionario.

Per aggiungere una sfaccettatura identificando un modello, completare i seguenti passaggi:

  1. Nella pagina Migliora e personalizza, fare clic su Personalizza visualizzazione, quindi su Sfaccettature.

  2. Fate clic su Nuova sfaccettatura > Con l'identificazione di un modello.

  3. Nella pagina Crea una sfaccettatura da un nuovo modello, scegliere come selezionare i documenti. Si può consentire a Discovery di selezionare 10 documenti casuali per l'utente o di selezionarne fino a 20 personalmente.

    Se scegliete voi stessi i documenti, seguite queste linee guida:

    • Scegliete i documenti che contengono menzioni del modello in tutti i diversi formati che volete che il modello sia in grado di riconoscere in seguito.

    • Se si vuole che il modello comprenda i modi in cui un termine viene usato che non corrispondono al modello, si deve includere un documento che usa il termine nel modo sbagliato, in modo da poter omettere intenzionalmente la sua selezione.

      Ad esempio, il modello che si vuole aggiungere potrebbe catturare le menzioni di abbigliamento. Nei documenti che menzionano un top per riferirsi a una camicia, si dovrebbe selezionare top come menzione di abbigliamento. Ma si potrebbe anche voler includere un documento che menzioni the top 3 fashion trends e non selezionare di proposito top quando il termine viene usato in questo contesto. L'omissione insegna al modello che il top non si adatta al modello quando il termine è usato per indicare il migliore.

    • Includere documenti con un massimo di 5.000 caratteri. I documenti che superano questo limite vengono troncati a 5.000 caratteri.

  4. Fare clic su Avanti.

  5. Selezionate parole o frasi di esempio che si adattino al modello che volete definire.

    Ad esempio, se si desidera definire un modello di data, iniziare a evidenziare le menzioni di data in ogni documento. Se si commette un errore, passare il mouse sulla selezione e fare clic su x per eliminarla.

    Assicuratevi di selezionare tutte le indicazioni del modello. Il modello impara da ciò che si omette tanto quanto da ciò che si seleziona.

  6. Continuare a selezionare gli esempi. Dopo aver identificato un numero sufficiente di esempi, Discovery mostra un elenco di esempi suggeriti da convalidare. Scegliete o No per ciascuno di essi.

    Fare clic sull'icona Anteprima del documento se si desidera confermare l'esempio nel contesto.

  7. Continuate a evidenziare gli esempi e a convalidare i suggerimenti finché non viene visualizzato un messaggio che indica che avete fornito un numero sufficiente di esempi.

  8. Fate clic sulla scheda Vedi esempi per esaminare gli elenchi di esempi.

  9. Se gli esempi sono corretti, fate clic su Salva modello.

Se il sistema non riesce a determinare un modello valido, il pulsante Salva modello non viene mai attivato. Il sistema non può determinare un modello valido se si scelgono esempi contraddittori per illustrare il modello. Se non è possibile salvare il lavoro, fare clic sul pulsante Reset per ricominciare. I documenti vengono riportati allo stato originale e gli esempi identificati in precedenza non vengono più selezionati.

Dopo aver salvato il modello, il nome specificato per l'etichetta della sfaccettatura viene visualizzato nell'elenco delle sfaccettature.

Quando utilizzare una sfaccettatura di pattern invece di un campo di espressione regolare

La creazione di una sfaccettatura basata su pattern è simile alla creazione di un pattern da un campo derivato dall'applicazione dell'arricchimento Espressione regolare a un insieme.

  • Se le informazioni che si desidera acquisire seguono regole di formattazione rigide, è possibile utilizzare l'arricchimento Espressione regolare per trovarle. Applicare l'arricchimento e quindi utilizzare il campo risultante come origine della sfaccettatura.
  • Se le informazioni che si vogliono catturare possono presentarsi in diversi stili di formattazione, la sfaccettatura modello è la scelta migliore. Ad esempio, le date o le valute possono essere formattate in vari modi. Nessuna regola regex può catturare tutte le varianti. Con la sfaccettatura pattern, è possibile fornire più esempi reali che mostrano i diversi modi in cui le informazioni possono essere specificate.