IBM Cloud Docs
Utilizzo di corpora e parole personalizzate per modelli di generazione precedente

Utilizzo di corpora e parole personalizzate per modelli di generazione precedente

Queste informazioni sono specifiche dei modelli personalizzati basati sui modelli di generazione precedente. Per informazioni sui corpora e sulle parole personalizzate per i modelli personalizzati basati su modelli di nuova generazione, vedi Utilizzo di corpora e parole personalizzate per modelli di nuova generazione.

Puoi popolare un modello di lingua personalizzato con le parole aggiungendo corpora o grammatiche al modello oppure aggiungendo parole personalizzate direttamente:

  • Corpora - Il metodo consigliato per popolare un modello di lingua personalizzato con le parole consiste nell'aggiungere uno o più corpora al modello. Quando aggiungi un corpus, il servizio analizza i file e aggiunge automaticamente le eventuali parole nuove che trova al modello personalizzato. L'aggiunta di un corpus a un modello personalizzato consente al servizio di estrarre parole specifiche per il dominio in contesto e questo aiuta a garantire dei migliori risultati della trascrizione. Per ulteriori informazioni, vedi Utilizzo dei corpora.
  • Grammatiche - Puoi aggiungere grammatiche a un modello personalizzato per limitare il riconoscimento vocale alle parole o alle frasi riconosciute da una grammatica. Quando aggiungi una grammatica a un modello, il servizio aggiunge automaticamente le nuove parole che trova al modello, proprio come fa con i corpora. Per ulteriori informazioni, vedi Utilizzo di grammatiche con i modelli di lingua personalizzati.
  • Singole parole - Puoi anche aggiungere direttamente singole parole personalizzate a un modello. Il servizio aggiunge le parole al modello proprio come fa con le parole che rileva dai corpora o dalle grammatiche. Quando aggiungi una parola direttamente, puoi specificare più pronunce e indicare in che modo deve essere visualizzata la parola. Puoi anche aggiornare le parole esistenti per modificare o aumentare le definizioni che erano state estratte da corpora o grammatiche. Per ulteriori informazioni, vedi Utilizzo delle parole personalizzate.

Indipendentemente da come le aggiungi, il servizio archivia tutte le parole da te aggiunte a un modello di lingua personalizzato nella risorsa di parole del modello.

La risorsa di parole

La risorsa di parole include tutte le parole che aggiungi dai corpora, dalle grammatiche o direttamente. Il suo scopo è quello di definire la pronuncia e l'ortografia di parole che non sono già presenti nel vocabolario di base del servizio. Le definizioni indicano al servizio come trascrivere queste parole OOV (out-of-vocabulary).

La risorsa di parole contiene le seguenti informazioni su ciascuna parola OOV. Il servizio crea le definizioni per le parole estratte da corpora e grammatiche. Specifichi le caratteristiche per le parole che aggiungi o modifichi direttamente.

  • word - L'ortografia della parola come si trova in un corpus o in una grammatica o come aggiunta da te.

    Non utilizzare caratteri che devono essere codificati in URL. Ad esempio, non utilizzare spazi, barre, barre rovesciate, due punti, e commerciale, virgolette doppie, segni più, segni uguale, punti interrogativi, ecc. nel nome. Il servizio non impedisce l'uso di questi caratteri, ma poiché devono essere codificati con l' URL, ovunque vengano utilizzati, è fortemente sconsigliato.

  • sounds_like - La pronuncia della parola. Per le parole estratte da corpora e grammatiche, il valore rappresenta in che modo il servizio ritiene che la parola sia pronunciata in base alle sue regole linguistiche. In molti casi, la pronuncia riflette l'ortografia del campo word. Puoi utilizzare il campo sounds_like per modificare la pronuncia della parola. Puoi anche utilizzare il campo per specificare più pronunce per una parola. Per ulteriori informazioni, vedi Utilizzo del campo sounds_like.

  • display_as - L'ortografia della parola che il servizio utilizza nelle trascrizioni. Il campo indica il modo in cui deve essere visualizzata la parola. Nella maggior parte dei casi, l'ortografia corrisponde al valore del campo word. Puoi utilizzare il campo display_as per specificare un'ortografia differente per la parola. Per ulteriori informazioni, vedi Utilizzo del campo display_as.

  • source - Il modo in cui la parola è stata aggiunta alla risorsa di parole. Se il servizio ha estratto la parola da un corpus o da una grammatica, il campo elenca il nome di tale risorsa. Poiché il servizio può rilevare la stessa parola in più risorse, il campo può elencare più nomi di corpus o grammatica. Il campo include la stringa user se aggiungi o modifichi la parola direttamente.

Dopo aver aggiunto o modificato una parola nella risorsa di parole di un modello, è importante verificare la correttezza della definizione della parola; per ulteriori informazioni, consultare Convalida di una risorsa di parole per i modelli di generazione precedente. Devi anche addestrare il modello per rendere effettive le modifiche durante la trascrizione; per ulteriori informazioni, vedi Addestramento del modello di lingua personalizzato.

Di quanti dati ho bisogno?

Molti fattori contribuiscono alla quantità di dati di cui hai bisogno per un modello di lingua personalizzato efficace. Non è possibile indicare il numero esatto di parole da aggiungere per qualsiasi modello o applicazione personalizzata. A seconda del caso d'uso, anche l'aggiunta di qualche parola direttamente a un modello personalizzato può migliorarne la qualità. L'aggiunta però di parole OOV da un corpus che mostra le parole nel contesto in cui vengono utilizzate nell'audio può migliorare notevolmente l'accuratezza della trascrizione.

Il servizio limita il numero di parole che puoi aggiungere a un modello di lingua personalizzato:

  • Puoi aggiungere un massimo di 90.000 parole OOV alla risorsa di parole di un modello personalizzato. Questa figura include parole OOV da tutte le origini (corpora, grammatiche e singole parole personalizzate che aggiungi direttamente).
  • Puoi aggiungere un massimo di 10 milioni di parole in totale a un modello personalizzato da tutte le origini. Questa cifra include tutte le parole, sia quelle OOV che quelle che fanno già parte del vocabolario di base del servizio, che sono incluse in corpora o grammatiche. Per i corpora, il servizio utilizza queste parole aggiuntive per imparare il contesto in cui possono presentarsi le parole OOV, motivo per cui i corpora sono un metodo più efficace per migliorare l'accuratezza del riconoscimento.

Un'ampia risorsa di parole può aumentare la latenza del riconoscimento vocale ma l'effetto esatto è difficile da quantificare o prevedere. Come con la quantità di dati necessaria per produrre un modello personalizzato efficace, l'impatto sulle prestazioni di un'ampia risorsa di parole dipende da molti fattori. Verifica il tuo modello personalizzato con diverse quantità di dati per determinare le prestazioni dei tuoi modelli e dei tuoi dati.

Utilizzo dei corpora per i modelli di generazione precedente

Utilizzi il metodo POST /v1/customizations/{customization_id}/corpora/{corpus_name} per aggiungere un corpus a un modello personalizzato. Un corpus è un file di testo semplice che contiene periodi di esempio dal tuo dominio. Il seguente esempio mostra un corpus abbreviato per il dominio dell'assistenza sanitaria. Un file di corpus è di norma molto più lungo.

Am I at risk for health problems during travel?
Some people are more likely to have health problems when traveling outside the United States.
How Is Coronary Microvascular Disease Treated?
If you're diagnosed with coronary MVD and also have anemia, you may benefit from treatment for that condition.
Anemia is thought to slow the growth of cells needed to repair damaged blood vessels.
What causes autoimmune hepatitis?
A combination of autoimmunity, environmental triggers, and a genetic predisposition can lead to autoimmune hepatitis.
What research is being done for Spinal Cord Injury?
The National Institute of Neurological Disorders and Stroke NINDS conducts spinal cord research in its laboratories at the National Institutes of Health NIH.
NINDS also supports additional research through grants to major research institutions across the country.
Some of the more promising rehabilitation techniques are helping spinal cord injury patients become more mobile.
What is Osteogenesis imperfecta OI?
. . .

Il riconoscimento vocale si basa sugli algoritmi statistici per analizzare l'audio. Le parole da un modello personalizzato sono in competizione con le parole dal vocabolario di base del servizio e con altre parole del modello. (Anche fattori quali il rumore audio e gli accenti dei parlanti influenzano la qualità della trascrizione).

L'accuratezza della trascrizione può dipendere in larga misura dal modo in cui le parole sono definite in un modello e dal modo in cui i parlanti le pronunciano. Per migliorare l'accuratezza del servizio, utilizza i corpora per fornire il maggior numero di esempi possibile di come sono utilizzate le parole OOV nel dominio. Ripetere le parole OOV nei corpora può migliorare la qualità del modello di lingua personalizzato. Il modo in cui duplichi le parole nei corpora dipende da come prevedi che le pronuncino gli utenti nell'audio che deve essere riconosciuto. Maggiore è il numero di periodi da te aggiunti che rappresentano il contesto in cui i parlanti utilizzano le parole dal dominio e migliore sarà l'accuratezza del riconoscimento del servizio.

Il servizio non applica un semplice algoritmo di messa in corrispondenza delle parole. La sua trascrizione dipende dal contesto in cui vengono utilizzate le parole. Quando analizza un corpus, il servizio include informazioni su n-grammi (bigrammi, trigrammi e così via) dai periodi del corpus nel modello personalizzato. Queste informazioni aiutano il servizio a trascrivere l'audio con maggiore accuratezza e spiega perché addestrare un modello personalizzato sui corpora è più importante che addestrarlo solo sulle parole personalizzate.

Ad esempio, i contabili rispettano un set comune di standard e procedure noti come GAAP (Generally Accepted Accounting Principles). Quando crei un modello personalizzato per un dominio finanziario, fornisci i periodi che utilizzano il termine GAAP in contesto. I periodi aiutano il servizio a distinguere tra frasi generiche quali "the gap between them is small" e le frasi incentrate sul dominio come ad esempio "GAAP provides guidelines for measuring and disclosing financial information."

In generale, è meglio che i corpora utilizzino le parole in contesti differenti poiché questo può migliorare il modo in cui il servizio impara le parole. Tuttavia, se gli utenti pronunciano le parole solo in un paio di contesti, mostrare le parole in altri contesti non migliora la qualità del modello personalizzato: gli utenti non usano mai le parole in quei contesti. Se i parlanti probabilmente utilizzeranno spesso la stessa frase, ripetere tale frase nei corpora può migliorare la qualità del modello. (In alcuni casi, anche aggiungere qualche parola personalizzata direttamente a un modello personalizzato può fare una differenza positiva).

Preparazione di un file di testo di corpus

Attieniti alle seguenti linee guida per preparare un file di testo di corpus:

  • Fornisci un file di testo semplice codificato in UTF-8 se contiene caratteri non ASCII. Il servizio presume la codifica UTF-8 se riscontra tali caratteri.

    Assicurati di conoscere la codifica dei caratteri dei tuoi file di testo di corpus. Il servizio preserva la codifica che trova nei file di testo. È necessario utilizzare la stessa codifica quando si lavora con parole personalizzate nel modello personalizzato. Per ulteriori informazioni, vedi Codifica dei caratteri per le parole personalizzate.

  • Utilizza le maiuscole in modo congruente per le parole nel corpus. La risorsa di parole è sensibile a maiuscole/minuscole. Combina lettere maiuscole e minuscole e utilizza le maiuscole solo quando previsto.

  • Includi ogni periodo del corpus su una sua riga e termina ogni riga con un ritorno a capo. L'inclusione di più periodi sulla stessa riga può ridurre l'accuratezza.

  • Aggiungi i nomi personali come unità discrete su righe separate. Non aggiungere i singoli elementi di un nome su righe separate o come singole parole personalizzate, e non includere nomi multipli sulla stessa riga di un corpus. Il seguente esempio mostra il modo corretto di migliorare l'accuratezza del riconoscimento per tre nomi:

    Gakuto Kutara
    Sebastian Leifson
    Malcolm Ingersol
    

    Includere ulteriori informazioni contestuali ove opportuno, ad esempio Doctor Sebastian Leifson o President Malcolm Ingersol. Come con tutte le parole, la duplicazione dei nomi più volte e, se possibile, in contesti differenti, può migliorare l'accuratezza del riconoscimento.

  • Attenzione agli errori di battitura. Il servizio presume che gli errori di battitura siano parole nuove. Se non li correggi prima di addestrare il modello, il servizio li aggiunge al vocabolario del modello. Ricordati l'adagio Spazzatura dentro, spazzatura fuori,

  • Un maggior numero di periodi produce una migliore accuratezza. Il servizio però limita un modello a un massimo di 10 milioni di parole in totale e a 90.000 parole OOV per tutte le origini combinate.

Il servizio non può generare una pronuncia per tutte le parole. Dopo aver aggiunto un corpus, devi convalidare la risorsa delle parole per assicurarti che la definizione di ogni parola OOV sia completa e valida. Per ulteriori informazioni, vedi Convalida di una risorsa di parole per i modelli di generazione precedenti.

Cosa succede quando aggiungo un file di corpus?

Quando aggiungi un file di corpus, il servizio ne analizza il contenuto. Estrae tutte le parole (OOV) nuove che trova e aggiunge ciascuna di esse alla risorsa di parole del modello personalizzato. Per ricavare il massimo significato dal contenuto, il servizio tokenizza e analizza i dati che legge da un file di corpus. Le seguenti sezioni descrivono in che modo il servizio analizza un file di corpus per ciascuna lingua supportata.

Analisi di olandese, inglese, francese, tedesco, italiano, portoghese e spagnolo

Le seguenti descrizioni si applicano a tutti i dialetti supportati di olandese, inglese, francese, tedesco, italiano, portoghese e spagnolo.

  • Converte i numeri nelle loro parole equivalenti.

    Esempi di conversione di numeri
    Lingua Numero intero Numero decimale
    Olandese 500 diventa vijfhonderd 0,15 diventa nul komma vijftien
    Inglese 500 diventa five hundred 0.15 diventa zero point fifteen
    Francese 500 diventa cinq cents 0,15 diventa zéro virgule quinze
    Tedesco 500 diventa fünfhundert 0,15 diventa null punkt fünfzehn
    Italiano 500 diventa cinquecento 0,15 diventa zero virgola quindici
    Portoghese 500 diventa quinhentos 0,15 diventa zero ponto quinze
    Spagnolo 500 diventa quinientos 0,15 diventa cero coma quince
  • Converte i token che includono determinati simboli in rappresentazioni di stringhe significative. Questi esempi non sono esaustivi. Il servizio apporta delle regolazioni simili per altri caratteri come necessario. (Per lo spagnolo, se il dialetto è es-LA, $100 e 100$ diventano cien pesos.)

    Esempi di conversione di simboli
    Lingua Un simbolo del dollaro e un numero Un simbolo dell'euro e un numero Un segno di percentuale e un numero
    Olandese $100 diventa honderd dollar €100 diventa honderd euro 100% diventa honderd procent
    Inglese $100 diventa one hundred dollars €100 diventa one hundred euros 100% diventa one hundred percent
    Francese $100 diventa cent dollars €100 diventa cent euros 100% diventa cent pour cent
    Tedesco $100 e 100$ diventano einhundert dollar €100 e 100€ diventano einhundert euro 100% diventa einhundert prozent
    Italiano $100 diventa cento dollari €100 diventa cento euro 100% diventa cento per cento
    Portoghese $100 e 100$ diventano cem dólares €100 e 100€ diventano cem euros 100% diventa cem por cento
    Spagnolo $100 e 100$ diventano cien dólares €100 e 100€ diventano cien euros 100% diventa cien por ciento
  • Elabora i caratteri non alfanumerici, di punteggiatura e speciali, a seconda del loro contesto. Ad esempio, il servizio rimuove un simbolo del dollaro ( $ ) o un simbolo dell'euro ( ) a meno che non sia seguito da un numero. L'elaborazione dipende dal contesto ed è congruente tra le lingue supportate.

  • Ignora le frasi racchiuse tra parentesi tonde ( ( ) ), parentesi angolari ( < > ), parentesi quadre ( [ ] ) o parentesi graffe ( { } ).

Analisi del giapponese

  • Converte tutti i caratteri in caratteri a larghezza intera.
  • Converte i numeri nelle loro parole equivalenti, ad esempio, " 500 " diventa " 五百" e " 0.15 " diventa " 〇・一五".
  • Non converte i token che includono simboli in stringhe equivalenti, ad esempio, 100% diventa 百%.
  • Non rimuove automaticamente la punteggiatura. IBM ti consiglia vivamente di rimuovere la punteggiatura se la tua applicazione è basata sulla trascrizione invece che sulla dettatura.

Analisi in coreano

  • Converte i numeri nelle loro parole equivalenti, ad esempio, " 10 " diventa " ".

  • Rimuove i seguenti segni di punteggiatura e caratteri speciali: - ( ) * : . , ' ". Tuttavia, non tutta la punteggiatura e non tutti i caratteri speciali che vengono rimossi dalle altre lingue vengono rimossi per il coreano, ad esempio:

    • Rimuove un simbolo di punto (.) solo quando ricorre alla fine di una riga di input.
    • Non rimuove un simbolo di tilde (~).
    • Non rimuove né elabora in altro modo i simboli Unicode a caratteri estesi, ad esempio " " (triplo punto o ellissi).

    In generale, IBM ti consiglia di rimuovere punteggiatura, caratteri speciali e caratteri estesi Unicode prima di elaborare un file di corpus.

  • Non rimuove o ignora le frasi racchiuse tra parentesi ( ( ) ), parentesi angolari ( < > ), parentesi quadre ( [ ] ) o parentesi graffe ( { } ).

  • Converte i token che includono specifici simboli in rappresentazioni stringa significative, ad esempio:

    • 24% diventa 이십사퍼센트.
    • $10 diventa 십달러.

    Questo elenco non è esaustivo. Il servizio apporta delle regolazioni simili per altri caratteri come necessario.

  • Per le frasi formate da caratteri latini (inglese) o da una combinazione di caratteri Hangul e latini, il servizio crea delle parole OOV per le frasi esattamente come si presentano nel file di corpus. Crea inoltre delle pronunce dal suono simile (sounds-like) per le parole basate su trascrizioni Hangul.

    • Dà alla parola OOV London un suono simile a 런던.
    • Dà alla parola OOV IBM홈페이지 un suono simile a 아이 비 엠 홈페이지.

Utilizzo di parole personalizzate per modelli di generazione precedente

Puoi utilizzare i metodi POST /v1/customizations/{customization_id}/words e PUT /v1/customizations/{customization_id}/words/{word_name} per aggiungere nuove parole alla risorsa di parole di un modello personalizzato. Puoi anche utilizzare i metodi per modificare o aumentare una parola in una risorsa di parole.

Potesti, ad esempio, dover utilizzare i metodi per correggere un errore di battitura o un altro errore che è stato fatto quando una parola è stata aggiunta da un corpus. Potresti anche dover aggiungere delle definizioni di suono simile (sounds-like) per una parola esistente. Se modifichi una parola esistente, i nuovi dati che fornisci sovrascrivono la definizione esistente della parola nella risorsa di parole. Le regole per aggiungere una parola si applicano anche alla modifica di una parola esistente.

È probabile che aggiungi la maggior parte delle parole personalizzate dai corpora. Assicurati di conoscere la codifica dei caratteri dei tuoi file di testo di corpus. Il servizio preserva la codifica che trova nei file di testo. È necessario utilizzare la stessa codifica quando si lavora con parole personalizzate nel modello personalizzato. Per ulteriori informazioni, vedi Codifica dei caratteri per le parole personalizzate.

Utilizzo del campo sounds_like

Il campo sounds_like specifica in che modo una parola viene pronunciata dai parlanti. Per impostazione predefinita, il servizio tenta di completare automaticamente il campo con l'ortografia della parola. Ma il servizio non può generare una pronuncia per tutte le parole. Dopo aver aggiunto o modificato delle parole, devi convalidare la risorsa di parole per assicurarti che la definizione di ogni parola sia completa e valida. Per ulteriori informazioni, vedi Convalida di una risorsa di parole per i modelli di generazione precedenti.

Puoi fornire fino a cinque pronunce alternative per una parola che è difficile da pronunciare o che può essere pronunciata in diversi modi. Considera l'utilizzo del campo per

  • Fornire pronunce differenti per gli acronimi. Ad esempio, l'acronimo NCAA può essere pronunciato come è scritto o colloquialmente come N. C. doppio A. Il seguente esempio aggiunge entrambe queste pronunce di suoni simili per la parola NCAA:

    IBM Cloud

    curl -X PUT -u "apikey:{apikey}" \
    --header "Content-Type: application/json" \
    --data "{\"sounds_like\": [\"N. C. A. A.\", \"N. C. double A.\"]}" \
    "{url}/v1/customizations/{customization_id}/words/NCAA"
    

    IBM Cloud Pak for Data IBM Software Hub

    curl -X PUT \
    --header "Authorization: Bearer {token}" \
    --header "Content-Type: application/json" \
    --data "{\"sounds_like\": [\"N. C. A. A.\", \"N. C. double A.\"]}" \
    "{url}/v1/customizations/{customization_id}/words/NCAA"
    
  • Gestire le parole straniere. Ad esempio, la parola francese " garçon " contiene un carattere che non si trova nella lingua inglese. È possibile specificare un suono simile a gaarson, sostituendo ç con s, per indicare al servizio come gli anglofoni pronunciano la parola.

Le seguenti sezioni forniscono linee guida specifiche per la lingua per specificare una pronuncia dal suono simile (sounds-like). Il riconoscimento vocale utilizza gli algoritmi statistici per analizzare l'audio; l'aggiunta di una parola, quindi, non garantisce che il servizio ne esegua la transcodifica con un'accuratezza completa. Quando aggiungi una parola, considera in che modo potrebbe essere pronunciata. Utilizza il campo sounds_like per fornire diverse pronunce che riflettono in che modo può essere pronunciata una parola.

Linee guida per l'inglese

Linee guida per l'inglese australiano, britannico e statunitense:

  • Utilizza i caratteri alfabetici inglesi: a-z e A-Z.
  • Utilizza parole reali o inventate che sono pronunciabili in inglese per le parole che sono difficili da pronunciare, ad esempio shuchesnie per la parola Sczcesny.
  • Sostituisci le lettere non inglesi con lettere inglesi equivalenti, ad esempio, s con ç o ny con ñ.
  • Sostituisci le lettere accentate con quelle non accentate, ad esempio, a con à o e con è.
  • È possibile includere più parole separate da spazi. Il servizio applica un massimo di 40 caratteri totali, senza includere gli spazi iniziali o finali.

Linee guida solo per l'inglese australiano e statunitense:

  • Per pronunciare una singola lettera, utilizza la lettera seguita da un punto. Se il punto è seguito da un altro carattere, assicurati di utilizzare uno spazio tra il punto e il carattere successivo. Ad esempio, utilizza N. C. A. A., non N.C.A.A.
  • Utilizza l'ortografia dei numeri, ad esempio seventy-five per 75.

Linee guida solo per l'inglese del Regno Unito

  • Non è possibile utilizzare punti o trattini nelle pronunce simili a suoni per l'inglese britannico.
  • Per pronunciare una singola lettera, utilizza la lettera seguita da uno spazio. Ad esempio, utilizza N C A A, non N. C. A. A., N.C.A.A. o NCAA.
  • Utilizza l'ortografia dei numeri senza trattini, ad esempio seventy five per 75.

Linee guida per olandese, francese, tedesco, italiano, portoghese e spagnolo

Linee guida per tutti i dialetti supportati di olandese, francese, tedesco, italiano, portoghese e spagnolo:

  • Non è possibile utilizzare i trattini nelle pronunce simili a suoni.
  • Utilizza i caratteri alfabetici che sono validi per la lingua: a-z e A-Z incluse le lettere accentate valide.
  • Per pronunciare una singola lettera, utilizza la lettera seguita da un punto. Se il punto è seguito da un altro carattere, assicurati di utilizzare uno spazio tra il punto e il carattere successivo. Ad esempio, utilizza N. C. A. A., non N.C.A.A.
  • Utilizza parole reali o inventate che sono pronunciabili nella lingua per le parole che sono difficili da pronunciare.
  • Utilizza l'ortografia dei numeri senza trattini, ad esempio per 75 utilizza
    • Olandese (Paesi Bassi): vijfenzeventig
    • Francese: soixante quinze
    • Tedesco fünfundsiebzig
    • Italiano: settantacinque
    • Portoghese (Brasiliano): setenta e cinco
    • Spagnolo: setenta y cinco
  • È possibile includere più parole separate da spazi. Il servizio applica un massimo di 40 caratteri totali, senza includere gli spazi iniziali o finali.

Linee guida per il giapponese

  • Utilizza solo caratteri Katakana a larghezza intera utilizzando il simbolo di allungamento ( , o 音, in giapponese). Non utilizzare i caratteri a metà larghezza.

  • Utilizza i suoni contratti (yoh-on, o 拗音, in giapponese) solo nei seguenti contesti sillabici:

    イェ, ウィ, ウェ, ウォ, キィ, キャ, キュ, キョ, ギャ, ギュ, ギョ, クァ, クィ, クェ, クォ

    グァ, グォ, シィ, シェ, シャ, シュ, ショ, ジィ, ジェ, ジャ, ジュ, ジョ, スィ, ズィ, チェ

    チャ, チュ, チョ, ヂェ, ヂャ, ヂュ, ヂョ, ツァ, ツィ, ツェ, ツォ, ティ, テュ, ディ, デャ

    デュ, デョ, トゥ, ドゥ, ニェ, ニャ, ニュ, ニョ, ヒャ, ヒュ, ヒョ, ビャ, ビュ, ビョ, ピィ

    ピャ, ピュ, ピョ, ファ, フィ, フェ, フォ, フュ, ミャ, ミュ, ミョ, リィ, リェ, リャ, リュ

    リョ, ヴァ, ヴィ, ヴェ, ヴォ, ヴュ

  • Utilizzare solo le seguenti sillabe dopo un suono assimilato (soku-on, o 促音, in giapponese):

    , , , , , , チェ, チャ, チュ, チョ, , , ディ, , ドゥ,

    ファ, フィ, フェ, フォ, , , , , , , , , , , ジェ, ジャ

    ジュ, ジョ, , , , , , キャ, キュ, キョ, , , , , , ピャ

    ピュ, ピョ, , , , , , シェ, シャ, シュ, ショ, , , , ,

    , ,

  • Non usare " " come primo carattere di una parola. Ad esempio, utilizzare ウーント invece di ンート, quest'ultimo non è valido.

  • Molte parole composte sono formate da prefisso+nome o nome+suffisso. Il vocabolario di base del servizio copre la maggior parte delle parole composte che si verificano frequentemente (ad esempio, 長電話 e 古新聞), ma non quelle che si verificano raramente. Se il tuo corpus contiene comunemente parole composte, aggiungile come una singola parola come primo passo della tua personalizzazione. Ad esempio, " 古鉛筆 " non è comune nei testi giapponesi in generale; se lo usi spesso, aggiungilo al tuo modello personalizzato per migliorare la precisione della trascrizione.

  • Non utilizzare un suono assimilato in coda.

Linee guida per il coreano

  • Utilizza caratteri, simboli e sillabe in coreano Hangul.
  • Puoi anche utilizzare i caratteri alfabetici latini (inglese): a-z e A-Z.
  • Non utilizzare caratteri o simboli non inclusi nei set precedenti.

Utilizzo del campo display_as

Il campo display_as specifica il modo in cui una parola viene visualizzata in una trascrizione. Il suo uso previsto è per i casi in cui desideri che il servizio visualizzi una stringa diversa dall'ortografia della parola. Ad esempio, puoi indicare che la parola hhonors debba essere visualizzata come HHonors indipendentemente dal fatto che suoni come hilton honors o h honors.

IBM Cloud

curl -X PUT -u "apikey:{apikey}" \
--header "Content-Type: application/json" \
--data "{\"sounds_like\": [\"hilton honors\", \"H. honors\"], \"display_as\": \"HHonors\"}" \
"{url}/v1/customizations/{customization_id}/words/hhonors"

IBM Cloud Pak for Data IBM Software Hub

curl -X PUT \
--header "Authorization: Bearer {token}" \
--header "Content-Type: application/json" \
--data "{\"sounds_like\": [\"hilton honors\", \"H. honors\"], \"display_as\": \"HHonors\"}" \
"{url}/v1/customizations/{customization_id}/words/hhonors"

Come altro esempio, è possibile indicare che la parola IBM deve essere visualizzata come IBM™.

IBM Cloud

curl -X PUT -u "apikey:{apikey}" \
--header "Content-Type: application/json" \
--data "{\"sounds_like\": [\"I. B. M.\"], \"display_as\":\"IBM™\"}" \
"{url}/v1/customizations/{customization_id}/words/IBM"

IBM Cloud Pak for Data IBM Software Hub

curl -X PUT \
--header "Authorization: Bearer {token}" \
--header "Content-Type: application/json" \
--data "{\"sounds_like\": [\"I. B. M.\"], \"display_as\":\"IBM™\"}" \
"{url}/v1/customizations/{customization_id}/words/IBM"

Interazione con la formattazione intelligente e l'oscuramento numerico

Se utilizzi i parametri smart_formatting o redaction con una richiesta di riconoscimento, tieni conto del fatto che il servizio applica la formattazione intelligente e l'oscuramento a una parola prima di prendere in considerazione il campo display_as per la parola. Potresti dover fare delle prove con i risultati per assicurarti che le funzioni non interferiscano con il modo in cui vengono visualizzate le tue parole personalizzate. Potresti anche dover aggiungere delle parole personalizzate per tener conto degli effetti.

Supponi ad esempio di aggiungere la parola personalizzata one con un campo display_as di one. La formattazione intelligente modifica la parola one nel numero 1, e il valore di modalità di visualizzazione (display-as) non viene applicato. Per evitare questi problema, puoi aggiungere una parola personalizzata per il numero 1 e applicare lo stesso campo display_as a tale parola.

Per ulteriori informazioni sull'utilizzo di queste funzioni, vedi Formattazione intelligente e Oscuramento numerico.

Cosa succede quando aggiungo o modifico una parola personalizzata?

Il modo in cui il servizio risponde a una richiesta di aggiunta o modifica di una parola personalizzata dipende dai campi e dai valori specificati. Dipende anche dall'esistenza della parola nel vocabolario di base del servizio.

  • Ometti entrambi i campi sounds_like e display_as:

    • Se la parola non esiste nel vocabolario di base del servizio, il servizio tenta di impostare il campo sounds_like sulla sua pronuncia della parola. Non può generare una pronuncia per tutte le parole, pertanto controlla la definizione della parola per assicurarsi che sia completa e valida. Il servizio imposta il campo display_as sul valore del campo word.
    • Se la parola esiste nel vocabolario di base del servizio, il servizio lascia i campi sounds_like e display_as vuoti. Questi campi sono vuoti solo se la parola esiste nel vocabolario di base del servizio. La presenza della parola nella risorsa di parole del modello è innocua ma non necessaria.
  • Specifica solo il campo sounds_like:

    • *Se il campo sounds_like è valido, * il servizio imposta il campo display_as sul valore del campo word.
    • Se il campo " sounds_like " non è valido:
      • Il metodo POST /v1/customizations/{customization_id}/words aggiunge un campo error alla parola nella risorsa di parole del modello.
      • Il metodo PUT /v1/customizations/{customization_id}/words/{word_name} non riesce con un codice di risposta 400 e un messaggio di errore. Il servizio non aggiunge la parola alla risorsa di parole.
  • Specifica solo il campo display_as:

    • Se la parola non esiste nel vocabolario di base del servizio, il servizio tenta di impostare il campo sounds_like sulla sua pronuncia della parola. Non può generare una pronuncia per tutte le parole, pertanto controlla la definizione della parola per assicurarsi che sia completa e valida. Il servizio lascia il campo display_as come specificato.
    • *Se la parola esiste nel vocabolario di base del servizio, * il servizio lascia sounds_like vuoto e lascia il campo display_as come specificato.
  • Specifica entrambi i campi sounds_like e display_as:

    • *Se il campo sounds_like è valido, * il servizio imposta i campi sounds_like e display_as sui valori specificati.
    • *Se il campo sounds_like non è valido, * il servizio risponde come fa nel caso in cui il campo sounds_like sia specificato mentre il campo display_as invece no.

Convalida di una risorsa di parole per i modelli di generazione precedente

Soprattutto quando si aggiunge un corpus a un modello linguistico personalizzato o si aggiungono più parole personalizzate contemporaneamente, esaminare le parole OOV nella risorsa parole del modello.

  • Cerca gli errori di battitura e di altro tipo. Soprattutto quando aggiungi dei corpora, che possono essere di ampie dimensioni, è facile commettere degli errori. Gli errori tipografici in un corpus di parole (o in parole personalizzate o in un file grammaticale) hanno la conseguenza involontaria di aggiungere nuove parole alla risorsa di parole di un modello, così come i tag HTML mal formati che vengono lasciati in un file di corpus.
  • Verifica le pronunce dal suono simile (sounds-like). Il servizio tenta di generare le pronunce dal suono simile (sound-like) dalle parole OOV automaticamente. Nella maggior parte dei casi, queste pronunce sono sufficienti. Ma il servizio non può generare una pronuncia per tutte le parole, pertanto controlla la definizione della parola per assicurarsi che sia completa e valida. Il riesame delle pronunce per l'accuratezza è anche consigliato per le parole che hanno delle ortografie insolite o che sono difficili da pronunciare e per gli acronimi e i termini tecnici.

Per convalidare e, se necessario, correggere una parola per un modello personalizzato, indipendentemente da come è stata aggiunta alla risorsa di parole, utilizza i seguenti metodi:

  • Elenca tutte le parole da un modello personalizzato utilizzando il metodo GET /v1/customizations/{customization_id}/words o interroga una singola parola con il metodo GET /v1/customizations/{customization_id}/words/{word_name}. Per ulteriori informazioni, vedere Elencare parole personalizzate da un modello linguistico personalizzato.
  • Modifica le parole in un modello personalizzato per correggere gli errori o per aggiungere valori di suono simile (sounds-like) e di modalità di visualizzazione (display-as) utilizzando il metodo POST /v1/customizations/{customization_id}/words o quello PUT /v1/customizations/{customization_id}/words/{word_name}. Per ulteriori informazioni, vedi Utilizzo di parole personalizzate per i modelli di generazione precedenti.
  • Elimina le parole estranee introdotte erroneamente (ad esempio da errori di battitura o di altro tipo in un corpus) utilizzando il metodo DELETE /v1/customizations/{customization_id}/words/{word_name}. Per ulteriori informazioni, vedi Eliminazione di una parola da un modello di lingua personalizzato.
    • Se la parola era stata estratta da un corpus, puoi invece aggiornare il file di testo di corpus per correggere l'errore e ricaricare quindi il file utilizzando il parametro allow_overwrite del metodo POST /v1/customizations/{customization_id}/corpora/{corpus_name}. Per ulteriori informazioni, vedi Aggiungi un corpus al modello di lingua personalizzato.
    • Se la parola era stata estratta da una grammatica, puoi aggiornare il file di grammatica per correggere l'errore e ricaricare quindi il file utilizzando il parametro allow_overwrite del metodo POST /v1/customizations/{customization_id}/grammars/{grammar_name}. Per ulteriori informazioni, vedi Aggiungi una grammatica al modello di lingua personalizzato.