Utilizzo di corpora e parole personalizzate per modelli di generazione precedente
Queste informazioni sono specifiche dei modelli personalizzati basati sui modelli di generazione precedente. Per informazioni sui corpora e sulle parole personalizzate per i modelli personalizzati basati su modelli di nuova generazione, vedi Utilizzo di corpora e parole personalizzate per modelli di nuova generazione.
Puoi popolare un modello di lingua personalizzato con le parole aggiungendo corpora o grammatiche al modello oppure aggiungendo parole personalizzate direttamente:
- Corpora - Il metodo consigliato per popolare un modello di lingua personalizzato con le parole consiste nell'aggiungere uno o più corpora al modello. Quando aggiungi un corpus, il servizio analizza i file e aggiunge automaticamente le eventuali parole nuove che trova al modello personalizzato. L'aggiunta di un corpus a un modello personalizzato consente al servizio di estrarre parole specifiche per il dominio in contesto e questo aiuta a garantire dei migliori risultati della trascrizione. Per ulteriori informazioni, vedi Utilizzo dei corpora.
- Grammatiche - Puoi aggiungere grammatiche a un modello personalizzato per limitare il riconoscimento vocale alle parole o alle frasi riconosciute da una grammatica. Quando aggiungi una grammatica a un modello, il servizio aggiunge automaticamente le nuove parole che trova al modello, proprio come fa con i corpora. Per ulteriori informazioni, vedi Utilizzo di grammatiche con i modelli di lingua personalizzati.
- Singole parole - Puoi anche aggiungere direttamente singole parole personalizzate a un modello. Il servizio aggiunge le parole al modello proprio come fa con le parole che rileva dai corpora o dalle grammatiche. Quando aggiungi una parola direttamente, puoi specificare più pronunce e indicare in che modo deve essere visualizzata la parola. Puoi anche aggiornare le parole esistenti per modificare o aumentare le definizioni che erano state estratte da corpora o grammatiche. Per ulteriori informazioni, vedi Utilizzo delle parole personalizzate.
Indipendentemente da come le aggiungi, il servizio archivia tutte le parole da te aggiunte a un modello di lingua personalizzato nella risorsa di parole del modello.
La risorsa di parole
La risorsa di parole include tutte le parole che aggiungi dai corpora, dalle grammatiche o direttamente. Il suo scopo è quello di definire la pronuncia e l'ortografia di parole che non sono già presenti nel vocabolario di base del servizio. Le definizioni indicano al servizio come trascrivere queste parole OOV (out-of-vocabulary).
La risorsa di parole contiene le seguenti informazioni su ciascuna parola OOV. Il servizio crea le definizioni per le parole estratte da corpora e grammatiche. Specifichi le caratteristiche per le parole che aggiungi o modifichi direttamente.
-
word
- L'ortografia della parola come si trova in un corpus o in una grammatica o come aggiunta da te.Non utilizzare caratteri che devono essere codificati in URL. Ad esempio, non utilizzare spazi, barre, barre rovesciate, due punti, e commerciale, virgolette doppie, segni più, segni uguale, punti interrogativi, ecc. nel nome. Il servizio non impedisce l'uso di questi caratteri, ma poiché devono essere codificati con l' URL, ovunque vengano utilizzati, è fortemente sconsigliato.
-
sounds_like
- La pronuncia della parola. Per le parole estratte da corpora e grammatiche, il valore rappresenta in che modo il servizio ritiene che la parola sia pronunciata in base alle sue regole linguistiche. In molti casi, la pronuncia riflette l'ortografia del campoword
. Puoi utilizzare il camposounds_like
per modificare la pronuncia della parola. Puoi anche utilizzare il campo per specificare più pronunce per una parola. Per ulteriori informazioni, vedi Utilizzo del campo sounds_like. -
display_as
- L'ortografia della parola che il servizio utilizza nelle trascrizioni. Il campo indica il modo in cui deve essere visualizzata la parola. Nella maggior parte dei casi, l'ortografia corrisponde al valore del campoword
. Puoi utilizzare il campodisplay_as
per specificare un'ortografia differente per la parola. Per ulteriori informazioni, vedi Utilizzo del campo display_as. -
source
- Il modo in cui la parola è stata aggiunta alla risorsa di parole. Se il servizio ha estratto la parola da un corpus o da una grammatica, il campo elenca il nome di tale risorsa. Poiché il servizio può rilevare la stessa parola in più risorse, il campo può elencare più nomi di corpus o grammatica. Il campo include la stringauser
se aggiungi o modifichi la parola direttamente.
Dopo aver aggiunto o modificato una parola nella risorsa di parole di un modello, è importante verificare la correttezza della definizione della parola; per ulteriori informazioni, consultare Convalida di una risorsa di parole per i modelli di generazione precedente. Devi anche addestrare il modello per rendere effettive le modifiche durante la trascrizione; per ulteriori informazioni, vedi Addestramento del modello di lingua personalizzato.
Di quanti dati ho bisogno?
Molti fattori contribuiscono alla quantità di dati di cui hai bisogno per un modello di lingua personalizzato efficace. Non è possibile indicare il numero esatto di parole da aggiungere per qualsiasi modello o applicazione personalizzata. A seconda del caso d'uso, anche l'aggiunta di qualche parola direttamente a un modello personalizzato può migliorarne la qualità. L'aggiunta però di parole OOV da un corpus che mostra le parole nel contesto in cui vengono utilizzate nell'audio può migliorare notevolmente l'accuratezza della trascrizione.
Il servizio limita il numero di parole che puoi aggiungere a un modello di lingua personalizzato:
- Puoi aggiungere un massimo di 90.000 parole OOV alla risorsa di parole di un modello personalizzato. Questa figura include parole OOV da tutte le origini (corpora, grammatiche e singole parole personalizzate che aggiungi direttamente).
- Puoi aggiungere un massimo di 10 milioni di parole in totale a un modello personalizzato da tutte le origini. Questa cifra include tutte le parole, sia quelle OOV che quelle che fanno già parte del vocabolario di base del servizio, che sono incluse in corpora o grammatiche. Per i corpora, il servizio utilizza queste parole aggiuntive per imparare il contesto in cui possono presentarsi le parole OOV, motivo per cui i corpora sono un metodo più efficace per migliorare l'accuratezza del riconoscimento.
Un'ampia risorsa di parole può aumentare la latenza del riconoscimento vocale ma l'effetto esatto è difficile da quantificare o prevedere. Come con la quantità di dati necessaria per produrre un modello personalizzato efficace, l'impatto sulle prestazioni di un'ampia risorsa di parole dipende da molti fattori. Verifica il tuo modello personalizzato con diverse quantità di dati per determinare le prestazioni dei tuoi modelli e dei tuoi dati.
Utilizzo dei corpora per i modelli di generazione precedente
Utilizzi il metodo POST /v1/customizations/{customization_id}/corpora/{corpus_name}
per aggiungere un corpus a un modello personalizzato. Un corpus è un file di testo semplice che contiene periodi di esempio dal tuo dominio. Il
seguente esempio mostra un corpus abbreviato per il dominio dell'assistenza sanitaria. Un file di corpus è di norma molto più lungo.
Am I at risk for health problems during travel?
Some people are more likely to have health problems when traveling outside the United States.
How Is Coronary Microvascular Disease Treated?
If you're diagnosed with coronary MVD and also have anemia, you may benefit from treatment for that condition.
Anemia is thought to slow the growth of cells needed to repair damaged blood vessels.
What causes autoimmune hepatitis?
A combination of autoimmunity, environmental triggers, and a genetic predisposition can lead to autoimmune hepatitis.
What research is being done for Spinal Cord Injury?
The National Institute of Neurological Disorders and Stroke NINDS conducts spinal cord research in its laboratories at the National Institutes of Health NIH.
NINDS also supports additional research through grants to major research institutions across the country.
Some of the more promising rehabilitation techniques are helping spinal cord injury patients become more mobile.
What is Osteogenesis imperfecta OI?
. . .
Il riconoscimento vocale si basa sugli algoritmi statistici per analizzare l'audio. Le parole da un modello personalizzato sono in competizione con le parole dal vocabolario di base del servizio e con altre parole del modello. (Anche fattori quali il rumore audio e gli accenti dei parlanti influenzano la qualità della trascrizione).
L'accuratezza della trascrizione può dipendere in larga misura dal modo in cui le parole sono definite in un modello e dal modo in cui i parlanti le pronunciano. Per migliorare l'accuratezza del servizio, utilizza i corpora per fornire il maggior numero di esempi possibile di come sono utilizzate le parole OOV nel dominio. Ripetere le parole OOV nei corpora può migliorare la qualità del modello di lingua personalizzato. Il modo in cui duplichi le parole nei corpora dipende da come prevedi che le pronuncino gli utenti nell'audio che deve essere riconosciuto. Maggiore è il numero di periodi da te aggiunti che rappresentano il contesto in cui i parlanti utilizzano le parole dal dominio e migliore sarà l'accuratezza del riconoscimento del servizio.
Il servizio non applica un semplice algoritmo di messa in corrispondenza delle parole. La sua trascrizione dipende dal contesto in cui vengono utilizzate le parole. Quando analizza un corpus, il servizio include informazioni su n-grammi (bigrammi, trigrammi e così via) dai periodi del corpus nel modello personalizzato. Queste informazioni aiutano il servizio a trascrivere l'audio con maggiore accuratezza e spiega perché addestrare un modello personalizzato sui corpora è più importante che addestrarlo solo sulle parole personalizzate.
Ad esempio, i contabili rispettano un set comune di standard e procedure noti come GAAP (Generally Accepted Accounting Principles). Quando crei un modello personalizzato per un dominio finanziario, fornisci i periodi che utilizzano il termine GAAP in contesto. I periodi aiutano il servizio a distinguere tra frasi generiche quali "the gap between them is small" e le frasi incentrate sul dominio come ad esempio "GAAP provides guidelines for measuring and disclosing financial information."
In generale, è meglio che i corpora utilizzino le parole in contesti differenti poiché questo può migliorare il modo in cui il servizio impara le parole. Tuttavia, se gli utenti pronunciano le parole solo in un paio di contesti, mostrare le parole in altri contesti non migliora la qualità del modello personalizzato: gli utenti non usano mai le parole in quei contesti. Se i parlanti probabilmente utilizzeranno spesso la stessa frase, ripetere tale frase nei corpora può migliorare la qualità del modello. (In alcuni casi, anche aggiungere qualche parola personalizzata direttamente a un modello personalizzato può fare una differenza positiva).
Preparazione di un file di testo di corpus
Attieniti alle seguenti linee guida per preparare un file di testo di corpus:
-
Fornisci un file di testo semplice codificato in UTF-8 se contiene caratteri non ASCII. Il servizio presume la codifica UTF-8 se riscontra tali caratteri.
Assicurati di conoscere la codifica dei caratteri dei tuoi file di testo di corpus. Il servizio preserva la codifica che trova nei file di testo. È necessario utilizzare la stessa codifica quando si lavora con parole personalizzate nel modello personalizzato. Per ulteriori informazioni, vedi Codifica dei caratteri per le parole personalizzate.
-
Utilizza le maiuscole in modo congruente per le parole nel corpus. La risorsa di parole è sensibile a maiuscole/minuscole. Combina lettere maiuscole e minuscole e utilizza le maiuscole solo quando previsto.
-
Includi ogni periodo del corpus su una sua riga e termina ogni riga con un ritorno a capo. L'inclusione di più periodi sulla stessa riga può ridurre l'accuratezza.
-
Aggiungi i nomi personali come unità discrete su righe separate. Non aggiungere i singoli elementi di un nome su righe separate o come singole parole personalizzate, e non includere nomi multipli sulla stessa riga di un corpus. Il seguente esempio mostra il modo corretto di migliorare l'accuratezza del riconoscimento per tre nomi:
Gakuto Kutara Sebastian Leifson Malcolm Ingersol
Includere ulteriori informazioni contestuali ove opportuno, ad esempio
Doctor Sebastian Leifson
oPresident Malcolm Ingersol
. Come con tutte le parole, la duplicazione dei nomi più volte e, se possibile, in contesti differenti, può migliorare l'accuratezza del riconoscimento. -
Attenzione agli errori di battitura. Il servizio presume che gli errori di battitura siano parole nuove. Se non li correggi prima di addestrare il modello, il servizio li aggiunge al vocabolario del modello. Ricordati l'adagio Spazzatura dentro, spazzatura fuori,
-
Un maggior numero di periodi produce una migliore accuratezza. Il servizio però limita un modello a un massimo di 10 milioni di parole in totale e a 90.000 parole OOV per tutte le origini combinate.
Il servizio non può generare una pronuncia per tutte le parole. Dopo aver aggiunto un corpus, devi convalidare la risorsa delle parole per assicurarti che la definizione di ogni parola OOV sia completa e valida. Per ulteriori informazioni, vedi Convalida di una risorsa di parole per i modelli di generazione precedenti.
Cosa succede quando aggiungo un file di corpus?
Quando aggiungi un file di corpus, il servizio ne analizza il contenuto. Estrae tutte le parole (OOV) nuove che trova e aggiunge ciascuna di esse alla risorsa di parole del modello personalizzato. Per ricavare il massimo significato dal contenuto, il servizio tokenizza e analizza i dati che legge da un file di corpus. Le seguenti sezioni descrivono in che modo il servizio analizza un file di corpus per ciascuna lingua supportata.
Analisi di olandese, inglese, francese, tedesco, italiano, portoghese e spagnolo
Le seguenti descrizioni si applicano a tutti i dialetti supportati di olandese, inglese, francese, tedesco, italiano, portoghese e spagnolo.
-
Converte i numeri nelle loro parole equivalenti.
Esempi di conversione di numeri Lingua Numero intero Numero decimale Olandese 500
diventavijfhonderd
0,15
diventanul komma vijftien
Inglese 500
diventafive hundred
0.15
diventazero point fifteen
Francese 500
diventacinq cents
0,15
diventazéro virgule quinze
Tedesco 500
diventafünfhundert
0,15
diventanull punkt fünfzehn
Italiano 500
diventacinquecento
0,15
diventazero virgola quindici
Portoghese 500
diventaquinhentos
0,15
diventazero ponto quinze
Spagnolo 500
diventaquinientos
0,15
diventacero coma quince
-
Converte i token che includono determinati simboli in rappresentazioni di stringhe significative. Questi esempi non sono esaustivi. Il servizio apporta delle regolazioni simili per altri caratteri come necessario. (Per lo spagnolo, se il dialetto è
es-LA
,$100
e100$
diventanocien pesos
.)Esempi di conversione di simboli Lingua Un simbolo del dollaro e un numero Un simbolo dell'euro e un numero Un segno di percentuale e un numero Olandese $100
diventahonderd dollar
€100
diventahonderd euro
100%
diventahonderd procent
Inglese $100
diventaone hundred dollars
€100
diventaone hundred euros
100%
diventaone hundred percent
Francese $100
diventacent dollars
€100
diventacent euros
100%
diventacent pour cent
Tedesco $100
e100$
diventanoeinhundert dollar
€100
e100€
diventanoeinhundert euro
100%
diventaeinhundert prozent
Italiano $100
diventacento dollari
€100
diventacento euro
100%
diventacento per cento
Portoghese $100
e100$
diventanocem dólares
€100
e100€
diventanocem euros
100%
diventacem por cento
Spagnolo $100
e100$
diventanocien dólares
€100
e100€
diventanocien euros
100%
diventacien por ciento
-
Elabora i caratteri non alfanumerici, di punteggiatura e speciali, a seconda del loro contesto. Ad esempio, il servizio rimuove un simbolo del dollaro (
$
) o un simbolo dell'euro (€
) a meno che non sia seguito da un numero. L'elaborazione dipende dal contesto ed è congruente tra le lingue supportate. -
Ignora le frasi racchiuse tra parentesi tonde (
( )
), parentesi angolari (< >
), parentesi quadre ([ ]
) o parentesi graffe ({ }
).
Analisi del giapponese
- Converte tutti i caratteri in caratteri a larghezza intera.
- Converte i numeri nelle loro parole equivalenti, ad esempio, "
500
" diventa "五百
" e "0.15
" diventa "〇・一五
". - Non converte i token che includono simboli in stringhe equivalenti, ad esempio,
100%
diventa百%
. - Non rimuove automaticamente la punteggiatura. IBM ti consiglia vivamente di rimuovere la punteggiatura se la tua applicazione è basata sulla trascrizione invece che sulla dettatura.
Analisi in coreano
-
Converte i numeri nelle loro parole equivalenti, ad esempio, "
10
" diventa "십
". -
Rimuove i seguenti segni di punteggiatura e caratteri speciali:
- ( ) * : . , ' "
. Tuttavia, non tutta la punteggiatura e non tutti i caratteri speciali che vengono rimossi dalle altre lingue vengono rimossi per il coreano, ad esempio:- Rimuove un simbolo di punto (
.
) solo quando ricorre alla fine di una riga di input. - Non rimuove un simbolo di tilde (
~
). - Non rimuove né elabora in altro modo i simboli Unicode a caratteri estesi, ad esempio "
…
" (triplo punto o ellissi).
In generale, IBM ti consiglia di rimuovere punteggiatura, caratteri speciali e caratteri estesi Unicode prima di elaborare un file di corpus.
- Rimuove un simbolo di punto (
-
Non rimuove o ignora le frasi racchiuse tra parentesi (
( )
), parentesi angolari (< >
), parentesi quadre ([ ]
) o parentesi graffe ({ }
). -
Converte i token che includono specifici simboli in rappresentazioni stringa significative, ad esempio:
24%
diventa이십사퍼센트
.$10
diventa십달러
.
Questo elenco non è esaustivo. Il servizio apporta delle regolazioni simili per altri caratteri come necessario.
-
Per le frasi formate da caratteri latini (inglese) o da una combinazione di caratteri Hangul e latini, il servizio crea delle parole OOV per le frasi esattamente come si presentano nel file di corpus. Crea inoltre delle pronunce dal suono simile (sounds-like) per le parole basate su trascrizioni Hangul.
- Dà alla parola OOV
London
un suono simile a런던
. - Dà alla parola OOV
IBM홈페이지
un suono simile a아이 비 엠 홈페이지
.
- Dà alla parola OOV
Utilizzo di parole personalizzate per modelli di generazione precedente
Puoi utilizzare i metodi POST /v1/customizations/{customization_id}/words
e PUT /v1/customizations/{customization_id}/words/{word_name}
per aggiungere nuove parole alla risorsa di parole di un modello personalizzato.
Puoi anche utilizzare i metodi per modificare o aumentare una parola in una risorsa di parole.
Potesti, ad esempio, dover utilizzare i metodi per correggere un errore di battitura o un altro errore che è stato fatto quando una parola è stata aggiunta da un corpus. Potresti anche dover aggiungere delle definizioni di suono simile (sounds-like) per una parola esistente. Se modifichi una parola esistente, i nuovi dati che fornisci sovrascrivono la definizione esistente della parola nella risorsa di parole. Le regole per aggiungere una parola si applicano anche alla modifica di una parola esistente.
È probabile che aggiungi la maggior parte delle parole personalizzate dai corpora. Assicurati di conoscere la codifica dei caratteri dei tuoi file di testo di corpus. Il servizio preserva la codifica che trova nei file di testo. È necessario utilizzare la stessa codifica quando si lavora con parole personalizzate nel modello personalizzato. Per ulteriori informazioni, vedi Codifica dei caratteri per le parole personalizzate.
Utilizzo del campo sounds_like
Il campo sounds_like
specifica in che modo una parola viene pronunciata dai parlanti. Per impostazione predefinita, il servizio tenta di completare automaticamente il campo con l'ortografia della parola. Ma il servizio non può
generare una pronuncia per tutte le parole. Dopo aver aggiunto o modificato delle parole, devi convalidare la risorsa di parole per assicurarti che la definizione di ogni parola sia completa e valida. Per ulteriori informazioni, vedi
Convalida di una risorsa di parole per i modelli di generazione precedenti.
Puoi fornire fino a cinque pronunce alternative per una parola che è difficile da pronunciare o che può essere pronunciata in diversi modi. Considera l'utilizzo del campo per
-
Fornire pronunce differenti per gli acronimi. Ad esempio, l'acronimo
NCAA
può essere pronunciato come è scritto o colloquialmente come N. C. doppio A. Il seguente esempio aggiunge entrambe queste pronunce di suoni simili per la parolaNCAA
:IBM Cloud
curl -X PUT -u "apikey:{apikey}" \ --header "Content-Type: application/json" \ --data "{\"sounds_like\": [\"N. C. A. A.\", \"N. C. double A.\"]}" \ "{url}/v1/customizations/{customization_id}/words/NCAA"
IBM Cloud Pak for Data IBM Software Hub
curl -X PUT \ --header "Authorization: Bearer {token}" \ --header "Content-Type: application/json" \ --data "{\"sounds_like\": [\"N. C. A. A.\", \"N. C. double A.\"]}" \ "{url}/v1/customizations/{customization_id}/words/NCAA"
-
Gestire le parole straniere. Ad esempio, la parola francese "
garçon
" contiene un carattere che non si trova nella lingua inglese. È possibile specificare un suono simile agaarson
, sostituendoç
cons
, per indicare al servizio come gli anglofoni pronunciano la parola.
Le seguenti sezioni forniscono linee guida specifiche per la lingua per specificare una pronuncia dal suono simile (sounds-like). Il riconoscimento vocale utilizza gli algoritmi statistici per analizzare l'audio; l'aggiunta di una parola,
quindi, non garantisce che il servizio ne esegua la transcodifica con un'accuratezza completa. Quando aggiungi una parola, considera in che modo potrebbe essere pronunciata. Utilizza il campo sounds_like
per fornire diverse
pronunce che riflettono in che modo può essere pronunciata una parola.
Linee guida per l'inglese
Linee guida per l'inglese australiano, britannico e statunitense:
- Utilizza i caratteri alfabetici inglesi:
a-z
eA-Z
. - Utilizza parole reali o inventate che sono pronunciabili in inglese per le parole che sono difficili da pronunciare, ad esempio
shuchesnie
per la parolaSczcesny
. - Sostituisci le lettere non inglesi con lettere inglesi equivalenti, ad esempio,
s
conç
ony
conñ
. - Sostituisci le lettere accentate con quelle non accentate, ad esempio,
a
conà
oe
conè
. - È possibile includere più parole separate da spazi. Il servizio applica un massimo di 40 caratteri totali, senza includere gli spazi iniziali o finali.
Linee guida solo per l'inglese australiano e statunitense:
- Per pronunciare una singola lettera, utilizza la lettera seguita da un punto. Se il punto è seguito da un altro carattere, assicurati di utilizzare uno spazio tra il punto e il carattere successivo. Ad esempio, utilizza
N. C. A. A.
, nonN.C.A.A.
- Utilizza l'ortografia dei numeri, ad esempio
seventy-five
per75
.
Linee guida solo per l'inglese del Regno Unito
- Non è possibile utilizzare punti o trattini nelle pronunce simili a suoni per l'inglese britannico.
- Per pronunciare una singola lettera, utilizza la lettera seguita da uno spazio. Ad esempio, utilizza
N C A A
, nonN. C. A. A.
,N.C.A.A.
oNCAA
. - Utilizza l'ortografia dei numeri senza trattini, ad esempio
seventy five
per75
.
Linee guida per olandese, francese, tedesco, italiano, portoghese e spagnolo
Linee guida per tutti i dialetti supportati di olandese, francese, tedesco, italiano, portoghese e spagnolo:
- Non è possibile utilizzare i trattini nelle pronunce simili a suoni.
- Utilizza i caratteri alfabetici che sono validi per la lingua:
a-z
eA-Z
incluse le lettere accentate valide. - Per pronunciare una singola lettera, utilizza la lettera seguita da un punto. Se il punto è seguito da un altro carattere, assicurati di utilizzare uno spazio tra il punto e il carattere successivo. Ad esempio, utilizza
N. C. A. A.
, nonN.C.A.A.
- Utilizza parole reali o inventate che sono pronunciabili nella lingua per le parole che sono difficili da pronunciare.
- Utilizza l'ortografia dei numeri senza trattini, ad esempio per
75
utilizza- Olandese (Paesi Bassi):
vijfenzeventig
- Francese:
soixante quinze
- Tedesco
fünfundsiebzig
- Italiano:
settantacinque
- Portoghese (Brasiliano):
setenta e cinco
- Spagnolo:
setenta y cinco
- Olandese (Paesi Bassi):
- È possibile includere più parole separate da spazi. Il servizio applica un massimo di 40 caratteri totali, senza includere gli spazi iniziali o finali.
Linee guida per il giapponese
-
Utilizza solo caratteri Katakana a larghezza intera utilizzando il simbolo di allungamento (
―
, o 長音, in giapponese). Non utilizzare i caratteri a metà larghezza. -
Utilizza i suoni contratti (yoh-on, o 拗音, in giapponese) solo nei seguenti contesti sillabici:
イェ
,ウィ
,ウェ
,ウォ
,キィ
,キャ
,キュ
,キョ
,ギャ
,ギュ
,ギョ
,クァ
,クィ
,クェ
,クォ
グァ
,グォ
,シィ
,シェ
,シャ
,シュ
,ショ
,ジィ
,ジェ
,ジャ
,ジュ
,ジョ
,スィ
,ズィ
,チェ
チャ
,チュ
,チョ
,ヂェ
,ヂャ
,ヂュ
,ヂョ
,ツァ
,ツィ
,ツェ
,ツォ
,ティ
,テュ
,ディ
,デャ
デュ
,デョ
,トゥ
,ドゥ
,ニェ
,ニャ
,ニュ
,ニョ
,ヒャ
,ヒュ
,ヒョ
,ビャ
,ビュ
,ビョ
,ピィ
ピャ
,ピュ
,ピョ
,ファ
,フィ
,フェ
,フォ
,フュ
,ミャ
,ミュ
,ミョ
,リィ
,リェ
,リャ
,リュ
リョ
,ヴァ
,ヴィ
,ヴェ
,ヴォ
,ヴュ
-
Utilizzare solo le seguenti sillabe dopo un suono assimilato (soku-on, o 促音, in giapponese):
バ
,ビ
,ブ
,ベ
,ボ
,チ
,チェ
,チャ
,チュ
,チョ
,ダ
,デ
,ディ
,ド
,ドゥ
,フ
ファ
,フィ
,フェ
,フォ
,ガ
,ギ
,グ
,ゲ
,ゴ
,ハ
,ヒ
,ヘ
,ホ
,ジ
,ジェ
,ジャ
ジュ
,ジョ
,カ
,キ
,ク
,ケ
,コ
,キャ
,キュ
,キョ
,パ
,ピ
,プ
,ペ
,ポ
,ピャ
ピュ
,ピョ
,サ
,ス
,セ
,ソ
,シ
,シェ
,シャ
,シュ
,ショ
,タ
,テ
,ト
,ツ
,ザ
ズ
,ゼ
,ゾ
-
Non usare "
ン
" come primo carattere di una parola. Ad esempio, utilizzareウーント
invece diンート
, quest'ultimo non è valido. -
Molte parole composte sono formate da prefisso+nome o nome+suffisso. Il vocabolario di base del servizio copre la maggior parte delle parole composte che si verificano frequentemente (ad esempio,
長電話
e古新聞
), ma non quelle che si verificano raramente. Se il tuo corpus contiene comunemente parole composte, aggiungile come una singola parola come primo passo della tua personalizzazione. Ad esempio, "古鉛筆
" non è comune nei testi giapponesi in generale; se lo usi spesso, aggiungilo al tuo modello personalizzato per migliorare la precisione della trascrizione. -
Non utilizzare un suono assimilato in coda.
Linee guida per il coreano
- Utilizza caratteri, simboli e sillabe in coreano Hangul.
- Puoi anche utilizzare i caratteri alfabetici latini (inglese):
a-z
eA-Z
. - Non utilizzare caratteri o simboli non inclusi nei set precedenti.
Utilizzo del campo display_as
Il campo display_as
specifica il modo in cui una parola viene visualizzata in una trascrizione. Il suo uso previsto è per i casi in cui desideri che il servizio visualizzi una stringa diversa dall'ortografia della parola. Ad esempio,
puoi indicare che la parola hhonors
debba essere visualizzata come HHonors
indipendentemente dal fatto che suoni come hilton honors
o h honors
.
IBM Cloud
curl -X PUT -u "apikey:{apikey}" \
--header "Content-Type: application/json" \
--data "{\"sounds_like\": [\"hilton honors\", \"H. honors\"], \"display_as\": \"HHonors\"}" \
"{url}/v1/customizations/{customization_id}/words/hhonors"
IBM Cloud Pak for Data IBM Software Hub
curl -X PUT \
--header "Authorization: Bearer {token}" \
--header "Content-Type: application/json" \
--data "{\"sounds_like\": [\"hilton honors\", \"H. honors\"], \"display_as\": \"HHonors\"}" \
"{url}/v1/customizations/{customization_id}/words/hhonors"
Come altro esempio, è possibile indicare che la parola IBM
deve essere visualizzata come IBM™
.
IBM Cloud
curl -X PUT -u "apikey:{apikey}" \
--header "Content-Type: application/json" \
--data "{\"sounds_like\": [\"I. B. M.\"], \"display_as\":\"IBM™\"}" \
"{url}/v1/customizations/{customization_id}/words/IBM"
IBM Cloud Pak for Data IBM Software Hub
curl -X PUT \
--header "Authorization: Bearer {token}" \
--header "Content-Type: application/json" \
--data "{\"sounds_like\": [\"I. B. M.\"], \"display_as\":\"IBM™\"}" \
"{url}/v1/customizations/{customization_id}/words/IBM"
Interazione con la formattazione intelligente e l'oscuramento numerico
Se utilizzi i parametri smart_formatting
o redaction
con una richiesta di riconoscimento, tieni conto del fatto che il servizio applica la formattazione intelligente e l'oscuramento a una parola prima di prendere
in considerazione il campo display_as
per la parola. Potresti dover fare delle prove con i risultati per assicurarti che le funzioni non interferiscano con il modo in cui vengono visualizzate le tue parole personalizzate.
Potresti anche dover aggiungere delle parole personalizzate per tener conto degli effetti.
Supponi ad esempio di aggiungere la parola personalizzata one
con un campo display_as
di one
. La formattazione intelligente modifica la parola one
nel numero 1
, e il valore
di modalità di visualizzazione (display-as) non viene applicato. Per evitare questi problema, puoi aggiungere una parola personalizzata per il numero 1
e applicare lo stesso campo display_as
a tale parola.
Per ulteriori informazioni sull'utilizzo di queste funzioni, vedi Formattazione intelligente e Oscuramento numerico.
Cosa succede quando aggiungo o modifico una parola personalizzata?
Il modo in cui il servizio risponde a una richiesta di aggiunta o modifica di una parola personalizzata dipende dai campi e dai valori specificati. Dipende anche dall'esistenza della parola nel vocabolario di base del servizio.
-
Ometti entrambi i campi
sounds_like
edisplay_as
:- Se la parola non esiste nel vocabolario di base del
servizio, il servizio tenta di impostare il campo
sounds_like
sulla sua pronuncia della parola. Non può generare una pronuncia per tutte le parole, pertanto controlla la definizione della parola per assicurarsi che sia completa e valida. Il servizio imposta il campodisplay_as
sul valore del campoword
. - Se la parola esiste nel vocabolario di base del servizio, il servizio lascia i campi
sounds_like
edisplay_as
vuoti. Questi campi sono vuoti solo se la parola esiste nel vocabolario di base del servizio. La presenza della parola nella risorsa di parole del modello è innocua ma non necessaria.
- Se la parola non esiste nel vocabolario di base del
servizio, il servizio tenta di impostare il campo
-
Specifica solo il campo
sounds_like
:- *Se il campo
sounds_like
è valido, * il servizio imposta il campodisplay_as
sul valore del campoword
. - Se il campo "
sounds_like
" non è valido:- Il metodo
POST /v1/customizations/{customization_id}/words
aggiunge un campoerror
alla parola nella risorsa di parole del modello. - Il metodo
PUT /v1/customizations/{customization_id}/words/{word_name}
non riesce con un codice di risposta 400 e un messaggio di errore. Il servizio non aggiunge la parola alla risorsa di parole.
- Il metodo
- *Se il campo
-
Specifica solo il campo
display_as
:- Se la parola non esiste nel vocabolario di base del
servizio, il servizio tenta di impostare il campo
sounds_like
sulla sua pronuncia della parola. Non può generare una pronuncia per tutte le parole, pertanto controlla la definizione della parola per assicurarsi che sia completa e valida. Il servizio lascia il campodisplay_as
come specificato. - *Se la parola esiste nel vocabolario di base del servizio, * il servizio lascia
sounds_like
vuoto e lascia il campodisplay_as
come specificato.
- Se la parola non esiste nel vocabolario di base del
servizio, il servizio tenta di impostare il campo
-
Specifica entrambi i campi
sounds_like
edisplay_as
:- *Se il campo
sounds_like
è valido, * il servizio imposta i campisounds_like
edisplay_as
sui valori specificati. - *Se il campo
sounds_like
non è valido, * il servizio risponde come fa nel caso in cui il camposounds_like
sia specificato mentre il campodisplay_as
invece no.
- *Se il campo
Convalida di una risorsa di parole per i modelli di generazione precedente
Soprattutto quando si aggiunge un corpus a un modello linguistico personalizzato o si aggiungono più parole personalizzate contemporaneamente, esaminare le parole OOV nella risorsa parole del modello.
- Cerca gli errori di battitura e di altro tipo. Soprattutto quando aggiungi dei corpora, che possono essere di ampie dimensioni, è facile commettere degli errori. Gli errori tipografici in un corpus di parole (o in parole personalizzate o in un file grammaticale) hanno la conseguenza involontaria di aggiungere nuove parole alla risorsa di parole di un modello, così come i tag HTML mal formati che vengono lasciati in un file di corpus.
- Verifica le pronunce dal suono simile (sounds-like). Il servizio tenta di generare le pronunce dal suono simile (sound-like) dalle parole OOV automaticamente. Nella maggior parte dei casi, queste pronunce sono sufficienti. Ma il servizio non può generare una pronuncia per tutte le parole, pertanto controlla la definizione della parola per assicurarsi che sia completa e valida. Il riesame delle pronunce per l'accuratezza è anche consigliato per le parole che hanno delle ortografie insolite o che sono difficili da pronunciare e per gli acronimi e i termini tecnici.
Per convalidare e, se necessario, correggere una parola per un modello personalizzato, indipendentemente da come è stata aggiunta alla risorsa di parole, utilizza i seguenti metodi:
- Elenca tutte le parole da un modello personalizzato utilizzando il metodo
GET /v1/customizations/{customization_id}/words
o interroga una singola parola con il metodoGET /v1/customizations/{customization_id}/words/{word_name}
. Per ulteriori informazioni, vedere Elencare parole personalizzate da un modello linguistico personalizzato. - Modifica le parole in un modello personalizzato per correggere gli errori o per aggiungere valori di suono simile (sounds-like) e di modalità di visualizzazione (display-as) utilizzando il metodo
POST /v1/customizations/{customization_id}/words
o quelloPUT /v1/customizations/{customization_id}/words/{word_name}
. Per ulteriori informazioni, vedi Utilizzo di parole personalizzate per i modelli di generazione precedenti. - Elimina le parole estranee introdotte erroneamente (ad esempio da errori di battitura o di altro tipo in un corpus) utilizzando il metodo
DELETE /v1/customizations/{customization_id}/words/{word_name}
. Per ulteriori informazioni, vedi Eliminazione di una parola da un modello di lingua personalizzato.- Se la parola era stata estratta da un corpus, puoi invece aggiornare il file di testo di corpus per correggere l'errore e ricaricare quindi il file utilizzando il parametro
allow_overwrite
del metodoPOST /v1/customizations/{customization_id}/corpora/{corpus_name}
. Per ulteriori informazioni, vedi Aggiungi un corpus al modello di lingua personalizzato. - Se la parola era stata estratta da una grammatica, puoi aggiornare il file di grammatica per correggere l'errore e ricaricare quindi il file utilizzando il parametro
allow_overwrite
del metodoPOST /v1/customizations/{customization_id}/grammars/{grammar_name}
. Per ulteriori informazioni, vedi Aggiungi una grammatica al modello di lingua personalizzato.
- Se la parola era stata estratta da un corpus, puoi invece aggiornare il file di testo di corpus per correggere l'errore e ricaricare quindi il file utilizzando il parametro