Comprendre les symboles phonétiques

Toutes les langues et les voix du service IBM Watson® Text to Speech prennent en charge l'alphabet phonétique international (IPA) standard et les notations IBM Symbolic Phonetic Representation (SPR) pour représenter les sons des mots. Les deux notations fournissent un codage phonétique qui représente la prononciation d'un mot, les sons qui composent le mot, la façon dont les sons sont divisés en syllabes et quelles syllabes sont accentuées. Symboles phonétiques pour les langues prises en charge fournit des liens vers des rubriques qui documentent les symboles phonétiques de chaque langue.

Définition de la prononciation d'un mot

Pour définir la prononciation phonétique d'un mot, dans le texte d'entrée ou dans un modèle personnalisé, vous utilisez l'élément <phoneme> du langage SSML (Speech Synthesis Markup Language) ou des paramètres de méthode équivalents. L'élément <phoneme> a deux attributs :

L'attribut alphabet spécifie la notation de la prononciation. Utilisez la valeur ibm pour indiquer que la prononciation est définie dans SPR. Utilisez la valeur ipa pour indiquer que la prononciation est définie dans IPA.
L'attribut ph définit la prononciation. Elle consiste en une séquence de symboles autorisés pour une langue donnée. Les symboles définissent la façon dont le mot qui est inclus dans l'élément <phoneme> doit être prononcé.

Lorsque vous définissez une prononciation, appliquez les règles suivantes :

Utilisez uniquement les symboles SPR ou IPA documentés. Le service considère comme non valide toute définition contenant des symboles phonétiques interdits dans une langue. Une entrée SPR ou IPA non conforme à la spécification requise n'est pas valide.
Lorsque plusieurs symboles IPA (ou combinaisons de symboles) sont documentés pour un symbole SPR, tous sont équivalents au symbole SPR unique. Le service traite tous les symboles IPA de la même manière et ne réalise pas les différences subtiles ou régionales que la notation IPA est censée décrire.

Pour plus d'informations, voir :

Utilisation d'IBM SPR

IBM SPR est une représentation alternative à la notation IPA standard. Les exemples suivants de notations SPR valides définissent les mots through et shocking en anglais américain :

<phoneme alphabet="ibm" ph=".1Tru">through</phoneme>
<phoneme alphabet="ibm" ph=".1Sa.0kIG">shocking</phoneme>

Dans les définitions, les lettres représentent des sons spécifiques du discours en anglais américain. Un « . » signale le début d'une nouvelle syllabe, et les chiffres « 1 » et « 0 » indiquent l'accent tonique. Pour plus d'informations, voir Spécification de syllabes.

Symboles sonores de la parole

Chaque langue utilise son propre inventaire de symboles SPR pour représenter les sons de la parole de cette langue. Les règles suivantes s'appliquent à la spécification d'un symbole SPR :

Les lettres sont sensibles à la casse. Ainsi, e et E, par exemple, représentent deux sons différents.
Les symboles à deux et trois caractères doivent être placés entre apostrophes lorsqu'ils sont indiqués dans les tables de symboles. Les guillemets simples indiquent que les caractères multiples sont en fait un seul symbole. Par exemple, le symbole 'aj' dans le mot allemand heim est spécifié comme "h'aj'm".
Certains symboles à trois caractères incluent des guillemets simples autour de deux caractères seulement. Les guillemets simples indiquent que les deux caractères sont un seul symbole. Le SPR est donc composé de deux symboles. Par exemple, le symbole 'a:'n dans le mot néerlandais néerlandais dependances contient deux symboles, 'a:' et n, et est spécifié sous la forme d'e:'.pEn.1d'a:'n.s@s.

Tenez également compte des éléments suivants lors de la définition de la prononciation d'un mot au format SPR :

Les sons de toutes les langues ont des schémas de distribution spécifiques dans cette langue. Par exemple, dans tous les dialectes anglais, le son G dans sing (".1sIG") ne se produit pas au début d'un mot. Les autres sons anglais américains qui ont une distribution particulièrement étroite sont l'arrêt glottal (?), le flap (F) et la nasale syllabique (N). Si vous entrez un symbole sonore dans un contexte où il ne se trouve pas normalement, la voix qui en résulte peut ne pas sembler naturelle.
Le service applique à son entrée un ensemble sophistiqué de règles linguistiques afin de refléter les processus par lesquels les sons changent dans des contextes spécifiques en langage naturel. Par exemple, en anglais américain, le son t du mot write (".1r1Yt") est prononcé sous la forme d'un flap (F) dans writer (".1rY.0FR"). L'entrée SPR subit ces modifications comme le fait le texte d'entrée ordinaire. Dans cet exemple, que vous entriez ".1rY.0tR" ou ".1rY.0FR" n'affecte pas le discours généré.

Utilisation d'IPA

Vous pouvez définir des prononciations IPA en utilisant des symboles phonétiques ou des valeurs Unicode. IPA est une notation standard de l'industrie. Voici des exemples de notations IPA valides pour le mot tomato dans des symboles phonétiques et en Unicode :

<phoneme alphabet="ipa" ph="təˈmeɪ.ɾoʊ">tomato</phoneme>
<phoneme alphabet="ipa" ph="t&#x0259;&#x02C8;me&#x026A;.&#x027E;o&#x028A;">tomato</phoneme>

Spécification de syllabes

Vous pouvez spécifier les limites et l'accentuation de syllabe dans SPR et IPA.

Limites de syllabe

Vous pouvez utiliser un . (point, Unicode IPA 002E) pour marquer le début de chaque syllabe dans SPR ou IPA. Cependant, afin de préserver la phonétique valide d'une langue, le service peut choisir de ne pas respecter les points dans certains cas (par exemple, si une limite de syllabe est placée à une position non admise ou non naturelle pour une langue). En général, dans les cas où vous pouvez indiquer une préférence valable pour une syllabe limite ou un autre aspect de la prononciation d'un mot, le service respecte ces demandes.

Accentuation de syllabe

Le tableau 1 identifie les symboles que vous pouvez utiliser pour indiquer l'accentuation d'une syllabe pour une prononciation. IBM vous recommande d'indiquer l'accentuation principale pour les prononciations dans SPR ou IPA. Toutefois, l’indication d'une accentuation syllabique est facultative pour les deux formats ; le service détermine où l'accentuation se produit si vous ne l'indiquez pas.

Accentuation de syllabe
Accentuation	Symbole SPR	Symbole IPA	Unicode IPA
Accentuation principale	`1`	`ˈ`	`02C8`
Accentuation secondaire	`2`	`ˌ`	`02CC`
Aucune accentuation	`0`	Aucun symbole	Aucune valeur

Vous devez placer un marqueur d'accentuation de syllabe dans une limite de syllabe, mais toujours à gauche de la voyelle de la syllabe. Vous pouvez placer un marqueur n'importe où à gauche de la voyelle stressée. Par exemple, chacun des exemples suivants de SPR place l'accent tonique (1) sur la voyelle correcte de la construction du mot:

<phoneme alphabet="ibm" ph="kXn1strHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXns1trHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnst1rHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnstr1HkSXn">construction</phoneme>

Règles propres à chaque langue en matière d'utilisation de l'accentuation de syllabe

Le tableau 2 contient des remarques propres à chaque langue en matière de spécification de l'accentuation de syllabe. Si le tableau ne contient pas de règles pour une langue, vous pouvez utiliser les symboles d'accentuation de syllabe décrits dans la section précédente.

Langue	Notation	Règles propres à chaque langue
Français et français canadien	SPR	Tous les symboles d'accentuation de syllabe sont respectés. Mais l'accentuation de syllabe doit précéder immédiatement la voyelle de la syllabe. L'accentuation de syllabe pour le français est beaucoup plus stricte que pour les autres langues. Une erreur

  se produit si le symbole d'accentuation se trouve à un emplacement non valide. |

| Français et \n français canadien | IPA | Tous les symboles d'accentuation de syllabe sont ignorés. | | Italien | SPR et IPA | Vous ne pouvez spécifier que 1 (accentuation principale). Une erreur se produit si vous spécifiez une accentuation secondaire ou nulle. | | Japonais | SPR et IPA | Vous ne spécifiez que 1 (accentuation principale) et 0 (pas d'accentuation). Une erreur se produit si vous spécifiez une accentuation secondaire. | | Espagnol | SPR et IPA | Vous ne pouvez spécifier que 1 (accentuation principale). Une erreur se produit si vous spécifiez une accentuation secondaire ou nulle. |

Symboles phonétiques pour les langues prises en charge

Le tableau 3 répertorie les langues prises en charge par le service et fournit des liens vers des rubriques qui décrivent leurs symboles SPR, IPA et valeurs Unicode IPA. Les rubriques fournissent des exemples de chaque symbole dans des mots de la langue. En raison des différences dialectales, les exemples ne correspondent pas toujours à votre prononciation.

La colonne Disponibilité indique si chaque voix est disponible pour IBM Cloud, IBM Cloud Pak for Data, ou toutes (Toutes les versions) IBM Software Hub ou toutes (Toutes versions ). Pour plus d'informations sur les voix prises en charge, voir Langues et voix.

Symboles phonétiques pour les langues prises en charge
Langue	Disponibilité
Symboles néerlandais (Pays-Bas)	Toutes les versions
Symboles anglais (australien)	Toutes les versions
Symboles pour l'anglais britannique	Toutes les versions
Symboles pour l'anglais américain	Toutes les versions
Symboles français (canadien)	Toutes les versions
Symboles français (France)	Toutes les versions
Symboles allemands	Toutes les versions
Symboles italiens	Toutes les versions
Symboles japonais	Toutes les versions
Symboles coréens	Toutes les versions
Symboles portugais (brésilien)	Toutes les versions
Symboles espagnols	Toutes les versions