Información sobre los símbolos fonéticos
Todos los idiomas y voces del servicio IBM Watson® Text to Speech dan soporte a las notaciones estándar IPA (International Phonetic Alphabet) y IBM SPR (representación fonética simbólica) para representar los sonidos de las palabras. Ambas notaciones proporcionan una codificación fonética que representa la pronunciación de una palabra, los sonidos que componen la palabra, cómo se dividen los sonidos en sílabas y qué sílabas se acentúan. Símbolos fonéticos para idiomas soportados proporciona enlaces a temas que documentan los símbolos fonéticos para cada idioma.
Definición de la pronunciación de una palabra
Para definir la pronunciación fonética de una palabra, ya sea dentro del texto de entrada o para un modelo personalizado, se utiliza el elemento <phoneme>
de los parámetros de SSML (Speech Synthesis Markup Language) o del
método equivalente. El elemento <phoneme>
tiene dos atributos:
- El atributo
alphabet
especifica la notación de la pronunciación. Utilice el valoribm
para indicar que la pronunciación se ha definido en la SPR. Utilice el valoripa
para indicar que la pronunciación se ha definido en el IPA. - El atributo
ph
define la pronunciación. Consta de una secuencia de símbolos permitidos para un idioma determinado. Los símbolos definen cómo se va a pronunciar la palabra que está contenida en el elemento<phoneme>
.
Siga estas reglas cuando defina una pronunciación:
- Utilice únicamente los símbolos de la SPR o del IPA documentados. El servicio considera no válida cualquier definición que contenga símbolos fonéticos que no estén permitidos en un idioma. Una entrada de la SPR o del IPA que no se ajuste a la especificación requerida no es válida.
- Cuando se documentan varios símbolos IPA (o combinaciones de símbolos) para un símbolo SPR, todos los símbolos IPA equivalen al símbolo SPR individual. El servicio trata todos estos símbolos IPA por igual y no realiza diferencias sutiles o regionales que el IPA sí describe.
Para obtener más información, consulte
Cómo trabajar con la SPR de IBM
La SPR de IBM es una representación alternativa al IPA estándar. Los siguientes ejemplos de notaciones SPR válidas definen las palabras through y shocking en inglés estadounidense:
<phoneme alphabet="ibm" ph=".1Tru">through</phoneme>
<phoneme alphabet="ibm" ph=".1Sa.0kIG">shocking</phoneme>
En las definiciones, las letras representan sonidos específicos del habla en inglés de Estados Unidos. Un acento agudo ( .
) señala el comienzo de una nueva sílaba, y los dígitos 1
y 0
indican el acento
de la sílaba. Para obtener más información, consulte Especificación de sílabas.
Símbolos de sonidos del habla
Cada idioma utiliza su propio inventario de símbolos SPR para representar los sonidos del habla en ese idioma. Se aplican las reglas siguientes para la especificación de un símbolo SPR:
- Las letras son sensibles a mayúsculas y minúsculas, por tanto
e
yE
, por ejemplo, representan dos sonidos distintos. - Los símbolos de dos y tres caracteres deben especificarse entre comillas simples cuando se indican en las tablas de símbolos. Las comillas simples indican que los varios caracteres son en realidad un único símbolo. Por ejemplo, el símbolo
'aj'
en la palabra alemana heim se especifica como"h'aj'm"
. - Algunos símbolos de tres caracteres incluyen comillas simples alrededor de sólo dos de los caracteres. Las comillas simples indican que los dos caracteres son un solo símbolo. Por lo tanto, el SPR consta de dos símbolos. Por ejemplo, el
símbolo
'a:'n
en la palabra holandesa dependances contiene dos símbolos,'a:'
yn
, y se especifica comod'e:'.pEn.1d'a:'n.s@s
.
Tenga en cuenta también lo siguiente al definir la pronunciación de una palabra en formato SPR:
- Los sonidos de cada idioma tienen patrones de distribución específicos dentro de ese idioma. Por ejemplo, en todos los dialectos del inglés, el sonido
G
en sing (".1sIG"
) no aparece nunca a principio de palabra. Otros sonidos de inglés de estados Unidos que tienen una distribución particularmente estrecha son la oclusiva glotal (?
), la vibrante alveolar simple (F
), y la nasal silábica (N
). Si introduce un símbolo de sonido en un contexto en el que normalmente no se produce, el discurso resultante podría sonar antinatural. - El servicio aplica un sofisticado conjunto de reglas lingüísticas a la entrada para reflejar los procesos por los que los sonidos cambian en contextos específicos en el lenguaje natural. Por ejemplo, en inglés de Estados Unidos, el sonido
t
de la palabra write (".1r1Yt"
) se pronuncia como una vibrante alveolar simple (F
) en writer (".1rY.0FR"
). La entrada SPR sufre estas modificaciones igual que el texto de entrada ordinario. En este ejemplo, si especifica".1rY.0tR"
o".1rY.0FR"
no afecta al habla que se genera.
Trabajar con IPA
Puede definir las pronunciaciones del IPA utilizando símbolos fonéticos o valores Unicode. El IPA es una notación estándar del sector. A continuación se muestran ejemplos de notaciones del IPA válidas para la palabra tomato en símbolos fonéticos y Unicode:
<phoneme alphabet="ipa" ph="təˈmeɪ.ɾoʊ">tomato</phoneme>
<phoneme alphabet="ipa" ph="təˈmeɪ.ɾoʊ">tomato</phoneme>
Especificación de sílabas
Puede especificar límites de sílaba y acento tanto en SPR como en IPA.
Límites silábicos
Puede utilizar un .
(punto, IPA Unicode 002E
) para marcar el principio de cada sílaba en SPR o IPA. No obstante, para preservar la fonética válida de un idioma, el servicio puede elegir no hacer caso de los puntos
en algunos casos (por ejemplo, si se pone un límite de sílaba en una posición no permitida o no natural para un idioma). En general, en los casos en los que se puede indicar una preferencia válida para un límite de sílaba u otro aspecto
de la pronunciación de una palabra, el servicio atiende dichas solicitudes.
Acento silábico
La Tabla 1 identifica los símbolos que puede utilizar para indicar el acento silábico para una pronunciación. IBM recomienda que indique el acento primario para las pronunciaciones en SPR o IPA. No obstante, indicar el acento silábico es opcional para ambos formatos; el servicio determina dónde va el acento si no se indica.
Acento | Símbolo SPR | Símbolo IPA | IPA Unicode |
---|---|---|---|
Acento primario | 1 |
ˈ |
02C8 |
Acento secundario | 2 |
ˌ |
02CC |
Sin acento | 0 |
Sin símbolo | Sin valor |
Debe colocar un marcador de acento silábico dentro de un límite de sílaba, pero siempre a la izquierda de la vocal de la sílaba. Puede colocar un marcador en cualquier lugar siempre que sea a la izquierda de la vocal acentuada. Por ejemplo,
cada uno de los siguientes ejemplos de SPR coloca el acento primario (1
) en la vocal correcta de la construcción de la palabra:
<phoneme alphabet="ibm" ph="kXn1strHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXns1trHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnst1rHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnstr1HkSXn">construction</phoneme>
Reglas específicas del idioma para utilizar el acento silábico
En la tabla 2 se muestran las consideraciones específicas del idioma que se aplican a la especificación del acento silábico. A menos que la tabla defina las reglas para un idioma, puede utilizar los símbolos de acento silábico descritos en la sección anterior.
Idioma | Notación | Reglas específicas del idioma |
---|---|---|
Francés y francés canadiense |
SPR | Se respetan todos los símbolos con acento silábico. Pero el acento silábico debe ir precedido inmediatamente de la vocal de la sílaba. El acento silábico para el francés es mucho más restrictivo que el de otros idiomas. Se produce un error si coloca el símbolo de acentuación en una ubicación no válida. |
Francés y francés canadiense |
IPA | Se omiten todos los símbolos con acento silábico. |
Italiano | SPR e IPA | Puede especificar solamente 1 (acento primario). Si se especifica un acento secundario o no se especifica ningún acento, se produce un error. |
Japonés | SPR e IPA | Puede especificar solamente 1 (acento primario) y 0 (sin acento). Si se especifica un acento secundario, se produce un error. |
Español | SPR e IPA | Puede especificar solamente 1 (acento primario). Si se especifica un acento secundario o no se especifica ningún acento, se produce un error. |
Símbolos fonéticos para idiomas soportados
La Tabla 3 lista los idiomas a los que el servicio da soporte y proporciona enlaces a temas que describen sus símbolos SPR, símbolos IPA y valores IPA Unicode. Los temas proporcionan ejemplos de cada símbolo en palabras del idioma. Debido a las diferencias dialectales, es posible que los ejemplos no siempre coincidan con su pronunciación.
La columna Disponibilidad indica si cada voz está disponible para IBM Cloud, IBM Cloud Pak for Data, o todas (Todas las versiones) IBM Software Hub o todas (Todas las versiones ). Para obtener más información sobre las voces compatibles, consulte Idiomas y voces.
Idioma | Disponibilidad |
---|---|
Símbolos para el neerlandés (de Países Bajos) | Todas las versiones |
Símbolos para el inglés (australiano) | Todas las versiones |
Símbolos para el inglés (Reino Unido) | Todas las versiones |
Símbolos para el inglés (Estados Unidos) | Todas las versiones |
Símbolos para el francés (canadiense) | Todas las versiones |
Símbolos para el francés (de Francia) | Todas las versiones |
Símbolos para el alemán | Todas las versiones |
Símbolos para el italiano | Todas las versiones |
Símbolos para el japonés | Todas las versiones |
Símbolos para el coreano | Todas las versiones |
Símbolos para el portugués (de Brasil) | Todas las versiones |
Símbolos para el español | Todas las versiones |