Erläuterungen zu phonetischen Zeichen
Alle Sprachen und Stimmen des Service IBM Watson® Text to Speech unterstützen sowohl die Standard-IPA-Notationen (IPA = International Phonetic Alphabet) als auch die SPR-Notationen ( IBM Symbolic Phonetic Representation) zur Darstellung der Wortlaute. Beide Notationen bieten eine phonetische Kodierung, die die Aussprache eines Wortes, die Laute, aus denen das Wort besteht, die Aufteilung der Laute in Silben und die betonten Silben darstellt. Phonetische Symbole für unterstützte Sprachen enthält Links zu Themen, in denen die phonetischen Symbole für jede Sprache dokumentiert sind.
Wortaussprache definieren
Zum Definieren der phonetischen Aussprache eines Worts werden das Element <phoneme>
der Markup-Sprache SSML (Speech Synthesis Markup Language) oder entsprechende Methodenparameter verwendet, unabhängig davon, ob es sich um
ein Wort im Eingabetext oder ein Wort für ein angepasstes Modell handelt. Das Element <phoneme>
weist zwei Attribute auf:
- Das Attribut
alphabet
gibt die Schreibweise der Aussprache an. Verwenden Sie den Wertibm
, um anzugeben, dass die Aussprache in SPR definiert ist. Verwenden Sie den Wertipa
, um anzugeben, dass die Aussprache in IPA definiert ist. - Das Attribut
ph
definiert die Aussprache. Sie besteht aus einer Abfolge zulässiger Symbole für eine bestimmte Sprache. Die Zeichen definieren, wie das in das Element<phoneme>
eingeschlossene Wort ausgesprochen werden soll.
Berücksichtigen Sie beim Definieren der Aussprache die folgenden Regeln:
- Verwenden Sie nur die dokumentierten SPR- bzw. IPA-Symbole. Der Service wertet alle Definitionen, die phonetische Symbole enthält, die in der betreffenden Sprache nicht zulässig sind, als ungültig. Ein SPR- oder IPA-Eintrag, der nicht der erforderlichen Spezifikation entspricht, ist ungültig.
- Wenn für ein SPR-Symbol mehrere IPA-Symbole (oder Symbolkombinationen) dokumentiert sind, so sind alle diese IPA-Symbole oder Symbolkombinationen gleichwertig (äquivalent) zu dem einzelnen SPR-Symbol. Der Service behandelt alle diese IPA-Symbole gleich und erkennt nicht die subtilen oder regionalen Unterschiede, die IPA eigentlich beschreiben soll.
Weitere Informationen finden Sie
Mit IBM SPR arbeiten
IBM SPR ist eine alternative Darstellung zur standardmäßigen IPA-Darstellung. Die folgenden Beispiele für gültige SPR-Notationen definieren die Wörter "through" und "shocking" im US-Englisch:
<phoneme alphabet="ibm" ph=".1Tru">through</phoneme>
<phoneme alphabet="ibm" ph=".1Sa.0kIG">shocking</phoneme>
In den Definitionen stellen die Buchstaben bestimmte Laute von gesprochenem amerikanischem Englisch dar. Ein .
signalisiert den Beginn einer neuen Silbe, und die Ziffern 1
und 0
zeigen die Betonung der
Silbe an. Weitere Informationen enthält der Abschnitt Silben angeben.
Symbole für Sprachlaute
Jede Sprache verwendet ihr eigenes Inventar von SPR-Symbolen, um die Sprachlaute dieser Sprache darzustellen. Für die Angabe eines SPR-Symbols gelten die folgenden Regeln:
- Bei Buchstaben wird die Groß-/Kleinschreibung beachtet, weshalb beispielsweise
e
undE
zwei unterschiedliche Laute repräsentieren. - Zwei-und dreistellige Symbole müssen in einfache Anführungszeichen eingeschlossen werden, wenn sie in den Symboltabellen angegeben werden. Die einfachen Anführungszeichen geben an, dass es sich bei den mehreren Zeichen tatsächlich um ein
einzelnes Symbol handelt. Zum Beispiel wird das Symbol
'aj'
im deutschen Wort "heim" als"h'aj'm"
angegeben. - Einige Symbole mit drei Zeichen enthalten einfache Anführungszeichen um nur zwei der Zeichen. Die einfachen Anführungszeichen geben an, dass die beiden Zeichen ein einzelnes Symbol sind. Der SPR besteht also aus zwei Symbolen. Das Symbol
'a:'n
im niederländischen Wort dependances enthält beispielsweise zwei Symbole,'a:'
undn
, und wird alsd'e:'.pEn.1d'a:'n.s@s
angegeben.
Beachten Sie außerdem Folgendes, wenn Sie die Aussprache eines Wortes im SPR-Format definieren:
- Für die Laute jeder Sprache gibt es bestimmte Verteilungsmuster innerhalb dieser Sprache. Beispielsweise tritt bei allen englischen Dialekten der Laut
G
in sing (".1sIG"
) nicht am Anfang eines Wortes auf. Weitere Laute im amerikanischem Englisch, für die es eine besonders eingeschränkte Verteilung gibt, sind der Glottisschlag (?
), der geschlagene Laut (F
) und der syllabische Nasal (N
). Wenn Sie ein Lautzeichen in einem Kontext eingeben, in dem es normalerweise nicht vorkommt, klingt die resultierende Aussprache möglicherweise unnatürlich. - Durch die Anwendung einer hoch entwickelten Gruppe von linguistischen Regeln auf die Eingabe bildet der Service die Prozesse ab, durch die bei natürlicher Sprache Laute in bestimmten Kontexten geändert werden. In amerikanischem Englisch
wird der Ton
t
des Wortes write (".1r1Yt"
) in writer (".1rY.0FR"
) als geschlagener Laut (F
) ausgesprochen. Bei der SPR-Eingabe werden diese Änderungen wie bei einem normalen Eingabetext üblich nachvollzogen. In diesem Beispiel hat es keinen Einfluss auf die generierte Sprache, ob Sie".1rY.0tR"
oder".1rY.0FR"
eingeben.
Mit IPA arbeiten
Sie können IPA-Aussprachevarianten mithilfe phonetischer Symbole oder mit Unicode-Werten definieren. IPA ist eine branchenübliche Schreibweise. Die nachfolgenden Beispiele stellen gültige IPA-Schreibweisen für das Wort tomato in phonetischen Symbolen und in Unicode dar:
<phoneme alphabet="ipa" ph="təˈmeɪ.ɾoʊ">tomato</phoneme>
<phoneme alphabet="ipa" ph="təˈmeɪ.ɾoʊ">tomato</phoneme>
Silben angeben
Sowohl in SPR als auch in IPA können Sie Silbengrenzen und Betonung angeben.
Silbengrenzen
Sie können den Anfang der einzelnen Silben in SPR- oder IPA-Notation mit einem .
(Punkt, IPA-Zeichen in Unicode 002E
) kennzeichnen. Damit die gültige Phonetik einer Sprache erhalten bleibt, kann der Service jedoch
in manchen Fällen eine Nichtbeachtung von Punkten vornehmen (wenn beispielsweise eine Silbengrenze an einer unzulässigen oder unnatürlichen Position für eine Sprache festgelegt ist). Im Allgemeinen werden solche Anfragen berücksichtigt,
wenn Sie eine gültige Präferenz für eine Silbengrenze oder einen anderen Aspekt der Aussprache eines Wortes angeben können.
Silbenbetonung
In Tabelle 1 sind die Zeichen aufgeführt, mit denen Sie die Silbenbetonung für die Aussprache angeben können. IBM empfiehlt, die Hauptbetonung für Aussprachevarianten entweder im SPR- oder IPA-Format anzugeben. Bei beiden Formaten ist die Angabe der Silbenbetonung jedoch optional; falls Sie keine Betonung angeben, legt der Service fest, wo die Betonung stattfindet.
Betonung | SPR-Zeichen | IPA-Zeichen | IPA-Zeichen in Unicode |
---|---|---|---|
Hauptbetonung | 1 |
ˈ |
02C8 |
Nebenbetonung | 2 |
ˌ |
02CC |
Keine Betonung | 0 |
Kein Zeichen | Kein Wert |
Die Markierung für eine Silbenbetonung muss innerhalb der Silbengrenze angegeben werden, jedoch immer links vom Vokal der Silbe. Die Position links neben dem Vokal der betonten Silbe können Sie frei wählen. Zum Beispiel legt jedes der folgenden
SPR-Beispiele den Hauptakzent (1
) auf den korrekten Vokal der Wortkonstruktion:
<phoneme alphabet="ibm" ph="kXn1strHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXns1trHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnst1rHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnstr1HkSXn">construction</phoneme>
Sprachspezifische Regeln für die Verwendung von Silbenbetonung
Tabelle 2 enthält eine Auflistung sprachspezifischer Hinweise, die für die Angabe der Silbenbetonung gelten. Sofern die Tabelle nicht die Regeln für eine Sprache qualifiziert, können Sie die im vorigen Abschnitt beschriebenen Symbole für die Silbenbetonung verwenden.
Sprache | Notation | Sprachspezifische Regeln |
---|---|---|
Französisch und kanadisches Französisch |
SPR | Alle Silbenbetonungssymbole werden berücksichtigt. Die Silbenbetonung muss jedoch dem Vokal der Silbe unmittelbar vorangehen. Für Französisch wird die Silbenbetonung sehr viel strenger gehandhabt als bei anderen Sprachen. Wird das Betonungssymbol an einer ungültigen Stelle platziert, tritt ein Fehler auf. |
Französisch und kanadisches Französisch |
IPA | Alle Silbenbetonungssymbole werden ignoriert. |
Italienisch | SPR und IPA | Sie können lediglich das Symbol 1 (Hauptbetonung) angeben. Falls Sie eine Nebenbetonung oder gar keine Betonung angeben, tritt ein Fehler auf. |
Japanisch | SPR und IPA | Sie können lediglich die Symbole 1 (Hauptbetonung) und 0 (keine Betonung) angeben. Falls Sie eine Nebenbetonung angeben, tritt ein Fehler auf. |
Spanisch | SPR und IPA | Sie können lediglich das Symbol 1 (Hauptbetonung) angeben. Falls Sie eine Nebenbetonung oder gar keine Betonung angeben, tritt ein Fehler auf. |
Phonetische Symbole für unterstützte Sprachen
In Tabelle 3 werden die Sprachen aufgelistet, die der Service unterstützt, und Links zu Themen bereitgestellt, in denen die SPR-Symbole, IPA-Symbole und IPA-Unicode-Werte beschrieben werden. Die Themen enthalten Beispiele für jedes Symbol in Worten aus der Sprache. Aufgrund von dialektalen Unterschieden stimmen die Beispiele möglicherweise nicht immer mit Ihrer Aussprache überein.
Die Spalte "Verfügbarkeit " gibt an, ob jede Stimme verfügbar ist für IBM Cloud, IBM Cloud Pak for DataIBM Software Hub oder alle (Alle Versionen ) Weitere Informationen zu den unterstützten Stimmen finden Sie unter Sprachen und Stimmen.
Sprache | Verfügbarkeit |
---|---|
Zeichen für Niederländisch (Niederlande) | Alle Versionen |
Zeichen für Englisch (Australien) | Alle Versionen |
Symbole für Englisch (Vereinigtes Königreich) | Alle Versionen |
Symbole für Englisch (Vereinigte Staaten) | Alle Versionen |
Zeichen für Französisch (Kanada) | Alle Versionen |
Zeichen für Französisch (Frankreich) | Alle Versionen |
Symbole für Deutsch | Alle Versionen |
Symbole für Italienisch | Alle Versionen |
Symbole für Japanisch | Alle Versionen |
Symbole für Koreanisch | Alle Versionen |
Zeichen für Portugiesisch (Brasilien) | Alle Versionen |
Symbole für Spanisch | Alle Versionen |