瞭解音標
IBM Watson® Text to Speech 服務的所有語言和語音都支援標準「國際音標 (IPA)」和 IBM「符號語音表示法 (SPR)」來代表單字的聲音。 這兩種標記法都提供音標編碼,代表單字的發音、組成單字的音、如何將音分成音節,以及哪些音節是重音。 支援語言的音標 提供主題的鏈結,這些主題記載每一種語言的音標。
定義字組發音
若要在輸入文字或自訂模型中定義單字的拼音發音,您可以使用語音合成標記語言 (SSML) 的 <phoneme>
元件或同等的方法參數。 <phoneme>
元素有兩個屬性:
alphabet
屬性指定發音的表示法。 請使用值ibm
,指出發音用 SPR 定義。 請使用值ipa
,指出發音用 IPA 定義。ph
屬性定義發音。 它包括給定語言的一系列可容許符號。 這些符號定義了<phoneme>
元素所包含的字詞的發音方式。
當您定義發音時,請遵循下列規則:
- 僅使用記載的 SPR 或 IPA 符號。 任何定義只要包含語言中不容許的音標,服務就會將此定義視為無效。 不符合必要規格的 SPR 或 IPA 項目無效。
- 針對 SPR 符號記載多個 IPA 符號(或符號組合)時,所有 IPA 符號相等於單一 SPR 符號。 服務會將所有這些 IPA 符號視為相同,並且不會意識到 IPA 打算說明的細微或地區差異。
如需相關資訊,請參閱:
使用 IBM SPR
IBM SPR 是標準 IPA 的替代表示法。 以下有效 SPR 記號的範例,定義了美國英語中的 through(通過) 和 shocking(震撼):
<phoneme alphabet="ibm" ph=".1Tru">through</phoneme>
<phoneme alphabet="ibm" ph=".1Sa.0kIG">shocking</phoneme>
在定義中,字母代表美式英文語音的特定聲音。 .
表示新音節的開始,數字 1
和 0
表示音節重音。 如需相關資訊,請參閱指定音節。
語音聲音符號
每種語言都使用自己的 SPR 符號庫存來代表該語言的語音聲音。 下列規則適用於指定 SPR 符號:
- 字母會區分大小寫,因此,舉例而言
e
及E
代表兩個不同的聲音。 - 在符號表中指出時,必須以單引號括住兩個和三個字元的符號。 單引號指出多個字元實際上是單一符號。 例如,德文 heim 中的符號
'aj'
指定為"h'aj'm"
。 - 部分三個字元的符號只包含兩個字元的單引號。 單引號指出兩個字元是單一符號。 所以 SPR 由兩個符號組成。 例如,荷蘭文單字 dependances 中的符號
'a:'n
包含兩個符號'a:'
和n
,並指定為d'e:'.pEn.1d'a:'n.s@s
。
以 SPR 格式定義字組的發音時,另請考量下列事項:
- 每種語言的聲音在該語言內都具有特定的分佈型樣。 例如,在英文的所有用語中,
G
sing* (*) 中的".1sIG"
這個音不會出現在字組的開頭。 其他分佈特別狹窄的美式英文聲音包括聲門停止 (?
)、襟翼 (F
) 及音節鼻音 (N
)。如果您在通常不會出現聲音符號的環境定義中輸入聲音符號,則產生的語音可能聽起來不自然。 - 服務會將一組更準確的語言規則套用至其輸入,以反映自然語言中,聲音在特定上下文裡改變的程序。 例如,在美式英文中,單字 write (
".1r1Yt"
) 的音效t
在 writer (".1rY.0FR"
) 中發音為 flap (F
)。SPR 輸入會像一般輸入文字一樣進行這些修改。 在此範例中,無論您是輸入".1rY.0tR"
還是".1rY.0FR"
,都不會影響其產生的語音。
使用 IPA
您可以使用音標或 Unicode 值來定義 IPA 發音。 IPA 是業界標準表示法。 以下是字組 tomato 音標及 Unicode 的有效 IPA 表示法範例:
<phoneme alphabet="ipa" ph="təˈmeɪ.ɾoʊ">tomato</phoneme>
<phoneme alphabet="ipa" ph="təˈmeɪ.ɾoʊ">tomato</phoneme>
指定音節
您可以同時用 SPR 和 IPA 指定音節界限和重音。
音節界限
您可以使用 .
(句點,IPA Unicode 002E
) 來標示 SPR 或 IPA 中每一個音節的開頭。 不過,為了保留語言的有效語音,服務可以選擇在某些情況下不得許使用句點(例如,如果將音節界限置於語言的非法或非自然位置中)。 一般而言,如果您能指出對於音節邊界或單字發音的其他方面的有效偏好,服務會尊重此類請求。
音節重音
表 1 識別您可以用來指出發音的音節重音的符號。IBM 建議您在 SPR 或 IPA 中指出發音的主要重音。 不過,對於這兩種格式,指出音節重音是選用的;如果您未指出重音,服務會判定重音所在位置。
重音 | SPR 符號 | IPA 符號 | IPA Unicode |
---|---|---|---|
主重音 | 1 |
ˈ |
02C8 |
次重音 | 2 |
ˌ |
02CC |
無重音 | 0 |
無符號 | 沒有值 |
您必須將音節重音標記放置在音節界限之內,但一律在音節母音的左側。 您可以將標記放置在重母音左側的任何位置。 例如,以下每個 SPR 範例都將主重音 (1
) 放在構詞的正確元音上:
<phoneme alphabet="ibm" ph="kXn1strHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXns1trHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnst1rHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnstr1HkSXn">construction</phoneme>
使用音節重音的語言特定規則
表 2 列出了適用於指定音節重音的語言特定考量。 除非表格限定語言的規則,否則您可以使用前一節說明的音節重音符號。
語言 | 表示法 | 語言特定規則 |
---|---|---|
法文和 加拿大法文 |
SPR | 允許所有音節重音符號。 但音節重音必須緊接在音節的母音之前。 法文的音節重音比其他語言嚴格許多。 如果將重音符號放在無效的位置,就會發生錯誤。 |
法文和 加拿大法文 |
IPA | 忽略所有音節重音符號。 |
義大利文 | SPR 及 IPA | 您只能指定 1 (主重音)。 如果指定次重音或無重音,則會發生錯誤。 |
日文 | SPR 及 IPA | 您只能指定 1 (主重音)及 0 (無重音)。 如果指定次重音,則會發生錯誤。 |
西班牙文 | SPR 及 IPA | 您只能指定 1 (主重音)。 如果指定次重音或無重音,則會發生錯誤。 |
受支援語言的音標
表 3 列出服務支援的語言,並提供說明其 SPR 符號、IPA 符號及 IPA Unicode 值之主題的鏈結。 這些主題提供每個符號在語言單字中的範例。 因為用語差異,範例不一定會符合您的發音。
可用性欄位顯示每個語音是否可用於 IBM Cloud, IBM Cloud Pak for Data, IBM Software Hub 或全部 (所有版本 )。 如需支援語音的詳細資訊,請參閱 語言和語音。
語言 | 可用性 |
---|---|
荷蘭文(荷蘭)符號 | 所有版本 |
英文(澳洲)符號 | 所有版本 |
英文(英國)符號 | 所有版本 |
英文(美國)符號 | 所有版本 |
法文(加拿大)符號 | 所有版本 |
法文(法國)符號 | 所有版本 |
德文符號 | 所有版本 |
義大利文符號 | 所有版本 |
日文符號 | 所有版本 |
韓文符號 | 所有版本 |
葡萄牙文(巴西)符號 | 所有版本 |
西班牙文符號 | 所有版本 |