IBM Cloud Docs
瞭解音標

瞭解音標

IBM Watson® Text to Speech 服務的所有語言和語音都支援標準「國際音標 (IPA)」和 IBM「符號語音表示法 (SPR)」來代表單字的聲音。 這兩種標記法都提供音標編碼,代表單字的發音、組成單字的音、如何將音分成音節,以及哪些音節是重音。 支援語言的音標 提供主題的鏈結,這些主題記載每一種語言的音標。

定義字組發音

若要在輸入文字或自訂模型中定義單字的拼音發音,您可以使用語音合成標記語言 (SSML) 的 <phoneme> 元件或同等的方法參數。 <phoneme> 元素有兩個屬性:

  • alphabet 屬性指定發音的表示法。 請使用值 ibm,指出發音用 SPR 定義。 請使用值 ipa,指出發音用 IPA 定義。
  • ph 屬性定義發音。 它包括給定語言的一系列可容許符號。 這些符號定義了 <phoneme> 元素所包含的字詞的發音方式。

當您定義發音時,請遵循下列規則:

  • 僅使用記載的 SPR 或 IPA 符號。 任何定義只要包含語言中不容許的音標,服務就會將此定義視為無效。 不符合必要規格的 SPR 或 IPA 項目無效。
  • 針對 SPR 符號記載多個 IPA 符號(或符號組合)時,所有 IPA 符號相等於單一 SPR 符號。 服務會將所有這些 IPA 符號視為相同,並且不會意識到 IPA 打算說明的細微或地區差異。

如需相關資訊,請參閱:

使用 IBM SPR

IBM SPR 是標準 IPA 的替代表示法。 以下有效 SPR 記號的範例,定義了美國英語中的 through(通過)shocking(震撼)

<phoneme alphabet="ibm" ph=".1Tru">through</phoneme>
<phoneme alphabet="ibm" ph=".1Sa.0kIG">shocking</phoneme>

在定義中,字母代表美式英文語音的特定聲音。 . 表示新音節的開始,數字 10 表示音節重音。 如需相關資訊,請參閱指定音節

語音聲音符號

每種語言都使用自己的 SPR 符號庫存來代表該語言的語音聲音。 下列規則適用於指定 SPR 符號:

  • 字母會區分大小寫,因此,舉例而言 eE 代表兩個不同的聲音。
  • 在符號表中指出時,必須以單引號括住兩個和三個字元的符號。 單引號指出多個字元實際上是單一符號。 例如,德文 heim 中的符號 'aj' 指定為 "h'aj'm"
  • 部分三個字元的符號只包含兩個字元的單引號。 單引號指出兩個字元是單一符號。 所以 SPR 由兩個符號組成。 例如,荷蘭文單字 dependances 中的符號 'a:'n 包含兩個符號 'a:'n,並指定為 d'e:'.pEn.1d'a:'n.s@s

以 SPR 格式定義字組的發音時,另請考量下列事項:

  • 每種語言的聲音在該語言內都具有特定的分佈型樣。 例如,在英文的所有用語中,Gsing* (*) 中的 ".1sIG" 這個音不會出現在字組的開頭。 其他分佈特別狹窄的美式英文聲音包括聲門停止 (?)、襟翼 (F) 及音節鼻音 (N)。如果您在通常不會出現聲音符號的環境定義中輸入聲音符號,則產生的語音可能聽起來不自然。
  • 服務會將一組更準確的語言規則套用至其輸入,以反映自然語言中,聲音在特定上下文裡改變的程序。 例如,在美式英文中,單字 write (".1r1Yt") 的音效 twriter (".1rY.0FR") 中發音為 flap (F)。SPR 輸入會像一般輸入文字一樣進行這些修改。 在此範例中,無論您是輸入 ".1rY.0tR" 還是 ".1rY.0FR",都不會影響其產生的語音。

使用 IPA

您可以使用音標或 Unicode 值來定義 IPA 發音。 IPA 是業界標準表示法。 以下是字組 tomato 音標及 Unicode 的有效 IPA 表示法範例:

<phoneme alphabet="ipa" ph="təˈmeɪ.ɾoʊ">tomato</phoneme>
<phoneme alphabet="ipa" ph="t&#x0259;&#x02C8;me&#x026A;.&#x027E;o&#x028A;">tomato</phoneme>

指定音節

您可以同時用 SPR 和 IPA 指定音節界限和重音。

音節界限

您可以使用 . (句點,IPA Unicode 002E) 來標示 SPR 或 IPA 中每一個音節的開頭。 不過,為了保留語言的有效語音,服務可以選擇在某些情況下不得許使用句點(例如,如果將音節界限置於語言的非法或非自然位置中)。 一般而言,如果您能指出對於音節邊界或單字發音的其他方面的有效偏好,服務會尊重此類請求。

音節重音

表 1 識別您可以用來指出發音的音節重音的符號。IBM 建議您在 SPR 或 IPA 中指出發音的主要重音。 不過,對於這兩種格式,指出音節重音是選用的;如果您未指出重音,服務會判定重音所在位置。

音節重音
重音 SPR 符號 IPA 符號 IPA Unicode
主重音 1 ˈ 02C8
次重音 2 ˌ 02CC
無重音 0 無符號 沒有值

您必須將音節重音標記放置在音節界限之內,但一律在音節母音的左側。 您可以將標記放置在重母音左側的任何位置。 例如,以下每個 SPR 範例都將主重音 (1) 放在構詞的正確元音上:

<phoneme alphabet="ibm" ph="kXn1strHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXns1trHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnst1rHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnstr1HkSXn">construction</phoneme>

使用音節重音的語言特定規則

表 2 列出了適用於指定音節重音的語言特定考量。 除非表格限定語言的規則,否則您可以使用前一節說明的音節重音符號。

使用音節重音的語言特定規則
語言 表示法 語言特定規則
法文和
加拿大法文
SPR 允許所有音節重音符號。 但音節重音必須緊接在音節的母音之前。 法文的音節重音比其他語言嚴格許多。 如果將重音符號放在無效的位置,就會發生錯誤。
法文和
加拿大法文
IPA 忽略所有音節重音符號。
義大利文 SPR 及 IPA 您只能指定 1(主重音)。 如果指定次重音或無重音,則會發生錯誤。
日文 SPR 及 IPA 您只能指定 1(主重音)及 0(無重音)。 如果指定次重音,則會發生錯誤。
西班牙文 SPR 及 IPA 您只能指定 1(主重音)。 如果指定次重音或無重音,則會發生錯誤。

受支援語言的音標

表 3 列出服務支援的語言,並提供說明其 SPR 符號、IPA 符號及 IPA Unicode 值之主題的鏈結。 這些主題提供每個符號在語言單字中的範例。 因為用語差異,範例不一定會符合您的發音。

可用性欄位顯示每個語音是否可用於 IBM Cloud, IBM Cloud Pak for Data, IBM Software Hub 或全部 (所有版本 )。 如需支援語音的詳細資訊,請參閱 語言和語音

支援語言的音標
語言 可用性
荷蘭文(荷蘭)符號 所有版本
英文(澳洲)符號 所有版本
英文(英國)符號 所有版本
英文(美國)符號 所有版本
法文(加拿大)符號 所有版本
法文(法國)符號 所有版本
德文符號 所有版本
義大利文符號 所有版本
日文符號 所有版本
韓文符號 所有版本
葡萄牙文(巴西)符號 所有版本
西班牙文符號 所有版本