IBM Cloud Docs
用於建立自訂項目的規則

用於建立自訂項目的規則

下列規則及準則適用於在自訂模型中移入自訂項目(字組/轉換配對)。

自訂項目數上限及限制

下列限制適用於所有自訂模型及項目:

  • 自訂項目中的字組最多可以包含 49 個字元。
  • 自訂項目中的轉換最多可以包含 499 個字元。
  • 自訂模型最多可以包含 20,000 個自訂項目。
  • 自訂模型最多可以包含 1000 個自訂提示。
  • 請勿在名稱中使用反斜線、斜線、冒號、等號、與號或問號。

字元編碼

服務接受字組轉換 項目的 ASCII 和 UTF-8 字元編碼。 若為轉換,請對 SPR 表示法使用 ASCII 編碼,以及對 IPA 表示法使用 UTF-8 編碼。

空格

單字不能包含空格。 服務使用空格來描述輸入文字中的個別字組。

區分大小寫

單字區分大小寫。 例如,假設自訂模型包含項目 {word='Sun', translation='Sunday'}。 服務會將其預設發音套用至字組 sun,但會將自訂轉換套用至字組 Sun,因為只有後者具有起始大寫字母。

若要將自訂轉換套用至出現時可能有或沒有起始大寫的字組,請為這兩種可能出現的情況建立兩個項目。 只有在轉換要同時套用至字組的兩種形式時,才同時包含兩個項目。

上下文相關

部分字組的發音與上下文相關。 例如,請考量下列範例輸入句子:

St. Anthony lives on Henry St.

服務的預設發音規則會正確地將此文字合成為

Saint Anthony lives on Henry Street

不過,如果您將字串 St. 的預設發音規則置換成 saint,則服務不會再根據上下文對字組發音。 套用包括這類轉換的自訂模型,會導致服務將前一個輸入句子發音為

Saint Anthony lives on Henry saint

當您開發字組/轉換配對時,請考量這類案例。

尾端句點

服務只會將自訂模型中的字組套用至輸入文字中那些與字組完全相符的字串。 word 項目中的尾端 .(句點)會變更字組的合成方式:

  • 沒有尾端句點的字組 可以實際包含任何字元。 字元包括字母、數字、標點符號(尾隨句點除外)、非字母符號(例如 %&@ )、引號、圓括號、方括號等。 其轉換 可包含對服務的任何合法輸入,包括空格及 SSML 格式的語音表示法。
  • 具有尾端句點的字組 只能包含字母、句點及內部單引號(不可作為第一個或最後一個字元)。 字組的轉換 只能包含具有普通拼法,並以空格或連字號區隔的一般字組。 它不能包含語音表示法。

帶有尾隨句點的單字的範例是「div.」。假設自訂模型包含條目 {word='div.', translation='division'}。 服務不會將轉換套用至字串 "div",因為它不包含尾端句點,因此不符合項目。

外來字組的語音翻譯

語音轉換的一個用法是將外來字組的發音新增到自訂模型的基礎語言。 例如,您可以將法文字組的發音新增到以英文為基礎的自訂模型。 在此情況下,您必須使用自訂模型語言(英文)的音標。

相同的音標可能會針對不同的語言產生不同的聲音。 此外,並非所有語言都支援所有音標。 在定義轉換時,請務必使用自訂模型之基礎語言的音標。

使用 IBM SPR 項目

「符號語音表示法 (SPR)」是由 IBM 開發的專有語言相依格式,用於指定字組的發音。 對於每種支援的語言,SPR 包括標音字母、音節界限的符號,以及詞彙重音層次的符號。 下列基本規則適用於建立 SPR 項目:

  • 自訂介面為單字回傳的預設發音以「``(反引號)開頭,並括在[] (方括號)中。 例如,介面會針對字組 tomato 傳回下列發音:

    `[.0tx.1ma.0to]
    

    使用自訂作業介面的方法來指定字組的轉換時,請省略反引號和方括弧。

  • 您可以使用句點來指出轉換中的音節開頭,但句點是選用性的,不會影響字組的發音。 只有當您在字組的轉換中包含它們時,它們才會出現在字組的發音中。 請不要使用空格來指出音節界限。

  • IBM 建議您在具有字組主重音的母音前面加上 1 符號,但並非絕對必要。 如果您未指出重音,則服務會判定重音所在位置。 您也可以使用 2 符號來指出每個次重音位置,但使用 2 符號也是選用的。 只有當您在字組的轉換中包含它們時,它們才會出現在字組的發音中。

有關使用 SPR 的更多信息,請參閱 了解音標

使用日文項目

額外規則和 part_of_speech 欄位適用於在日文自訂模型中建立字組的項目:

  • 類似音轉換只能包含片假名 字元。 不接受日文漢字平假名 字元。

  • 建立字組的轉換(例如類似音或語音)時,您也可以指定選用的 part_of_speech 欄位來識別字組的詞性。 服務使用詞性來產生字組的正確語調。 如需完整清單,請參閱日文詞性

  • 您只能為任何字組建立單一項目,也只能為任何字組指定單一詞性。 您無法利用不同詞性(例如,名詞和動詞)為相同字組建立多個項目。 為存在於模型中的字組新增轉換會改寫字組的現有轉換,包括其詞性。

    為了提高合成語音的自然度,請勿為長短語建立自訂條目。 僅為單字或短語創建翻譯。 請注意,其他語言僅限翻譯單字。

  • 服務會從針對自訂模型定義的字組/轉換配對,套用最長的相符字組。 例如,考量自訂模型的下列三個項目。

    {
      "words": [
        {
          "word": "NY",
          "translation": "ニューヨーク",
          "part_of_speech": "Mesi"
        },
        {
          "word": "NYC",
          "translation": "ニューヨークシティ",
          "part_of_speech": "Mesi"
        },
        {
          "word": "YC",
          "translation": "ヨコハマチューカガイ",
          "part_of_speech": "Mesi"
        }
      ]
    }
    

    透過這些條目,假設服務接收以下輸入文字:一週間NYCを訪問した。 在本例中,服務會匹配單字NYC,因為NYCNY長,並且NYCYC之前匹配。

日文詞性

下表列出日文自訂項目支援的詞性。 如需指定日文自訂項目之詞性的相關資訊,請參閱將字組新增至日文自訂模型

日文詞性
part_of_speech 引數 日文意義 英文意義
Dosi Doushi 動詞
Fuku Fukishi 副詞
Gobi Gobi 字形變化
Hoka Hoka 其他(其本身具有特殊文法意義的字組,不適合任何其他詞性。 例如,ありがとう 代表“謝謝”。
Jodo Jodoushi 輔助動詞
Josi Joshi 後置助詞(例如,が の を 表示「of.」)
Kato Kantoushi 感歎詞
Kedo Keiyodoushi 形容詞動詞
Keyo Keiyoshi 形容詞(例如,美し 表示“美麗”,明る 表示“明亮”。)
Kigo Kigou 符號
Koyu Koyuumeishi 適當的名詞
Mesi Meishi 名詞
Reta Rentaishi 限定詞
Stbi Setsubiji 字尾
Stto Settoji 字首
Stzo Setsuzokushi 連接詞
Suji Suuji 數字