IBM Cloud Docs
カスタム項目作成のルール

カスタム項目作成のルール

カスタム・モデルへのカスタム項目 (単語/トランスレーションのペア) の設定には、次のルールとガイドラインが適用されます。

最大カスタム項目数および制限

すべてのカスタム・モデルおよび項目に以下の制限が適用されます。

  • カスタム項目の単語には、最大 49 文字を含めることができます。
  • カスタム項目のトランスレーションには、最大 499 文字を含めることができます。
  • カスタム・モデルには、最大 20,000 個のカスタム項目を含めることができます。
  • カスタム・モデルには、最大 1000 個のカスタム・プロンプトを含めることができます。
  • 名前にバックスラッシュ、スラッシュ、コロン、イコール記号、アンパサンド、クエスチョンマークを使用しないでください。

文字エンコード

サービスは、単語 およびトランスレーション 項目に対して ASCII および UTF-8 文字エンコードを受け入れます。 トランスレーションについては、SPR 表記を使用する場合は ASCII エンコードを、IPA 表記を使用する場合は UTF-8 エンコードを使用してください。

空白

単語に空白文字を含めることはできません。 空白文字は、入力テキスト内の個々の単語を区切るために使用します。

大/小文字の区別

単語には大/小文字の区別があります。 例えば、カスタム・モデルに {word='Sun', translation='Sunday'} という項目が含まれているとします。 サービスは、単語 sun にはデフォルトの発音を適用しますが、単語 Sun にはカスタム・トランスレーションを適用します (後者のみ、先頭文字が大文字であるため)。

先頭文字が大文字化されて表示される場合とされない場合がある単語にカスタム・トランスレーションを適用するには、表示される可能性がある両方の形式用に 2 つの項目を作成します。 両方の形式の単語にトランスレーションを適用する場合にのみ、両方の項目を含めてください。

コンテキスト依存性

文脈によって発音が異なる単語があります。 例えば、以下の入力文例について考えます。

St. Anthony lives on Henry St.

サービスのデフォルトの発音ルールでは、このテキストは以下のように正しく合成されます。

Saint Anthony lives on Henry Street

一方、ストリング St.saint に変換するようにデフォルトの発音ルールをオーバーライドした場合、サービスは文脈に応じた単語の発音を行えなくなります。 このようなトランスレーションが含まれたカスタム・モデルを適用すると、サービスで上記入力文が以下のように発音されるようになります。

Saint Anthony lives on Henry saint

単語/トランスレーションのペアを作成する場合は、このようなケースを考慮してください。

末尾のピリオド

サービスがカスタム・モデルの単語を適用するのは、完全に同じ単語のストリングが入力テキスト内に出現した場合のみです。 以下に示すように、登録した単語の末尾の . (ピリオド) によって、単語の音声合成方法は変わります。

  • 末尾にピリオドがない単語 は、実質的にすべての文字を含めることができます。 文字には、文字、数字、句読点 (末尾のピリオド以外)、非文字記号 (%&@など)、引用符、括弧、大括弧などが含まれます。 トランスレーション には、空白文字や SSML フォーマットの表音表記など、サービスに対する任意の正しい入力を含めることができます。
  • 末尾のピリオドがある単語 は、文字、ピリオド、内部のアポストロフィ (先頭文字および末尾文字としては不可) のみを含めることができます。 単語のトランスレーション には、空白文字またはハイフンで区切った通常のつづりの通常の単語のみを含めることができます。 表音表記を含めることはできません。

末尾にピリオドが付く単語の例として div."がある。カスタムモデルに "{word='div.', translation='division'} という項目があるとします。 サービスは、ストリング「div」にトランスレーションを適用しません。このストリングには、末尾のピリオドが含まれておらず、項目に一致しないからです。

外国の単語に関する表音トランスレーション

表音トランスレーションの使用法の 1 つに、外国の単語の発音をカスタム・モデルのベース言語に追加することがあります。 例えば、フランス語の単語の発音を英語ベースのカスタム・モデルに追加することもできます。 この場合、カスタム・モデルの言語である英語の表音記号を使用しなければなりません。

同一の表音記号でさまざまな言語のさまざまな音を作成できます。 また、言語によってはサポートされていない表音記号もあります。 トランスレーションを定義する際には、カスタム・モデルのベース言語の表音記号を使用していることを確認してください。

IBM SPR 項目の処理

Symbolic Phonetic Representation (SPR) は、単語の発音を指定するために IBM が開発した、言語に依存する専有のフォーマットです。 サポートされる各言語について、SPR には、音素文字、音節境界記号、語彙強勢レベル記号が含まれます。 SPR 項目の作成には、以下の基本ルールが適用されます。

  • カスタマイズインターフェイスが単語に対して返すデフォルトの発音は、```(バッククォート)で始まり、'[](角括弧)で囲まれています。 例えば、このインターフェースは、単語 tomato に対して以下の発音を返します。

    `[.0tx.1ma.0to]
    

    カスタマイズ・インターフェースのメソッドで単語のトランスレーションを指定する際には、逆引用符と大括弧は省略してください。

  • ピリオドを使用してトランスレーションの音節の開始を示すことができますが、ピリオドはオプションであり、単語の発音には影響しません。 単語のトランスレーションに含めた場合にのみ、単語の発音に表示されます。 音節境界を示すためにスペースを使用しないでください。

  • IBM は、単語の第 1 強勢が置かれる母音の前に記号 1 を置くことをお勧めします。しかし、これは厳密に必要なわけではありません。 ユーザーが指定しない場合は、サービスが強勢を置く位置を決定します。 記号 2 を使用して第 2 強勢の位置を指定することもできますが、この記号 2 の使用も任意です。 単語のトランスレーションに含めた場合にのみ、単語の発音に表示されます。

SPR の操作について詳しくは、表音記号についてを参照してください。

日本語の項目の処理

日本語のカスタム・モデルの単語の項目を作成する際には、以下の追加のルールと part_of_speech フィールドが適用されます。

  • 同音異字トランスレーションにはカタカナ 文字しか含めることができません。 漢字 およびひらがな 文字は許可されません。

  • 単語のトランスレーション (同音異字または表音) を作成するときには、オプションの part_of_speech フィールドを使用して単語の品詞を指定することもできます。 サービスは、品詞を使用して、単語の正しいイントネーションを生成します。 品詞の一覧については、日本語の品詞を参照してください。

  • どの単語についても項目は 1 つしか作成できません。また、単語の品詞は 1 つしか指定できません。 同じ単語に対して複数の項目を作成し、異なる品詞 (名詞と動詞など) を指定することはできません。 モデル内の既存の単語にトランスレーションを追加すると、その単語の既存のトランスレーション (品詞を含む) が上書きされます。

    合成音声の自然性を向上させるために、長い語句に対してカスタム項目を作成しないでください。 単一の単語または短い句の翻訳のみを作成します。 他の言語では、翻訳が単一の単語のみに制限されることに注意してください。

  • サービスは、カスタム・モデルに定義されている単語/トランスレーションのペアのうち、一致する最も長い単語を適用します。 例えば、カスタム・モデルに以下の 3 つの項目が登録されているとします。

    {
      "words": [
        {
          "word": "NY",
          "translation": "ニューヨーク",
          "part_of_speech": "Mesi"
        },
        {
          "word": "NYC",
          "translation": "ニューヨークシティ",
          "part_of_speech": "Mesi"
        },
        {
          "word": "YC",
          "translation": "ヨコハマチューカガイ",
          "part_of_speech": "Mesi"
        }
      ]
    }
    

    With these entries, assume that the service receives the following input text: 一週間NYCを訪問した. この場合、'NYCは'NYよりも長く、'NYC'NYC前にマッチするので、サービスは'YC単語にマッチする。

日本語の品詞

以下の表に、日本語のカスタム項目でサポートされる品詞をリストします。 日本語のカスタム項目の品詞を指定する方法について詳しくは、日本語のカスタム・モデルへの単語の追加を参照してください。

日本語の品詞
part_of_speech引数 日本語の意味 英語の意味
Dosi 動詞 Verb
Fuku 副詞 Adverb
Gobi 語尾 Inflection
Hoka Other (音声の他のどの品詞とも合致しない、
文法的に特別な意味がある単語。 例えば、'ありがとう は "thank you "を表す)
Jodo 助動詞 Auxiliary verb
Josi 助詞 後置助詞(例えば、"の "の場合は が の を
Kato 間投詞 Interjection
Kedo 形容動詞 Adjective verb
Keyo 形容詞 形容詞(例えば、美し は「美しい」、明る は「明るい」。)
Kigo 記号 記号
Koyu 固有名詞 Proper noun
Mesi 名詞 Noun
Reta 連体詞 Determiner
Stbi 接尾辞 接尾部
Stto 接頭辞 接頭部
Stzo 接続詞 Conjunction
Suji 数字 Numeral