この文書は、IBM Watson® Knowledge Studio 上の IBM Cloud® に関するものです。 以前のバージョンの Knowledge Studio on IBM Marketplace 向けの資料を参照するには、このリンクをクリックしてください。
言語サポート
IBM Watson® Knowledge Studio は、モデルのトレーニングをいくつかの言語でサポートしています。
複数言語のサポートは、製品自体が翻訳されることを意味しません。 Knowledge Studio のユーザー・インターフェース、メッセージ、および資料は、英語でのみ提供されています。
以下の言語でモデルをトレーニングできます。
- 英語 (デフォルト言語)
- アラビア語
- ブラジル・ポルトガル語
- 中国語 (簡体字)
- 中国語 (繁体字)
- ドイツ語
- フランス語
- ドイツ語
- イタリア語
- 日本語
- 韓国語
- スペイン語
サポートには、ワークスペースへのこれらの言語の文書の追加、辞書の追加、事前アノテーションの実行、グランド・トゥルース・エディターを使用した文書へのアノテーション付け、および、機械学習モデルのトレーニングを行う機能が含まれています。 言語を選択すると、辞書項目の処理、テキストのトークン化、およびセンテンスの分割に、言語固有のテンプレートが適用されるようになります。 さまざまな言語の辞書がどのように処理されるのかについては、『辞書』を参照してください。
ルール・エディターおよびルール・ベース・モデルは、双方向テキストを処理できないため、アラビア語の文書に使用することはできません。
制約事項
基礎にある機械学習テクノロジーでの文字制限のため、タイプ・システム内の項目はスペースを含むことができず、以下の ASCII 文字のみを含むことができます。
- A から Z、および a から z
- 0から9まで
- 下線文字: _
次の規則も適用されます。
- 名前の先頭文字は英字でなければなりません。
- エンティティー・タイプ名の長さは 64 文字以下でなければなりません。
- 関係タイプ名の長さは 128 文字以下でなければなりません。
したがって、例えば、ヒューマン・アノテーターがグランド・トゥルース・エディターで日本語テキストにアノテーションを付ける際、適用可能なエンティティー・タイプ名および関係タイプ名は日本語ではありません。