IBM Cloud Docs
言語サポート

この文書は、IBM Watson® Knowledge Studio 上の IBM Cloud® に関するものです。 以前のバージョンの Knowledge Studio on IBM Marketplace 向けの資料を参照するには、このリンクをクリックしてください。

言語サポート

IBM Watson® Knowledge Studio は、モデルのトレーニングをいくつかの言語でサポートしています。

複数言語のサポートは、製品自体が翻訳されることを意味しません。 Knowledge Studio のユーザー・インターフェース、メッセージ、および資料は、英語でのみ提供されています。

以下の言語でモデルをトレーニングできます。

  • 英語 (デフォルト言語)
  • アラビア語
  • ブラジル・ポルトガル語
  • 中国語 (簡体字)
  • 中国語 (繁体字)
  • ドイツ語
  • フランス語
  • ドイツ語
  • イタリア語
  • 日本語
  • 韓国語
  • スペイン語

サポートには、ワークスペースへのこれらの言語の文書の追加、辞書の追加、事前アノテーションの実行、グランド・トゥルース・エディターを使用した文書へのアノテーション付け、および、機械学習モデルのトレーニングを行う機能が含まれています。 言語を選択すると、辞書項目の処理、テキストのトークン化、およびセンテンスの分割に、言語固有のテンプレートが適用されるようになります。 さまざまな言語の辞書がどのように処理されるのかについては、『辞書』を参照してください。

ルール・エディターおよびルール・ベース・モデルは、双方向テキストを処理できないため、アラビア語の文書に使用することはできません。

制約事項

基礎にある機械学習テクノロジーでの文字制限のため、タイプ・システム内の項目はスペースを含むことができず、以下の ASCII 文字のみを含むことができます。

  • A から Z、および a から z
  • 0から9まで
  • 下線文字: _

次の規則も適用されます。

  • 名前の先頭文字は英字でなければなりません。
  • エンティティー・タイプ名の長さは 64 文字以下でなければなりません。
  • 関係タイプ名の長さは 128 文字以下でなければなりません。

したがって、例えば、ヒューマン・アノテーターがグランド・トゥルース・エディターで日本語テキストにアノテーションを付ける際、適用可能なエンティティー・タイプ名および関係タイプ名は日本語ではありません。

関連するタスク

アラビア語サポートの構成