IBM Cloud Docs
言語サポート

言語サポート

コレクションの作成時に、コレクションの言語を指定します。 コレクションに追加するすべての文書は、同じ言語で記述する必要があります。

ディスカバリーは、マルチリンガル検索用に最適化されていません。 複数のコレクション (それぞれが別個の言語の文書を持つコレクション) を 1 つのプロジェクトに追加することはできますが、プロジェクトからの照会結果は予測不能になります。 結果には、ユーザーの照会の言語とは異なる言語の文書からの無関係なパッセージが含まれる場合があります。

以下の表では、各言語でサポートされている製品機能について説明します。

言語ごとの機能サポート
言語 サポートされる機能
アラビア語 (ar) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding
ボスニア語 (bs) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、品詞、正規表現
中国語 (簡体字) (zh-CN) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v1、品詞、句センチメント、正規表現、Smart Document Understanding、表の理解
中国語 (繁体字) (zh-TW) 拡張ルール・モデル、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、正規表現、 Machine Learning、光学式文字認識 v1、品詞、句センチメント、Smart Document Understanding、表の理解
クロアチア語 (hr) 分類器 (ドキュメントおよびテキスト)、カスタム・エンティティー、辞書、正規表現、品詞
チェコ語 (cs) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、句の評判、正規表現、Smart Document Understanding、Stemmer、表の理解
デンマーク語 (da) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding
オランダ語 (nl) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v2、品詞、句センチメント、正規表現、Smart Document Understanding、Stemmer、表の理解
英語 (en) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、契約、カスタム・エンティティー、辞書、文書の評判、キーワード、 Machine Learning、光学式文字認識 v2、品詞、句の評判、正規表現、Smart Document Understanding、Stemmer、表の理解
フィンランド語 (fi) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、品詞、正規表現、Smart Document Understanding、Stemmer、表の理解
フランス語 (fr) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書の評判、キーワード、 Machine Learning、光学式文字認識 v2、品詞、正規表現、Smart Document Understanding、Stemmer、表の理解
ドイツ語 (de) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書の評判、キーワード、 Machine Learning、光学式文字認識 v2、品詞、正規表現、Smart Document Understanding、Stemmer、表の理解
ヘブライ語 (he) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v2、品詞、正規表現、Smart Document Understanding、表の理解。 イメージ内のヘブライ語テキストの光学式文字認識 (OCR) 機能は、 Discoveryのベータ機能です。 詳しくは、 Release notes for Discovery for IBM Cloud を参照してください。
ヒンディ語 (hi) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、品詞、正規表現、Stemmer
イタリア語 (it) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding
日本語 (ja) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v1、品詞、句センチメント、正規表現、Smart Document Understanding、表の理解
韓国語 (ko) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書の評判、キーワード、 Machine Learning、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、表の理解
ノルウェー語 (Bokmål) (nb) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding
ノルウェー語 (ニーノシュク) (nn) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding
ポーランド語 (pl) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、表の理解
ブラジル・ポルトガル語 (pt-br) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書の評判、キーワード、 Machine Learning、光学式文字認識 v2、品詞、正規表現、Smart Document Understanding、Stemmer、表の理解
ルーマニア語 (ro) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、句の評判、正規表現、Smart Document Understanding、Stemmer、表の理解
ロシア語 (ru) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、句の評判、正規表現、Smart Document Understanding、Stemmer、表の理解
セルビア語 (sr)[1] 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、品詞、正規表現
スロバキア語 (sk) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、表の理解
スペイン語 (es) 拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v2、品詞、句センチメント、正規表現、Smart Document Understanding、Stemmer、表の理解
スウェーデン語 (sv) 分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding

光学式文字認識 (OCR) v2 は、2022 年 11 月 2 日にクラウド・マネージド・サービス・インスタンスで導入されました。 OCR v2 は、バージョン 4.7.1の IBM Cloud Pak for Data インスタンスで導入されました。

英語のみのサポート

以下の機能は、現在、英語でのみサポートされています。


  1. セルビア語は、ローマ字スクリプトのみをサポートしています。 ↩︎