言語サポート
コレクションの作成時に、コレクションの言語を指定します。 コレクションに追加するすべての文書は、同じ言語で記述する必要があります。
ディスカバリーは、マルチリンガル検索用に最適化されていません。 複数のコレクション (それぞれが別個の言語の文書を持つコレクション) を 1 つのプロジェクトに追加することはできますが、プロジェクトからの照会結果は予測不能になります。 結果には、ユーザーの照会の言語とは異なる言語の文書からの無関係なパッセージが含まれる場合があります。
以下の表では、各言語でサポートされている製品機能について説明します。
言語 | サポートされる機能 |
---|---|
アラビア語 (ar ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding |
ボスニア語 (bs ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、品詞、正規表現 |
中国語 (簡体字) (zh-CN ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v1、品詞、句センチメント、正規表現、Smart Document Understanding、表の理解 |
中国語 (繁体字) (zh-TW ) |
拡張ルール・モデル、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、正規表現、 Machine Learning、光学式文字認識 v1、品詞、句センチメント、Smart Document Understanding、表の理解 |
クロアチア語 (hr ) |
分類器 (ドキュメントおよびテキスト)、カスタム・エンティティー、辞書、正規表現、品詞 |
チェコ語 (cs ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、句の評判、正規表現、Smart Document Understanding、Stemmer、表の理解 |
デンマーク語 (da ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding |
オランダ語 (nl ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v2、品詞、句センチメント、正規表現、Smart Document Understanding、Stemmer、表の理解 |
英語 (en ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、契約、カスタム・エンティティー、辞書、文書の評判、キーワード、 Machine Learning、光学式文字認識 v2、品詞、句の評判、正規表現、Smart Document Understanding、Stemmer、表の理解 |
フィンランド語 (fi ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、品詞、正規表現、Smart Document Understanding、Stemmer、表の理解 |
フランス語 (fr ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書の評判、キーワード、 Machine Learning、光学式文字認識 v2、品詞、正規表現、Smart Document Understanding、Stemmer、表の理解 |
ドイツ語 (de ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書の評判、キーワード、 Machine Learning、光学式文字認識 v2、品詞、正規表現、Smart Document Understanding、Stemmer、表の理解 |
ヘブライ語 (he ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v2、品詞、正規表現、Smart Document Understanding、表の理解。 イメージ内のヘブライ語テキストの光学式文字認識 (OCR) 機能は、 Discoveryのベータ機能です。 詳しくは、 Release notes for Discovery for IBM Cloud を参照してください。 |
ヒンディ語 (hi ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、品詞、正規表現、Stemmer |
イタリア語 (it ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding |
日本語 (ja ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v1、品詞、句センチメント、正規表現、Smart Document Understanding、表の理解 |
韓国語 (ko ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書の評判、キーワード、 Machine Learning、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、表の理解 |
ノルウェー語 (Bokmål) (nb ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding |
ノルウェー語 (ニーノシュク) (nn ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding |
ポーランド語 (pl ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、表の理解 |
ブラジル・ポルトガル語 (pt-br ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書の評判、キーワード、 Machine Learning、光学式文字認識 v2、品詞、正規表現、Smart Document Understanding、Stemmer、表の理解 |
ルーマニア語 (ro ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、句の評判、正規表現、Smart Document Understanding、Stemmer、表の理解 |
ロシア語 (ru ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、句の評判、正規表現、Smart Document Understanding、Stemmer、表の理解 |
セルビア語 (sr )[1] |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、品詞、正規表現 |
スロバキア語 (sk ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、表の理解 |
スペイン語 (es ) |
拡張ルール・モデル、組み込みエンティティー、分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、文書センチメント、キーワード、 Machine Learning、光学式文字認識 v2、品詞、句センチメント、正規表現、Smart Document Understanding、Stemmer、表の理解 |
スウェーデン語 (sv ) |
分類器 (文書およびテキスト)、カスタム・エンティティー、辞書、光学式文字認識 v1、品詞、正規表現、Smart Document Understanding、Stemmer、Table Understanding |
光学式文字認識 (OCR) v2 は、2022 年 11 月 2 日にクラウド・マネージド・サービス・インスタンスで導入されました。 OCR v2 は、バージョン 4.7.1の IBM Cloud Pak for Data インスタンスで導入されました。
英語のみのサポート
以下の機能は、現在、英語でのみサポートされています。
- 契約プロジェクト・タイプのドキュメント取得
- IBM Cloudパターン(ベータ)
-
セルビア語は、ローマ字スクリプトのみをサポートしています。 ↩︎