IBM Cloud Docs
语言支持

语言支持

创建集合时,指定集合的语言。 您添加到集合的所有文档都必须以相同的语言编写。

发现未针对多语言搜索进行优化。 虽然您可以将多个集合 (每个集合都具有单独语言的文档) 添加到一个项目中,但该项目的查询结果将不可预测。 结果可能包含来自文档的不相关段落,其语言与用户查询的语言不同。

下表描述了每种语言支持的产品功能部件。

每种语言的功能支持
语言 支持的功能
阿拉伯语 (ar) 高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解
波斯尼亚语 ( bs ) 分类器 (文档和文本),定制实体,字典,词性,正则表达式
简体中文 (zh-CN) 高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v1,词性,短语观点,正则表达式,智能文档理解,表理解
繁体中文 (zh-TW) 高级规则模型,分类器 (文档和文本),定制实体,字典,正则表达式,Machine Learning,光学字符识别 v1,词性,短语观点,智能文档理解,表理解
克罗地亚语 ( hr ) 分类器 (文档和文本),定制实体,字典,正则表达式,词性
捷克语 (cs) 分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解
丹麦语 (da) 分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解
荷兰语 (nl) 高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解
英语 (en) 高级规则模型,内置实体,分类器 (文档和文本),合同,定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解
芬兰语 (fi) 分类器 (文档和文本),定制实体,字典,词性,正则表达式,智能文档理解,Stemmer,表理解
法语 (fr) 高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,正则表达式,智能文档理解,Stemmer,表理解
德语 (de) 高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,正则表达式,智能文档理解,Stemmer,表理解
希伯来语 (he) 分类器 (文档和文本),定制实体,字典,光学字符识别 v2,词性,正则表达式,智能文档理解,表理解。 图像中希伯来语文本的光学字符识别 (OCR) 功能是 Discovery中的 Beta 功能。 有关更多信息,请参阅 IBM Cloud 的 Discovery 发行说明
印地语 ( hi ) 分类器 (文档和文本),定制实体,字典,词性,正则表达式,Stemmer
意大利语 (it) 高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解
日语 (ja) 高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v1,词性,短语观点,正则表达式,智能文档理解,表理解
韩语 (ko) 高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v1,词性,正则表达式,智能文档理解,表理解
挪威语 (Bokmål) (nb) 分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解
挪威语(尼诺斯克语)(nn) 分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解
波兰语 (pl) 分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,表理解
巴西葡萄牙语 (pt-br) 高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,正则表达式,智能文档理解,Stemmer,表理解
罗马尼亚语 (ro) 分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解
俄语 (ru) 分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解
塞尔维亚语 (sr)[1] 分类器 (文档和文本),定制实体,字典,词性,正则表达式
斯洛伐克语 (sk) 分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,表理解
西班牙语 (es) 高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解
瑞典语 (sv) 分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解

在 2022 年 11 月 2 在云管理的服务实例中引入了光学字符识别 (OCR) v2。 在版本为 4.7.1的 IBM Cloud Pak for Data 实例中引入了 OCR v2。

仅限英语的支持

目前,以下功能仅支持英语:


  1. 塞尔维亚语仅支持拉丁文脚本。 ↩︎