语言支持
创建集合时,指定集合的语言。 您添加到集合的所有文档都必须以相同的语言编写。
发现未针对多语言搜索进行优化。 虽然您可以将多个集合 (每个集合都具有单独语言的文档) 添加到一个项目中,但该项目的查询结果将不可预测。 结果可能包含来自文档的不相关段落,其语言与用户查询的语言不同。
下表描述了每种语言支持的产品功能部件。
语言 | 支持的功能 |
---|---|
阿拉伯语 (ar ) |
高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解 |
波斯尼亚语 ( bs ) |
分类器 (文档和文本),定制实体,字典,词性,正则表达式 |
简体中文 (zh-CN ) |
高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v1,词性,短语观点,正则表达式,智能文档理解,表理解 |
繁体中文 (zh-TW ) |
高级规则模型,分类器 (文档和文本),定制实体,字典,正则表达式,Machine Learning,光学字符识别 v1,词性,短语观点,智能文档理解,表理解 |
克罗地亚语 ( hr ) |
分类器 (文档和文本),定制实体,字典,正则表达式,词性 |
捷克语 (cs ) |
分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解 |
丹麦语 (da ) |
分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解 |
荷兰语 (nl ) |
高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解 |
英语 (en ) |
高级规则模型,内置实体,分类器 (文档和文本),合同,定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解 |
芬兰语 (fi ) |
分类器 (文档和文本),定制实体,字典,词性,正则表达式,智能文档理解,Stemmer,表理解 |
法语 (fr ) |
高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,正则表达式,智能文档理解,Stemmer,表理解 |
德语 (de ) |
高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,正则表达式,智能文档理解,Stemmer,表理解 |
希伯来语 (he ) |
分类器 (文档和文本),定制实体,字典,光学字符识别 v2,词性,正则表达式,智能文档理解,表理解。 图像中希伯来语文本的光学字符识别 (OCR) 功能是 Discovery中的 Beta 功能。 有关更多信息,请参阅 IBM Cloud 的 Discovery 发行说明。 |
印地语 ( hi ) |
分类器 (文档和文本),定制实体,字典,词性,正则表达式,Stemmer |
意大利语 (it ) |
高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解 |
日语 (ja ) |
高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v1,词性,短语观点,正则表达式,智能文档理解,表理解 |
韩语 (ko ) |
高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v1,词性,正则表达式,智能文档理解,表理解 |
挪威语 (Bokmål) (nb ) |
分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解 |
挪威语(尼诺斯克语)(nn ) |
分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解 |
波兰语 (pl ) |
分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,表理解 |
巴西葡萄牙语 (pt-br ) |
高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,正则表达式,智能文档理解,Stemmer,表理解 |
罗马尼亚语 (ro ) |
分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解 |
俄语 (ru ) |
分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解 |
塞尔维亚语 (sr )[1] |
分类器 (文档和文本),定制实体,字典,词性,正则表达式 |
斯洛伐克语 (sk ) |
分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,表理解 |
西班牙语 (es ) |
高级规则模型,内置实体,分类器 (文档和文本),定制实体,字典,文档观点,关键字,Machine Learning,光学字符识别 v2,词性,短语观点,正则表达式,智能文档理解,Stemmer,表理解 |
瑞典语 (sv ) |
分类器 (文档和文本),定制实体,字典,光学字符识别 v1,词性,正则表达式,智能文档理解,Stemmer,表理解 |
在 2022 年 11 月 2 在云管理的服务实例中引入了光学字符识别 (OCR) v2。 在版本为 4.7.1的 IBM Cloud Pak for Data 实例中引入了 OCR v2。
仅限英语的支持
目前,以下功能仅支持英语:
- 合同项目类型的文档检索
- IBM Cloud模式(Beta)
-
塞尔维亚语仅支持拉丁文脚本。 ↩︎