Soporte de idiomas

Cuando crea una colección, especifica el idioma de la colección. Todos los documentos que añada a una colección deben estar escritos en el mismo idioma.

El descubrimiento no está optimizado para la búsqueda multilingüe. Aunque puede añadir varias colecciones, cada una con documentos en un idioma distinto, en un proyecto, los resultados de la consulta del proyecto serán imprevisibles. Los resultados pueden incluir pasajes irrelevantes de un documento en un idioma diferente del idioma de la consulta del usuario.

En la tabla siguiente se describen las características del producto que están soportadas en cada idioma.

Soporte de características por idioma
Idioma	Características soportadas
Árabe (`ar`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Smart Document Understanding, Stemmer, Comprensión de tablas
Bosnio (`bs`)	Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Partes del discurso, Expresiones regulares
Chino simplificado (`zh-CN`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Frase opinión, Expresiones regulares, Comprensión de documentos inteligentes, Comprensión de tablas
Chino tradicional ( `zh-TW` )	Modelos de reglas avanzadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Expresiones regulares, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Sentimiento de frase, Comprensión de documentos inteligentes, Comprensión de tablas
Croata (`hr`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Expresiones regulares, Partes del discurso
Checo (`cs`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Sentimiento de frase, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas
Danés (`da`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas
Holandés (`nl`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documentos, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v2, Partes del discurso, Frase opinión, Expresiones regulares, Comprensión de documentos inteligentes, Estimista, Comprensión de tablas
Inglés (`en`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (documento y texto), Contratos, Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento óptico de caracteres v2, Partes del discurso, Frase opinión, Expresiones regulares, Comprensión inteligente de documentos, Estemmer, Comprensión de tablas
Finés (`fi`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Estibador, Comprensión de tablas
Francés (`fr`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (documento y texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v2, Partes del discurso, Expresiones regulares, Smart Document Understanding, Stemmer, Comprensión de tablas
Alemán (`de`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (documento y texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v2, Partes del discurso, Expresiones regulares, Smart Document Understanding, Stemmer, Comprensión de tablas
Hebreo (`he`)	Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v2, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Comprensión de tablas. La característica de reconocimiento óptico de caracteres (OCR) para texto en idioma hebreo en imágenes es una característica beta en Discovery. Para obtener más información, consulte Notas del release para Discovery para IBM Cloud.
Hindi (`hi`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Partes del discurso, Expresiones regulares, Estemmer
Italiano (`it`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Smart Document Understanding, Stemmer, Comprensión de tablas
Japonés (`ja`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Frase opinión, Expresiones regulares, Comprensión de documentos inteligentes, Comprensión de tablas
Coreano (`ko`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Comprensión de tablas
Noruego (Bokmål) (`nb`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas
Noruego (Nynorsk) (`nn`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas
Polaco (`pl`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento óptico de caracteres v1, Partes del discurso, Expresiones regulares, Comprensión inteligente de documentos, Comprensión de tablas
Portugués (Brasil) (`pt-br`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (documento y texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v2, Partes del discurso, Expresiones regulares, Smart Document Understanding, Stemmer, Comprensión de tablas
Rumano (`ro`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Sentimiento de frase, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas
Ruso (`ru`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Sentimiento de frase, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas
Serbio (`sr`)^[1]	Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Partes del discurso, Expresiones regulares
Eslovaco (`sk`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento óptico de caracteres v1, Partes del discurso, Expresiones regulares, Comprensión inteligente de documentos, Comprensión de tablas
Español (`es`)	Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documentos, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v2, Partes del discurso, Frase opinión, Expresiones regulares, Comprensión de documentos inteligentes, Estimista, Comprensión de tablas
Sueco (`sv`)	Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas

El reconocimiento óptico de caracteres (OCR) v2 se introdujo en las instancias de servicio gestionadas en la nube el 2 de noviembre de 2022. OCR v2 se ha introducido en instancias de IBM Cloud Pak for Data con la versión 4.7.1.

Soporte sólo para inglés

Actualmente solo se da soporte en inglés a las siguientes características:

En serbio solo se da soporte al script Latin. ↩︎