Soporte de idiomas
Cuando crea una colección, especifica el idioma de la colección. Todos los documentos que añada a una colección deben estar escritos en el mismo idioma.
El descubrimiento no está optimizado para la búsqueda multilingüe. Aunque puede añadir varias colecciones, cada una con documentos en un idioma distinto, en un proyecto, los resultados de la consulta del proyecto serán imprevisibles. Los resultados pueden incluir pasajes irrelevantes de un documento en un idioma diferente del idioma de la consulta del usuario.
En la tabla siguiente se describen las características del producto que están soportadas en cada idioma.
Idioma | Características soportadas |
---|---|
Árabe (ar ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Smart Document Understanding, Stemmer, Comprensión de tablas |
Bosnio (bs ) |
Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Partes del discurso, Expresiones regulares |
Chino simplificado (zh-CN ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Frase opinión, Expresiones regulares, Comprensión de documentos inteligentes, Comprensión de tablas |
Chino tradicional ( zh-TW ) |
Modelos de reglas avanzadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Expresiones regulares, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Sentimiento de frase, Comprensión de documentos inteligentes, Comprensión de tablas |
Croata (hr ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Expresiones regulares, Partes del discurso |
Checo (cs ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Sentimiento de frase, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas |
Danés (da ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas |
Holandés (nl ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documentos, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v2, Partes del discurso, Frase opinión, Expresiones regulares, Comprensión de documentos inteligentes, Estimista, Comprensión de tablas |
Inglés (en ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (documento y texto), Contratos, Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento óptico de caracteres v2, Partes del discurso, Frase opinión, Expresiones regulares, Comprensión inteligente de documentos, Estemmer, Comprensión de tablas |
Finés (fi ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Estibador, Comprensión de tablas |
Francés (fr ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (documento y texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v2, Partes del discurso, Expresiones regulares, Smart Document Understanding, Stemmer, Comprensión de tablas |
Alemán (de ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (documento y texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v2, Partes del discurso, Expresiones regulares, Smart Document Understanding, Stemmer, Comprensión de tablas |
Hebreo (he ) |
Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v2, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Comprensión de tablas. La característica de reconocimiento óptico de caracteres (OCR) para texto en idioma hebreo en imágenes es una característica beta en Discovery. Para obtener más información, consulte Notas del release para Discovery para IBM Cloud. |
Hindi (hi ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Partes del discurso, Expresiones regulares, Estemmer |
Italiano (it ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Smart Document Understanding, Stemmer, Comprensión de tablas |
Japonés (ja ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Frase opinión, Expresiones regulares, Comprensión de documentos inteligentes, Comprensión de tablas |
Coreano (ko ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Comprensión de tablas |
Noruego (Bokmål) (nb ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas |
Noruego (Nynorsk) (nn ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas |
Polaco (pl ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento óptico de caracteres v1, Partes del discurso, Expresiones regulares, Comprensión inteligente de documentos, Comprensión de tablas |
Portugués (Brasil) (pt-br ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (documento y texto), Entidades personalizadas, Diccionario, Opinión de documento, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v2, Partes del discurso, Expresiones regulares, Smart Document Understanding, Stemmer, Comprensión de tablas |
Rumano (ro ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Sentimiento de frase, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas |
Ruso (ru ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Sentimiento de frase, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas |
Serbio (sr )[1] |
Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Partes del discurso, Expresiones regulares |
Eslovaco (sk ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento óptico de caracteres v1, Partes del discurso, Expresiones regulares, Comprensión inteligente de documentos, Comprensión de tablas |
Español (es ) |
Modelos de reglas avanzadas, Entidades incorporadas, Clasificador (Documento y Texto), Entidades personalizadas, Diccionario, Opinión de documentos, Palabras clave, Machine Learning, Reconocimiento de caracteres ópticos v2, Partes del discurso, Frase opinión, Expresiones regulares, Comprensión de documentos inteligentes, Estimista, Comprensión de tablas |
Sueco (sv ) |
Clasificador (Documento y texto), Entidades personalizadas, Diccionario, Reconocimiento de caracteres ópticos v1, Partes del discurso, Expresiones regulares, Comprensión de documentos inteligentes, Estemmer, Comprensión de tablas |
El reconocimiento óptico de caracteres (OCR) v2 se introdujo en las instancias de servicio gestionadas en la nube el 2 de noviembre de 2022. OCR v2 se ha introducido en instancias de IBM Cloud Pak for Data con la versión 4.7.1.
Soporte sólo para inglés
Actualmente solo se da soporte en inglés a las siguientes características:
-
En serbio solo se da soporte al script Latin. ↩︎