Sprachunterstützung

Beim Erstellen einer Objektgruppe geben Sie die Sprache der Objektgruppe an. Alle Dokumente, die Sie einer Sammlung hinzufügen, müssen in derselben Sprache geschrieben sein.

Die Erkennung ist nicht für mehrsprachige Suche optimiert. Sie können zwar mehrere Sammlungen, jede mit Dokumenten in einer separaten Sprache, zu einem Projekt hinzufügen, die Abfrageergebnisse des Projekts sind jedoch unvorhersehbar. Die Ergebnisse können irrelevante Passagen aus einem Dokument in einer Sprache enthalten, die sich von der Sprache der Benutzerabfrage unterscheidet.

In der folgenden Tabelle werden die Produktfunktionen beschrieben, die in den einzelnen Sprachen unterstützt werden.

Featureunterstützung pro Sprache
Sprache	Unterstützte Funktionen
Arabisch (`ar`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis
Bosnisch (`bs`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Wortarten, Reguläre Ausdrücke
Vereinfachtes Chinesisch (`zh-CN`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis
Chinesisch, traditionell ( `zh-TW` )	Erweiterte Regelmodelle, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, reguläre Ausdrücke, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Smart Document Understanding, Tabellenverständnis
Kroatisch (`hr`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Reguläre Ausdrücke, Wortarten
Tschechisch (`cs`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis
Dänisch (`da`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterbuch, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis
Niederländisch (`nl`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis
Englisch (`en`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Verträge, Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis
Finnisch (`fi`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis
Französisch (`fr`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis
Deutsch (`de`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis
Hebräisch (`he`)	Classifier (Dokument und Text), Angepasste Entitäten, Wörterbuch, Optische Zeichenerkennung v2, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis. Die Funktion für optische Zeichenerkennung (OCR) für Text in hebräischer Sprache in Bildern ist eine Betafunktion in Discovery. Weitere Informationen finden Sie unter Releaseinformationen für Discovery für IBM Cloud.
Hindi (`hi`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Wortarten, reguläre Ausdrücke, Algorithmus für Normalformenreduktion
Italienisch (`it`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis
Japanisch (`ja`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis
Koreanisch (`ko`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis
Norwegisch (Bokmål) (`nb`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterbuch, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis
Norwegisch (Nynorsk) (`nn`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterbuch, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis
Polnisch (`pl`)	Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis
Brasilianisches Portugiesisch (`pt-br`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis
Rumänisch (`ro`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis
Russisch (`ru`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis
Serbisch (`sr`)^[1]	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Wortarten, Reguläre Ausdrücke
Slowakisch (`sk`)	Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis
Spanisch (`es`)	Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis
Schwedisch (`sv`)	Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterbuch, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis

Die optische Zeichenerkennung (OCR) v2 wurde in Cloud-verwalteten Serviceinstanzen am 2. November 2022 eingeführt. OCR v2 wurde in IBM Cloud Pak for Data-Instanzen mit Version 4.7.1eingeführt.

Ausschließliche Unterstützung in Englisch

Die folgenden Features werden gegenwärtig nur auf Englisch unterstützt:

Dokumentabruf für Vertragsprojekttyp
IBM CloudPatterns(Betaversion)

Für Serbisch wird nur der lateinische Zeichensatz unterstützt. ↩︎