Sprachunterstützung
Beim Erstellen einer Objektgruppe geben Sie die Sprache der Objektgruppe an. Alle Dokumente, die Sie einer Sammlung hinzufügen, müssen in derselben Sprache geschrieben sein.
Die Erkennung ist nicht für mehrsprachige Suche optimiert. Sie können zwar mehrere Sammlungen, jede mit Dokumenten in einer separaten Sprache, zu einem Projekt hinzufügen, die Abfrageergebnisse des Projekts sind jedoch unvorhersehbar. Die Ergebnisse können irrelevante Passagen aus einem Dokument in einer Sprache enthalten, die sich von der Sprache der Benutzerabfrage unterscheidet.
In der folgenden Tabelle werden die Produktfunktionen beschrieben, die in den einzelnen Sprachen unterstützt werden.
Sprache | Unterstützte Funktionen |
---|---|
Arabisch (ar ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis |
Bosnisch (bs ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Wortarten, Reguläre Ausdrücke |
Vereinfachtes Chinesisch (zh-CN ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis |
Chinesisch, traditionell ( zh-TW ) |
Erweiterte Regelmodelle, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, reguläre Ausdrücke, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Smart Document Understanding, Tabellenverständnis |
Kroatisch (hr ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Reguläre Ausdrücke, Wortarten |
Tschechisch (cs ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis |
Dänisch (da ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterbuch, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis |
Niederländisch (nl ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis |
Englisch (en ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Verträge, Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis |
Finnisch (fi ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis |
Französisch (fr ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis |
Deutsch (de ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis |
Hebräisch (he ) |
Classifier (Dokument und Text), Angepasste Entitäten, Wörterbuch, Optische Zeichenerkennung v2, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis. Die Funktion für optische Zeichenerkennung (OCR) für Text in hebräischer Sprache in Bildern ist eine Betafunktion in Discovery. Weitere Informationen finden Sie unter Releaseinformationen für Discovery für IBM Cloud. |
Hindi (hi ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Wortarten, reguläre Ausdrücke, Algorithmus für Normalformenreduktion |
Italienisch (it ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis |
Japanisch (ja ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis |
Koreanisch (ko ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v1, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis |
Norwegisch (Bokmål) (nb ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterbuch, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis |
Norwegisch (Nynorsk) (nn ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterbuch, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis |
Polnisch (pl ) |
Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis |
Brasilianisches Portugiesisch (pt-br ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis |
Rumänisch (ro ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis |
Russisch (ru ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Optische Zeichenerkennung v1, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis |
Serbisch (sr )[1] |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterverzeichnis, Wortarten, Reguläre Ausdrücke |
Slowakisch (sk ) |
Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Tabellenverständnis |
Spanisch (es ) |
Erweiterte Regelmodelle, Integrierte Entitäten, Klassifikationsmerkmal (Dokument und Text), Angepasste Entitäten, Wörterverzeichnis, Kundenstimmung, Schlüsselwörter, Machine Learning, Optische Zeichenerkennung v2, Wortarten, Phrasenstimmung, Reguläre Ausdrücke, Smart Document Understanding, Stemmer, Tabellenverständnis |
Schwedisch (sv ) |
Klassifikationsmerkmal (Dokument und Text), Benutzerdefinierte Entitäten, Wörterbuch, Optische Zeichenerkennung v1, Wortarten, reguläre Ausdrücke, Smart Document Understanding, Algorithmus für Normalformenreduktion, Tabellenverständnis |
Die optische Zeichenerkennung (OCR) v2 wurde in Cloud-verwalteten Serviceinstanzen am 2. November 2022 eingeführt. OCR v2 wurde in IBM Cloud Pak for Data-Instanzen mit Version 4.7.1eingeführt.
Ausschließliche Unterstützung in Englisch
Die folgenden Features werden gegenwärtig nur auf Englisch unterstützt:
-
Für Serbisch wird nur der lateinische Zeichensatz unterstützt. ↩︎