HCL Notes
Durchsuchen Sie eine HCL Notes (früher Lotus Notes) Datenbank.
IBM Cloud Pak for Data IBM Software Hub
Diese Informationen gelten nur für installierte Bereitstellungen.
Welche Dokumente werden gecrawlt
- Jedes Dokument in der HCL Notes Datenbank wird gecrawlt und der Sammlung als Dokument hinzugefügt.
- Wenn ein HCL Notes-Dokument einen Dateianhang hat und Sie die Verarbeitung von Dateianhängen wählen, werden nur Dokumente gecrawlt, die von Discovery unterstützt werden; alle anderen werden ignoriert. Weitere Informationen finden Sie unter Unterstützte Dateitypen.
- Wenn Sie sich für die Verarbeitung von Anhängen entscheiden, versucht der Crawler, Dateien zu crawlen und zu indizieren, die an HCL Notes-Dokumente angehängt sind. Dateitypen, die von Discovery unterstützt werden, werden indiziert. Weitere Informationen finden Sie unter Unterstützte Dateitypen.
- Sicherheit auf Dokumentenebene wird unterstützt. Wenn diese Option aktiviert ist, können Ihre Benutzer denselben Inhalt durchsuchen und abfragen, auf den sie zugreifen können, wenn sie bei HCL Notes angemeldet sind. Weitere Informationen finden Sie unter Unterstützung der Sicherheit auf Dokumentenebene.
- Wenn eine Quelle erneut durchsucht wird, werden neue Dokumente hinzugefügt, aktualisierte Dokumente werden auf die aktuelle Version geändert und gelöschte Dokumente werden aus dem Index der Sammlung gelöscht.
- Alle Discovery Datenquellenkonnektoren sind schreibgeschützt. Unabhängig von den Berechtigungen, die dem Crawl-Konto gewährt werden, schreibt, aktualisiert oder löscht Discovery niemals Inhalte in der ursprünglichen Datenquelle.
Datenquellenvoraussetzungen
Zusätzlich zu den Anforderungen an die Datenquelle für alle installierten Bereitstellungen muss Ihre HCL Notes-Datenquelle die folgenden Anforderungen erfüllen:
- Die Datenquelle kann HCL Notes 9.0.1 Datenbanken crawlen.
- Die Datenquelle HCL Notes unterstützt nur das DIIOP-Protokoll (Domino Internet Inter-ORB Protocol).
- Zum Durchsuchen von Dokumenten, einschließlich ACLs, müssen Sie mindestens
Reader
Zugriff auf Server, Datenbank und Dokumentenzugriff auf dem Domino-Server haben. - Für Gruppenextraktionen aus dem internen Domino LDAP-Verzeichnis müssen Sie
Reader
Zugriff auf dienames.nsf
Verzeichnisdatenbank haben. - Für Gruppenextraktionen aus dem externen LDAP-Verzeichnis müssen Sie über die Zugangsdaten für den externen LDAP-Server verfügen.
Vorausgesetzte Schritte
-
Wenn Sie die Sicherheit auf Dokumentenebene aktivieren möchten, müssen Sie einige Schritte unternehmen, um sie einzurichten. Weitere Informationen finden Sie unter Unterstützung der Sicherheit auf Dokumentenebene.
Sie können den LDAP-Server, der von HCL Notes verwendet wird (entweder das interne Domino-LDAP oder ein externes LDAP-Verzeichnis) als entferntes LDAP-Verzeichnis verwenden, um die Sicherheit auf Dokumentenebene zu verwalten. Benutzer, die die Sammlung durchsuchen, können in einem externen LDAP-Verzeichnis aufgeführt werden. Die Benutzeranmeldeinformationen, die Sie zum Einrichten des Crawls verwenden, müssen jedoch zu einem Benutzer gehören, der im internen LDAP-Verzeichnis von Domino aufgeführt ist.
Um die Sicherheit auf Dokumentebene zu konfigurieren, müssen Sie die folgenden Informationen sammeln:
- URL des LDAP-Servers
- Der LDAP-Server URL, mit dem eine Verbindung hergestellt werden soll. Beispiel:
ldap://<ldap_server>:<port>
. - LDAP-Bindungs-Benutzername
- Der Benutzername, der für die Verbindung mit dem Verzeichnisdienst verwendet wird. Dieser Benutzer muss über administrative Rechte verfügen und im internen LDAP-Verzeichnis von Domino aufgeführt sein.
- Passwort für LDAP-Benutzer
- Das dem Benutzer zugeordnete Kennwort.
- LDAP-Basis-DN
- Der Ausgangspunkt für die Suche nach Benutzereinträgen in LDAP. Beispiel:
CN=Users,DC=example,DC=com
. - LDAP-Benutzerfilter
- Der Filter, der bei der Suche nach Benutzereinträgen im LDAP angewendet werden soll. Wenn keine Angabe gemacht wird, lautet der Standardwert
(userPrincipalName=\{0\})
. - LDAP-Gruppenfilter
- Der Filter, der bei der Suche nach Gruppeneinträgen im LDAP angewendet werden soll.
-
Bevor Sie Server über das Domino Internet Inter-ORB Protocol (DIIOP) crawlen können, müssen Sie den HCL Notes Server für die Verwendung des Protokolls konfigurieren. Der Server, den Sie durchsuchen möchten, muss die DIIOP- und HTTP-Tasks ausführen.
Um den HCL Notes Server für die Verwendung von DIIOP zu konfigurieren, führen Sie die folgenden Schritte aus:
-
Konfigurieren Sie das HCL Notes Serverdokument.
-
Öffnen Sie in HCL Notes das
server
-Dokument auf dem HCL Notes-Server, den Sie durchsuchen möchten. Dieses Dokument ist im Domino-Verzeichnis gespeichert. -
Erweitern Sie auf der Seite "Konfiguration" den Abschnitt "Server ".
-
Geben Sie auf der Seite Sicherheit im Abschnitt Einschränkungen der Programmierbarkeit in den folgenden drei Feldern die entsprechenden Sicherheitseinschränkungen für Ihre Umgebung an:
- Beschränkte Lotus Script/Java-Agenten ausführen
- Ausführung eingeschränkt Java/Javascript/COM
- Ausführen von uneingeschränktem Java/Javascript/COM
Sie können beispielsweise ein Sternchen (
*
) angeben, um LotusScript/Java-Agenten uneingeschränkten Zugriff zu gewähren, und Benutzernamen angeben, die im Domino-Verzeichnis für die Java/JavaScript/COM-Einschränkungen registriert sind.Zum Durchsuchen eines Servers mit DIIOP-Protokoll muss Ihr Crawler in der Lage sein, auf die in diesen Feldern angegebenen Benutzernamen zuzugreifen.
-
Öffnen Sie die Seite Internet Protocol und dann die Seite HTTP. Setzen Sie die Option " HTTP-Clients das Durchsuchen der Datenbank erlauben " auf "Ja ".
-
-
Konfigurieren Sie das Benutzerdokument.
-
Öffnen Sie das
user
-Dokument für den Benutzer, dessen Anmeldeinformationen Sie für die LDAP-Anbindung verwenden möchten. Dieses Dokument ist im Domino-Verzeichnis gespeichert. -
Geben Sie auf der Seite "Allgemein" im Feld Internetkennwort ein Kennwort an.
Sie geben diese Benutzer- und Passwortinformationen an, wenn Sie die Datenquelle einrichten.
-
-
Starten Sie die DIIOP-Aufgabe auf dem HCL Notes-Server neu.
Weitere Informationen finden Sie unter Ausführen von Serveraufgaben in der HCL Notes Dokumentation.
Verbinden mit einer HCL Notes Datenquelle
Führen Sie die folgenden Schritte für Ihr Discovery-Projekt aus:
-
Wählen Sie im Navigationsbereich Sammlungen verwalten.
-
Klicken Sie auf "Neue Kollektion ".
-
Klicken Sie auf "Notizen " und dann auf "Weiter ".
-
Benennen Sie die Sammlung.
-
Wenn die Sprache der Dokumente in HCL Notes nicht Englisch ist, wählen Sie die entsprechende Sprache.
Eine Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung.
-
Optional: Ändern Sie den Synchronisierungszeitplan.
Weitere Informationen finden Sie unter Kriechplanoptionen.
-
Füllen Sie im Abschnitt Eingabe Ihrer Anmeldedaten die folgenden Felder aus:
- Hostname
- Der Hostname des HCL Notes-Servers.
- Benutzername
- Der Benutzername, der zum Crawlen des HCL Notes-Servers verwendet werden soll.
- Kennwort
- Das dem Benutzer zugeordnete Kennwort.
-
Wählen Sie im Feld Crawl-Typ aus den folgenden Optionen aus, was Sie crawlen möchten:
- Wenn Sie eine bestimmte HCL Notes-Datenbank crawlen möchten, wählen Sie Datenbank, und fügen Sie dann den Dateinamen der Datenbank in das Feld Dateiname der Datenbank ein.
- Wenn Sie mehrere Datenbanken crawlen wollen, wählen Sie Verzeichnis. Geben Sie im Feld Verzeichnisname das Verzeichnis an, in dem die Datenbanken, die Sie durchsuchen möchten, gespeichert sind.
-
Optional: Geben Sie im Abschnitt Sicherheit an, ob Sie die Sicherheit auf Dokumentenebene aktivieren möchten.
-
Wenn Sie die Sicherheit auf Dokumentebene aktivieren möchten, setzen Sie den Schalter Sicherheit auf Dokumentebene aktivieren auf
On
.Wenn diese Option aktiviert ist, können Ihre Benutzer dieselben Inhalte durchsuchen, auf die sie in einer HCL Notes-Datenbank oder einem -Verzeichnis Zugriff haben.
-
Um das LDAP-Verzeichnis von Domino zu verwenden, setzen Sie den Schalter Fernes LDAP-Verzeichnis verwenden auf
On
. Geben Sie Details über das Domino LDAP-Verzeichnis an. Sie haben diese Informationen bei der Durchführung des vorausgehenden Schritts gesammelt.- URL des LDAP-Servers
- Der LDAP-Server URL, mit dem eine Verbindung hergestellt werden soll. Beispiel:
ldap://<ldap_server>:<port>
. - LDAP-Bindungs-Benutzername
- Der Benutzername, der für die Verbindung mit dem Verzeichnisdienst verwendet wird.
- Passwort für LDAP-Benutzer
- Das dem Benutzer zugeordnete Kennwort.
- LDAP-Basis-DN
- Der Ausgangspunkt für die Suche nach Benutzereinträgen in LDAP. Beispiel:
CN=Users,DC=example,DC=com
. - LDAP-Benutzerfilter
- Der Filter, der bei der Suche nach Benutzereinträgen im LDAP angewendet werden soll. Wenn keine Angabe gemacht wird, lautet der Standardwert
(userPrincipalName=\{0\})
. - LDAP-Gruppenfilter
- Der Filter, der bei der Suche nach Gruppeneinträgen im LDAP angewendet werden soll.
-
-
Optional: Im Abschnitt Erweiterte Optionen können Sie die folgenden Konfigurationseinstellungen vornehmen:
- Crawl-Anbaugeräte
-
Wenn Sie Dateien durchsuchen wollen, die an HCL Notes-Dokumente angehängt sind, setzen Sie den Schalter auf
On
. - Automatische Erkennung von Codeseiten
-
Wenn Sie möchten, dass der Kodierungskonverter den Code der zu crawlenden Seiten erkennt, lassen Sie den Schalter auf
On
stehen. Wenn Sie den Switcher aufOff
einstellen, geben Sie Werte für die folgenden Felder an:- Zu verwendende Code-Seite
- Geben Sie die Zeichenkodierung der Seiten an, die Sie crawlen möchten. Wenn keine Angabe gemacht wird, wird der Standardwert
UTF-8
verwendet. - Formel für Anmerkungen
- Geben Sie eine HCL Notes-Formel an, um die Daten zu filtern, die Sie durchsuchen möchten. Beispiel:
SELECT @IsAvailable(Year) & Year > 2003
. Weitere Informationen finden Sie unter Formelsprache in der HCL Notes Dokumentation.
-
Geben Sie das Datum an, das Sie beim Filtern der Dokumente verwenden möchten. Das Datum wird in einem Feld mit dem Namen
_ _$Date$_ _
in HCL Notes Dokumenten gespeichert. Standardmäßig speichert das Feld das Datum der letzten Änderung des Dokuments. Sie können stattdessen ein anderes Datum wählen, das in dem Feld gespeichert werden soll.- Änderungsdatum des Dokuments
- Verwendet das Datum, an dem das Dokument zuletzt geändert wurde. Diese Option ist standardmäßig ausgewählt.
- Crawl-Datum des Dokuments
- Verwendet das Datum des letzten Crawlings.
- Erstellungsdatum des Dokuments
- Verwendet das Erstellungsdatum des Dokuments.
-
Wenn Sie möchten, dass der Crawler Text aus Bildern in Dokumenten extrahiert, erweitern Sie Weitere Verarbeitungseinstellungen und setzen Sie optische Zeichenerkennung (OCR) anwenden auf
On
.Wenn OCR aktiviert ist und Ihre Dokumente Bilder enthalten, dauert die Verarbeitung länger. Weitere Informationen finden Sie unter Optische Zeichenerkennung.
-
Klicken Sie auf Beenden.
Die Sammlung ist schnell erstellt. Die Verarbeitung der Daten nimmt mehr Zeit in Anspruch, da sie der Sammlung hinzugefügt werden.
Wenn Sie den Fortschritt überprüfen möchten, gehen Sie auf die Seite Aktivität. Klicken Sie im Navigationsbereich auf Sammlungen verwalten und dann auf , um die Sammlung zu öffnen.