マイクロソフト SharePoint オンプレミス
オンプレミスの Microsoft SharePoint データソースに格納されているドキュメントをクロールします。
IBM Cloud Pak for Data IBM Software Hub
この情報は、インストールされたデプロイメントにのみ適用されます。 管理下の配置からオンプレミスの SharePoint サイトに接続する方法の詳細については、SharePoint オンプレミス を参照してください。
クロールされる文書
- Discovery でサポートされている文書のみがクロールされ、それ以外は無視されます。 詳細については、サポートされているファイルタイプ を参照してください。
- 文書レベルのセキュリティがサポートされている。 このオプションを有効にすると、ユーザーは SharePoint にログインしているときにアクセスできるのと同じコンテンツをクロールしてクエリできます。 詳しくは、ドキュメントレベルのセキュリティをサポートする を参照してください。
- ソースが再クロールされると、新しい文書が追加され、更新された文書は最新バージョンに変更され、削除された文書はコレクションのインデックスから削除されます。
- すべてのDiscoveryデータ・ソース・コネクタは読み取り専用です。 クロールアカウントに付与された権限に関係なく、Discovery は、元のデータソースのコンテンツを書き込んだり、更新したり、削除したりすることはありません。
データ・ソース要件
すべてのインストール済み配置の データ ソースの要件 に加えて、SharePoint On Prem データ ソースは以下の要件を満たしている必要があります:
- データソース接続は、SharePoint 2013、2016、または 2019 をサポートしています。
- 接続するデータ・ソースに必要なサービス・ライセンスを取得する必要があります。 ライセンスの詳細については、データソースのシステム管理者にお問い合わせください。
SharePoint On Prem の詳細については、Microsoft SharePoint 開発者ドキュメントを参照してください。
前提条件ステップ
SharePoint On Premコレクションを作成する前に、以下のことを行う必要があります:
-
Sharepoint管理者と協力して、ウェブアプリケーションの完全な読み取りアクセスの設定を調整する。
詳細については、SharepointサーバーでWebアプリケーションのアクセス許可を管理するを参照してください。
-
文書レベルのセキュリティを有効にしたい場合は、いくつかのステップを踏んで設定する必要がある。 詳しくは、ドキュメントレベルのセキュリティをサポートする を参照してください。
LDAP管理者から以下の情報を収集する必要があります:
- LDAP サーバー URL
- LDAPサーバーに接続するには、 URL 例えば、
ldap://<ldap_server>:<port>
。 - LDAPバインディング・ユーザー名
- ディレクトリサービスにバインドするために使用するユーザー名。 ほとんどの場合、このユーザー名は識別名 (DN) です。 ログオン名が Active Directory で有効な場合もあります。 しかし、一般的なWindowsログオンとは異なり、大文字と小文字が区別されます。 識別名は常に機能する。
- LDAPバインディング・ユーザーのパスワード
- ディレクトリサービスにバインドするために使用するパスワード。
- LDAPベースDN
- LDAPでユーザーエントリを検索する際の起点、例えば
CN=Users,DC=example,DC=com
。 - LDAP ユーザー・フィルター
- LDAP内のユーザーエントリを検索するためのユーザーフィルタ。 指定されていない場合、デフォルト値 は
(userPrincipalName={0})
です。
バージョン2.2.1またはそれ以前を使用している場合は、データ・ソースに接続する前にいくつかの前提条件を完了する必要があります。 詳細については、SharePoint 以前のリリースの前提条件の手順 を参照してください。
SharePoint On Prem データソースへの接続
Discovery プロジェクトから、以下の手順を完了してください
-
ナビゲーションペインから、コレクションの管理を選択します。
-
新しいコレクションをクリックします。
-
SharePoint On Prem をクリックし、次に 「次へ」 をクリックします。
-
コレクションに名前をつける。
-
SharePoint 内のドキュメントの言語が英語でない場合は、適切な言語を選択してください。
サポートされる言語のリストについては、言語サポートを参照してください。
-
オプション:同期スケジュールを変更します。
詳しくは、クロールスケジュールのオプション をご覧ください。
-
認証情報を入力セクションで、以下のフィールドに入力します:
- ユーザー名
- SharePoint ユーザーのユーザー名。クロールおよびインデックス化が必要なすべてのサイトおよびリストにアクセスできます。
- パスワード
- SharePoint ユーザーのパスワード。
この値は返されることはなく、資格情報の作成または変更時にのみ使用されます。
-
Optional: SAML (Security Assertion Mark-up Language)クレームベースの認証を使用したい場合は、SAML 認証を有効にするスイッチを
On
に設定します。 そうでない場合は、Windows NT LAN Manager (NTLM) 認証が使われる。 以下のフィールドに値を追加する:- アイデンティティ・プロバイダ・エンドポイント
- アイデンティティプロバイダーのエンドポイントの URL、例えば
https://adfs.server.example.com/adfs/services/trust/2005/UsernameMixed
。 - 依拠当事者エンドポイント
- オプション。 依拠当事者信頼エンドポイントの URL。 指定されていない場合は、
https://<sharepoint_server>:<port>/_trust/
が使用されます。 - 依拠当事者信頼識別子
- 依拠当事者信頼識別子の URL、例えば
urn:sharepoint:sample
。 指定されていない場合は、https://<sharepoint_server>:<port>/_trust/
が使用されます。 この機能は、バージョン 2013、2016、2019 で使用可能です。
-
クロールする対象を指定するセクションで、 SharePoint ウェブサービス URL を 「ウェブアプリケーション URL」フィールドに追加します。 例えば、
https://<host>:<port>
などです。 -
オプション: データ・ソース・サーバーへのアクセスにプロキシ・サーバーを使用している場合は、プロキシ設定セクションで、プロキシ設定を有効にするスイッチを
On
に設定します。 以下のフィールドに値を追加する:- ユーザー名
- オプション。 プロキシサーバーが認証を必要とする場合、認証するプロキシサーバーのユーザー名。 ユーザー名が不明な場合は、ご使用のプロキシー・サーバーの管理者から入手できます。
- パスワード
- オプション。 プロキシサーバーが認証を必要とする場合、認証するためのプロキシサーバーのパスワード。 パスワードが不明な場合は、ご使用のプロキシー・サーバーの管理者から入手できます。
- プロキシサーバーのホスト名またはIPアドレス
- プロキシサーバーのホスト名またはIPアドレス。
- プロキシー・サーバーのポート番号
- プロキシサーバー上で接続したいネットワークポート。
-
オプション: ドキュメントレベルのセキュリティを有効にしたい場合は、セキュリティセクションで、ドキュメントレベルのセキュリティを有効にするスイッチを
On
に設定します。このオプションを有効にすると、ユーザーは SharePoint にログインしているときにアクセスできるのと同じコンテンツをクロールしてクエリできます。 前提条件 を満たして、サポートを追加してください。
このオプションを有効にすると、以下のフィールドに値を指定する必要があります:
- LDAP サーバー URL
- LDAPサーバーに接続するには、 URL 例えば、
ldap://<ldap_server>:<port>
。 - LDAPバインディング・ユーザー名
- ディレクトリサービスにバインドするために使用するユーザー名。 ほとんどの場合、このユーザー名は識別名 (DN) です。 ログオン名が Active Directory で有効な場合もあります。 しかし、一般的なWindowsログオンとは異なり、大文字と小文字が区別されます。 識別名は常に機能する。
- LDAPバインディング・ユーザーのパスワード
- ディレクトリサービスにバインドするために使用するパスワード。
- LDAPベースDN
- LDAPでユーザーエントリを検索する際の起点、例えば
CN=Users,DC=example,DC=com
。 - LDAP ユーザー・フィルター
- LDAP内のユーザーエントリを検索するためのユーザーフィルタ。 指定されていない場合、デフォルト値 は
(userPrincipalName={0})
です。
-
クローラーにサイト上の画像からテキストを抽出させたい場合は、その他の処理設定を展開し、光学式文字認識(OCR)を適用するを
On
に設定します。OCRが有効で、文書に画像が含まれている場合、処理に時間がかかります。 詳しくは、光学式文字認識 をご覧ください。
-
「完了 (Finish)」 をクリックします。
コレクションは素早く作られる。 データがコレクションに追加されるため、処理に時間がかかる。
進捗状況を確認したい場合は、アクティビティページにアクセスしてください。 ナビゲーションペインから、コレクションの管理をクリックし、クリックしてコレクションを開きます。
先行リリースの前提条件
バージョン2.2.1またはそれ以前を使用している場合は、データ・ソースに接続する前に以下の追加手順を完了する必要があります:
- DiscoveryクラスタからWebサービスパッケージを取得します。 この Web サービス・パッケージは、正常にクロールするために必要な情報を取得するためにクローラーが使用するカスタム・モジュールです。 詳しくは、ウェブサービス・パッケージを入手する をご覧ください。
- Web サービスパッケージを SharePoint サーバーにデプロイします。 詳細は、WebサービスをSharePointサーバーに配置する を参照してください。
ウェブサービス・パッケージを入手する
Discovery クラスタからWebサービスパッケージを取得するには、以下の手順を実行します:
-
Discovery クラスターにログインします。
-
crawler
のポッド名を取得するには、以下のコマンドを入力してくださいoc get pods | grep crawler
以下のようなメッセージに似た出力が表示される場合があります
wd-discovery-crawler-57985fc5cf-rxk89 1/1 Running 0 85m
-
次のコマンドを入力して、
{crawler-pod-name}
を前のステップで取得したcrawler
のポッド名に置き換えて、ESSPSolution.wsp
ファイルを取得しますoc exec {crawler-pod-name} -- ls -l /opt/ibm/wex/zing/resources/ | grep ESSPSolution
以下のようなメッセージに似た出力が表示される場合があります
-rw-r--r--. 1 dadmin dadmin 8600 Feb 3 08:23 ESSPSolution-${build-version}.wsp
-
次のコマンドを入力して、
ESSPSolution.wsp
ファイルをホストサーバーにコピーします。{build-version}
を前のステップのビルドバージョン番号に、{crawler-pod-name}
をcrawler
ポッド名に置き換えてくださいoc cp {crawler-pod-name}:/opt/ibm/wex/zing/resources/ESSPSolution-${build-version}.wsp ESSPSolution.wsp
SharePoint サーバーにウェブサービスを展開する
手動で SharePoint サーバーに Web サービスをデプロイすることも、自動的にデプロイするためのスクリプトを実行することもできます。
ウェブ・サービスを自動的にデプロイするスクリプトを実行する:
-
次の Windows PowerShell コマンドレットを入力し、SharePoint サーバーで
ESSPSolution.wsp
スクリプトを実行します。Add-SPSolution -LiteralPath C:\files\ESSPSolution.wsp
-
SharePoint, で SharePoint を開き、中央管理を開いてからシステム設定を開きます。
-
ファームソリューションを使用してパッケージを展開します。
-
esspsolution.wsp
ソリューションを選択し、そのソリューションをデプロイします。デプロイメントが完了すると、ファーム・ソリューションが SharePoint 管理コンソールにリストされます。 管理者はこのソリューションを使用可能または使用不可にして、トリガーをスケジュールすることができます。
-
オプション:ウェブサービスの展開にどの方法を使用したかに関わらず、一部の環境では展開を完了するために、 SharePoint サーバーとウェブサービスをホストするインターネットインフォメーションサービス(IIS)サーバーに以下の構成を適用する必要がある場合があります
- IIS での .NET 偽装を可能にする
- ASP.NET 信頼レベルを WSS_Medium に変更する
これらの設定は、インターネットインフォメーションサービスマネージャーで適用できます。