オンプレミスの Microsoft SharePoint

オンプレミスでホストされている Microsoft SharePoint データ・ソースに保管されている文書をクロールします。

IBM Cloud IBM Cloud のみ

この情報は、管理対象デプロイメントにのみ適用されます。インストール済みデプロイメントからオンプレミスの SharePoint データ・ソースへの接続について詳しくは、 SharePoint On Prem を参照してください。

クロールされる文書

コンテンツの初期クロール中に、指定したサイト・コレクション・パスからアクセスできるすべてのオブジェクトの文書がクロールされ、コレクションに追加されます。 SharePoint コンテンツに関連付けられたカスタム・メタデータもクロールされます。コレクションごとに 1 つのサイト・コレクション・パスをクロールできます。 Personal SiteCollectionsはクロールできません。

後続のスケジュールされた再クロール時には、新規および変更された文書のみがクロールされ、変更はコレクションに反映されます。外部データ・ソースから削除された文書は、コレクションから削除されません。

すべての Discovery データ・ソース・コネクターは読み取り専用です。クロール・アカウントに付与されている許可に関係なく、 Discovery は、元のデータ・ソースのコンテンツの書き込み、更新、削除を行うことはありません。

以下の表は、 Discovery がクロールできるオブジェクトを示しています。

データソースのクロールをサポート
データ・ソース	クロールされるオブジェクト
オンプレミスの Microsoft SharePoint	SiteCollections,サイト、SubSites,リスト、リストアイテム、ドキュメントライブラリ、リストアイテムの添付ファイル

データ・ソース要件

すべての管理対象デプロイメントのデータ・ソース要件に加えて、 SharePoint On Prem データ・ソースは以下の要件を満たす必要があります。

SharePoint 2013、2016、または2019のオンプレミスデータソースに接続できます。
ユーザー ID には SiteCollection Administrator 許可が必要であり、クロールするすべてのサイトとリストにアクセスできなければなりません。
クローラーは、Windows New Technology LAN Manager (NTLM) v1認証のみをサポートします。 NTLMv2またはSecurity Assertion Markup Language (SAML)認証をサポートしません。

始める前に必要なもの

以下の情報を準備しておく必要があります。不明な場合は、 SharePoint 管理者に連絡して情報を提供するか、 Microsoft SharePoint 開発者用資料を参照してください。

Username: クロール対象の SharePoint On Prem Web アプリケーションに接続するために使用するユーザー名。例えば、siteadmin01 です。
パスワード: クロールしたい SharePoint オンプレム Web アプリケーションに接続するためのパスワード。この値は返されることはなく、資格情報が作成または変更された場合にのみ使用されます。
Web アプリケーション URL: SharePoint のウェブアプリケーションは URL です。例えば、https://sharepointwebapp.com:8443 です。ポート番号を入力しない場合、 80 のデフォルト値が HTTP、 URL、 443 が HTTPS に使用されます。
ドメイン: SharePoint On Prem アカウントのドメイン・ネーム。例えば、sharepoint.mycointernal です。

制限

Discovery は、がゲートウェイなしでアクセスできるオンプレム・サーバーにのみ接続できる。 IBM Cloud SharePoint

データ・ソースへの接続

Microsoft SharePoint On Prem データ・ソースを構成するには、 Discoveryで以下の手順を実行します。

ナビゲーション・ペインから、 「コレクションの管理」 を選択します。
新しいコレクションをクリックします。
「データ・ソースに接続する必要があります」 の横にあるリンクをクリックします。フィールドで SharePoint 「オンプレミス」 をクリックし、 「次へ」 をクリックします。
以下のフィールドに値を追加します。
- Username
- パスワード
- Web アプリケーション URL
- ドメイン
次へをクリックします。
コレクションに名前を付けます。
サイト上の文書の言語が英語でない場合は、該当する言語を選択します。

サポートされる言語のリストについては、言語サポートを参照してください。
オプション: 同期スケジュールを変更します。

詳しくは、クロール・スケジュール・オプションを参照してください。
コレクションに追加するファイルのタイプを制限する場合は、包含または除外するファイル・タイプのファイル拡張子をリストすることができます。

除外するファイル・タイプの拡張子をリストする場合は、少なくとも 1 つのファイル拡張子を追加する必要があります。

サポートされるファイル・タイプのリストについては、サポートされるファイル・タイプを参照してください。
クローラーがサイト上のイメージからテキストを抽出するようにするには、 *「その他の処理設定 (More processing settings)」*を展開し、 「光学式文字認識 (OCR) の適用 (Apply optical character recognition (OCR))」 を On に設定します。

OCR が有効になっていて、文書に画像が含まれている場合、処理にかかる時間が長くなります。詳しくは、光学式文字認識を参照してください。
「完了 (Finish)」 をクリックします。

コレクションは迅速に作成されます。データはコレクションに追加されるため、処理にかかる時間が長くなります。

進行状況を確認するには、「アクティビティー」ページに移動します。ナビゲーション・ペインで、 「コレクションの管理」 をクリックし、コレクションをクリックして開きます。