Microsoft SharePoint Online
Microsoft SharePoint Online データ・ソースに保管されている文書をクロールします。
IBM Cloud IBM Cloud ただただ
この情報は、管理対象デプロイメントにのみ適用されます。 インストール済みデプロイメントから SharePoint Online への接続について詳しくは、 SharePoint Online を参照してください。
クロールされる文書
コンテンツの初期クロール中に、指定したサイト・コレクション・パスからアクセスできるすべてのオブジェクトの文書がクロールされ、コレクションに追加されます。 例えば、サイト・コレクション内の 1 つのライブラリーにクロールを制限することはできません。 指定されたサイト・コレクション・パス内のすべてのオブジェクトがクロールされます。 SharePoint コンテンツに関連付けられたカスタム・メタデータもクロールされます。 コレクションごとに 1 つのサイト・コレクション・パスをクロールできます。 Personal SiteCollectionsはクロールできません。
後続のスケジュールされた再クロール時には、新規および変更された文書のみがクロールされ、変更はコレクションに反映されます。 外部データ・ソースから削除された文書は、コレクションから削除されません。
すべての Discovery データ・ソース・コネクターは読み取り専用です。 クロール・アカウントに付与されている許可に関係なく、 Discovery は、元のデータ・ソースのコンテンツの書き込み、更新、削除を行うことはありません。
Discovery は、以下のオブジェクトをクロールできます。
- SiteCollections
- サイト
- SubSites
- リスト
- List Items
- 文書ライブラリー
- アイテム添付ファイルのリスト
データ・ソース要件
すべての管理対象デプロイメントの データ・ソース要件 に加えて、 SharePoint Online データ・ソースは以下の要件を満たしている必要があります。
- 接続先のサイト・コレクションは、エンタープライズ・プランで作成されたサイト・コレクションでなければなりません。 フロント・ライン・ワーカー計画で作成されたコレクションにすることはできません。
- クロールするすべてのオブジェクトを読み取る権限を持つ Azure Active Directory ユーザー ID を持っている必要があります。 例えば、
<admin_user>@.onmicrosoft.com
です。 ユーザー ID にはSiteCollection Administrator
許可は必要ありません。
以下のオプションから、外部 Microsoft SharePoint アカウントでの認証方法を選択できます。
- オープン認証 (OAuth v2)
-
ユーザー資格情報を共有する必要がないように、トークンを使用して外部データ・ソースで認証します。 この認証方式では、Microsoft アカウントに直接ログインして、 Discovery がデータに接続するために使用するトークンを生成できます。
外部データ・ソースでの認証にオープン認証 v2 を使用する 「Microsoft でサインイン」 オプションはベータ機能です。
この認証方式を使用するコネクターを作成する前に、 グローバル管理者 役割を持つユーザーは、 Discovery サービス・インスタンス内のすべてのプロジェクトの接続を許可するために、一回限りの 前提条件ステップ を実行する必要があります。
- セキュリティー・アサーション・マークアップ言語 (SAML) (Security Assertion Markup Language (SAML))
-
ユーザー資格情報を Discovery サービスと共有する必要がある古い認証および許可のメカニズム。
この認証方式を使用することを選択する場合は、Microsoft SharePoint アカウントが以下の要件を満たしている必要があります。
-
2020年1月以前に SharePoint オンラインアカウントを作成していない場合、アカウントにはデフォルトで2要素認証が有効になっています。 2 要素認証を無効にする必要があります。
多要素認証ステータスの確認と変更については 、「ユーザーのステータスの表示 」または 「ユーザーのステータスの変更 」を参照してください。
-
クロール・ユーザー・アカウントでは、レガシー認証と
Contribute
レベルの許可が有効になっている必要があります。レガシー認証を有効にするには、 Azure ポータル にアクセスするか、 SharePoint 管理者に連絡してください。
-
コネクターは、ハイブリッド ID のみを有効にする
Password hash synchronization (PHS)
メソッドをサポートします。 その他のタイプ (パススルー認証や連携など) は、お客様の責任で使用してください。 -
以下の情報をご存知である必要があります
- ユーザー名
-
クロール対象の SharePoint Online SiteCollection に接続するために使用するユーザー・アカウントのユーザー名。
例えば、
<janedoe>@exampledomain.onmicrosoft.com
です。 - パスワード
-
SharePoint に接続するためのパスワード。クロールしたいオンライン SiteCollection。
この値は返されることはなく、資格情報が作成または変更された場合にのみ使用されます。
-
始める前に必要なもの
以下の情報を準備しておく必要があります。 不明な場合は、 SharePoint 管理者に連絡して情報を提供するか、 Microsoft SharePoint 開発者用資料を参照してください。
- 組織 URL
-
クロールしたいソースのルート URL。 URL のドメイン名を指定します。例えば、
https://<company>.<domain>.com
などです。 - サイト・コレクション・パス
-
site_collection_path
を、クロールを開始するサイトのセクションに設定します。例えば、クロールしたいコンテンツが
https://<company>.<domain>.com/sites/test
から利用できる場合、https://<company>.<domain>.com
を組織 URL として、/sites/test
をサイトコレクションパスとして指定することができます。- 入力としてフォルダー・パスを指定することはできません。
- 文書ライブラリー、リスト、およびサブサイトへの URL など、Active Server Page Extended (ASPX) ファイルへのパスを指定することはできません。
- パスを指定しない場合、デフォルト値の
/
が使用され、ルート・サイト・コレクションがクロールされます。
- 「アプリケーション ID」: クロールするデータ・ソースの ID。 この情報は、ソース文書に関連付けられた ACL 情報を保管する場合にのみ必要です。
OAuth のワンタイム前提条件ステップ
誰かが OAuth v2 認証方式を使用するようにコネクターを構成する前に、データ・ソースが配置されている Microsoft Azure ディレクトリー内の グローバル管理者 ロールを持つユーザーが、ディスカバリー・エンタープライズ・アプリケーションを Microsoft Azureに登録するためのステップを実行する必要があります。 このステップは、 Discovery サービス・インスタンスごとに 1 回実行する必要があります。
管理者は、 Azureでアプリケーションを作成する必要はありません。 データ・ソースとして SharePoint Online を選択すると、Discovery サービスによってアプリが自動的に生成されます。 手順に従って、コネクターのセットアップ時に、管理者は Microsoft Azure Directory 内の グローバル管理者 役割を持つユーザーの資格情報を使用して Microsoft にログインし、エンタープライズ・アプリケーションを登録できるようにする必要があります。
以下のステップは、グローバル管理者がサービス・インスタンスごとに 1 回のみ実行する必要があります。
-
Microsoft Azureでエンタープライズ・アプリケーションに適用されるデフォルトのユーザー・アクセス設定を確認します。
エンタープライズ・アプリケーションは、さまざまな方法でユーザー・アクセスを処理できます。 以下のステップを実行して、デフォルト設定がデプロイメントに適していることを確認します。
- Microsoft Azureにログインします。
- Azure Active Directoryの 「エンタープライズ・アプリケーション」 ページで、 *「同意と許可」*をクリックします。
Microsoft Azure Enterprise application permissions user interface -
以下のいずれかを実行します。
-
「アプリのユーザー同意を許可 (Allow user consent for apps)」 が選択されている場合は、これ以上のアクションは必要ありません。
-
「選択した許可について、検証済みパブリッシャーからのアプリに対するユーザーの同意を許可する」 が選択されている場合は、以下のステップを実行します。
「権限の分類」 リンクをクリックし、少なくとも以下の権限が構成されていることを確認します。
- Office 365 SharePoint Online: MyFiles。読み取り
- Office 365 SharePoint Online: AllSites。読み取り
- Microsoft グラフ: offline_access
- Microsoft グラフ: プロファイル
「ユーザーの同意を許可しない」オプション はサポートされていません。
指定した設定は、後続のステップで Discovery によって作成されるエンタープライズ・アプリケーションに適用されます。
-
-
Discoveryのナビゲーション・ペインから、 「コレクションの管理 (Manage collections)」 を選択します。
-
新しいコレクションをクリックします。
-
SharePoint Online」 をクリックし、 「次へ」 をクリックします。
-
URL を Organization URL フィールドに追加します。
-
Microsoftでサインインをクリックします。
Web ブラウザーでこのサイトのポップアップを有効にする必要があります。
外部データ・ソースでの認証にオープン認証を使用する 「Microsoft でサインイン (Sign in with Microsoft)」 オプションは、ベータ機能です。
ユーザー名とパスワードを使用して Microsoft SharePoint アカウントにログインし、必要に応じて 2 要素認証を実行します。
使用する資格情報には、 Microsoft Azure ディレクトリーの グローバル管理者 役割が必要です。 ユーザー名とパスワードの入力を求めるプロンプトが出されない場合は、注意してください。 既に Microsoft Sharepoint アカウントにログインしている可能性があります。 このコネクターに使用したくないアカウントにログインしている場合は、ここで停止します。 (ログインしているアカウントは自動的に使用されます。 また、後でアカウント設定を変更することはできません Web ブラウザーを匿名モードで開き、ステップ 1 からこの手順を開始します。
ディスカバリーにより、指定した SharePoint 組織に登録するエンタープライズ・アプリケーションが生成されます。 エンタープライズ・アプリケーション名の形式は *IBM App Connect_{unique name}*です。
-
Discovery が登録するエンタープライズ・アプリケーションに関連付けられている許可を確認して、 「組織に代わって同意 (Consent on your organization)」 を選択します。
Discovery permission request dialog -
「承認 」をクリックします。
-
コレクションを作成する場合は、コレクションに名前を付け、 「終了」 をクリックします。
それ以外の場合は、 「戻る」 をクリックして、コレクション作成プロセスを終了できます。
これで、同じ Discovery サービス・インスタンスによってホストされるプロジェクトで作業する組織の全員が、 SharePoint Online コネクターを使用してコレクションを作成できます。
OAuth サポート・リビジョン
2022 年 2 月にソフトウェア更新により、OAuth 認証方式のサポートが追加されました。 SAML の代わりに OAuth を使用するように既存のコネクターを更新する場合は、コネクターを再作成する必要があります。 既存のコネクターの認証メカニズムを変更することはできません。
OAuth 認証方式は 2023 年 1 月に更新されました。 Microsoft Azure に登録されているエンタープライズ・アプリケーションには、 読み取り アクセスのみが必要になりました。 以前は、エンタープライズ・アプリケーションには 書き込み アクセス権限が必要でした。 この変更を利用する場合は、現在のエンタープライズ・アプリケーションを削除して、コネクターを再作成してください。 エンタープライズ・アプリケーションの削除方法について詳しくは、 Microsoft の資料を参照してください。
データ・ソースへの接続
Microsoft SharePoint Online データ・ソースを構成するには、 Discoveryで以下の手順を実行します。
-
ナビゲーション・ペインから、 「コレクションの管理」 を選択します。
-
新しいコレクションをクリックします。
-
「データ・ソースに接続する必要があります」 の横にあるリンクをクリックします。 フィールドで SharePoint Online」 をクリックし、 「次へ」 をクリックします。
-
URL を Organization URL フィールドに追加します。
-
外部データ・ソースへのアクセスを有効にするには、以下のオプションから、データ・ソースでの認証に使用する方式を選択します。
- オープン認証 (OAuth v2)
-
Microsoftでサインインをクリックします。
Web ブラウザーでこのサイトのポップアップを有効にする必要があります。
外部データ・ソースでの認証にオープン認証を使用する 「Microsoft でサインイン (Sign in with Microsoft)」 オプションは、ベータ機能です。
ユーザー名とパスワードを使用して Microsoft SharePoint アカウントにログインし、必要に応じて 2 要素認証を実行します。
- セキュリティー・アサーション・マークアップ言語 (SAML) (Security Assertion Markup Language (SAML))
-
クロールするサイトへのアクセスを許可されているユーザーのユーザー名とパスワードを指定し、 「次へ」 をクリックします。
-
クロールするパスを 「サイト・コレクション・パス」 フィールドに指定します。
-
コレクションに名前を付けます。
-
サイト上の文書の言語が英語でない場合は、該当する言語を選択します。
サポートされる言語のリストについては、言語サポートを参照してください。
-
オプション: 同期スケジュールを変更します。
詳しくは、 クロール・スケジュール・オプション を参照してください。
-
オプション: クロールする SharePoint 文書に存在するアクセス制御情報を保管する場合は、 「セキュリティー」 セクションで 「アクセス制御リストを含める (Include Access Control List)」 スイッチを
On
に設定します。このオプションを有効にすると、 SharePoint ソース・ドキュメントに保管されている SharePoint アクセス・ルールに関する情報が保持され、コレクションに追加されるドキュメントにメタデータとして保管されます。
この機能は、コレクションの文書レベルのセキュリティーを有効にする機能とは異なります。 文書メタデータ内のアクセス・ルールは、 Discovery 検索で使用されません。 この機能を有効にすると、単に情報が保管されるため、カスタム検索ソリューションの作成時にアクセス・ルールを活用できます。
この機能を使用すると、コレクション内で生成される文書のサイズが増加し、クロール時間が増加します。 この機能は、ユース・ケースで SharePoint 文書 ACL 情報を保管する必要がある場合にのみ有効にしてください。
この機能を有効にすると、Microsoft SharePoint の管理者役割を持つユーザーが追加の手順を実行して、サイトをクロールするユーザーが ACL メタデータにアクセスするための適切な許可を持つようにする必要があります。
管理者は以下の手順を完了する必要があります
-
Microsoft SharePointにログインします。
-
SharePoint サイトのページを開きます。
-
設定メニューから、 *「サイトの許可」*を選択します。
-
詳細な権限設定をクリックします。
-
クロール中にアクセス制御情報を収集するユーザーが、サイトに対する 「フルコントロール」 権限を持つグループのメンバーであることを確認します。
Microsoft SharePoint permissions user interface アクセス制御リスト情報が抽出されない場合は、コンテンツをクロールするすべてのユーザーに対して 「読み取り」 権限で十分です。
-
-
コレクションに追加するファイルのタイプを制限する場合は、包含または除外するファイル・タイプのファイル拡張子をリストすることができます。
除外するファイル・タイプの拡張子をリストする場合は、少なくとも 1 つのファイル拡張子を追加する必要があります。 デフォルトでは、 「拡張フィルター」 は SharePoint Document Libraries および List Item Attachments オブジェクトにのみ適用できます。 フィルターをすべての SharePoint オブジェクト・タイプに適用するには、ユーザー・インターフェースで 「すべての SharePoint オブジェクト・タイプに拡張フィルターを適用する」 を 「オン」 に設定します。
サポートされるファイル・タイプのリストについては、 サポートされるファイル・タイプ を参照してください。
-
クローラーがサイト上のイメージからテキストを抽出するようにするには、 *「その他の処理設定 (More processing settings)」*を展開し、 「光学式文字認識 (OCR) の適用 (Apply optical character recognition (OCR))」 を
On
に設定します。OCR が有効になっていて、文書に画像が含まれている場合、処理にかかる時間が長くなります。 詳しくは、 光学式文字認識 を参照してください。
-
「完了 (Finish)」 をクリックします。
コレクションは迅速に作成されます。 データはコレクションに追加されるため、処理にかかる時間が長くなります。
進行状況を確認するには、「アクティビティー」ページに移動します。 ナビゲーション・ペインで、 「コレクションの管理」 をクリックし、コレクションをクリックして開きます。
現在、OAuth セットアップに関連付けられているユーザー・アカウントを後で変更することも、コネクターが使用するように構成されている既存のユーザー・アカウントの詳細を変更することもできません。 例えば、 SharePointでパスワードを変更した後に接続をセットアップするために使用したパスワードを更新することはできません。
アクセス制御リスト情報のサンプル
以下の画面キャプチャーは、アクセス制御リストを組み込むときに文書に保管される ACL 情報のタイプを示しています。
