IBM Cloud Docs
Microsoft SharePoint Online

Microsoft SharePoint Online

搜索儲存在 Microsoft SharePoint Online 資料來源中的文件。

IBM Cloud IBM Cloud 僅限

此資訊僅適用於受管理部署。 如需從已安裝部署連接至 SharePoint Online 的相關資訊,請參閱 SharePoint Online

搜索哪些文件

在起始搜索內容期間,會搜索所有物件中可從您指定的網站集合路徑存取的文件,並將其新增至集合。 例如,您無法將搜索限制為網站集合內的一個檔案庫。 會搜索指定網站集合路徑中的所有物件。 也會搜索與 SharePoint 內容相關聯的自訂 meta 資料。 您可以為每個集合搜索一個網站集合路徑。 您無法搜索 個人 SiteCollections

在後續排定的重新搜索期間,只會搜索新的及已修改的文件,且任何變更都會反映在您的集合中。 從外部資料來源中刪除的文件不會從集合中刪除。

所有 Discovery 資料來源連接器都是唯讀的。 不論授與搜索帳戶的許可權為何,Discovery 絕不會寫入、更新或刪除原始資料來源中的任何內容。

Discovery 可以搜索下列物件:

  • SiteCollections
  • 站點
  • SubSites
  • 清單
  • 列出項目
  • 文件庫
  • 列出項目附件

資料來源需求

除了所有受管理部署的 資料來源需求 之外,您的 SharePoint 線上資料來源還必須符合下列需求:

  • 您連接的網站集合必須是使用企業方案所建立的網站集合。 它不能是使用前線工作者計劃建立的集合。
  • 您必須具有 Azure Active Directory 使用者 ID,且有權讀取您要搜索的所有物件。 例如,<admin_user>@.onmicrosoft.com。 使用者 ID 不需要 SiteCollection Administrator 許可權。

您可以從下列選項選擇如何向外部 Microsoft SharePoint 帳戶進行鑑別:

開放式鑑別 (OAuth v2)

使用記號向外部資料來源進行鑑別,以便您的使用者認證不需要共用。 使用此鑑別方法,您可以直接登入 Microsoft 帳戶,以產生 Discovery 用來連接至資料的記號。

使用「開放式鑑別 v2」向外部資料來源進行鑑別的 使用 Microsoft 登入 選項是測試版特性。

在任何人可以建立使用此鑑別方法的連接器之前,具有 廣域管理者 角色的使用者必須完成一次性 必要步驟,以授權 Discovery 服務實例中所有專案的連線。

安全主張標記語言 (SAML)

較舊的鑑別和授權機制,需要與 Discovery 服務共用使用者認證。

如果您選擇使用此鑑別方法,則 Microsoft SharePoint 帳戶必須符合下列需求:

  • 除非您在 2020 年 1 月之前建立 SharePoint Online 帳戶,否則預設會啟用帳戶的雙重因素驗證。 您必須停用雙因素鑑別。

    若要檢視或變更多因素驗證狀態,請參閱 檢視使用者的狀態變更使用者的狀態

  • 搜索使用者帳戶必須已啟用舊式鑑別及 Contribute 層次許可權。

    若要啟用舊式鑑別,請跳至 Azure 入口網站 或聯絡 SharePoint 管理者。

  • 連接器僅支援啟用混合式身分的 Password hash synchronization (PHS) 方法。 使用任何其他類型 (例如透通鑑別或聯合),風險由您自己承擔。

  • 您必須知道下列資訊:

    使用者名稱

    用來連接至您要搜索之 SharePoint Online SiteCollection 的使用者帳戶使用者名稱。

    例如,<janedoe>@exampledomain.onmicrosoft.com

    密碼

    連線到您要抓取的 SharePoint Online SiteCollection 的密碼。

    此值永不會傳回,且僅在建立或修改認證時使用。

開始之前您需要的內容

您必須備妥下列資訊。 如果您不知道,請要求 SharePoint 管理者提供資訊,或參閱 Microsoft SharePoint 開發人員文件:

組織 URL

您要抓取的來源的根 URL。 指定 URL 的網域名稱,例如 https://<company>.<domain>.com

網站集合路徑

要開始搜索之網站區段的 site_collection_path

例如,如果要抓取的內容來自 https://<company>.<domain>.com/sites/test,則可以指定 https://<company>.<domain>.com 為組織 URL,/sites/test 為網站集合路徑。

  • 您無法指定資料夾路徑作為輸入。
  • 您無法指定 Active Server Page Extended (ASPX) 檔案的路徑,例如文件庫、清單及子網站的 URL。
  • 如果您未指定路徑,則會使用預設值 /,並搜索根網站集合。
  • 應用程式 ID: 您要搜索的資料來源 ID。 只有在您想要儲存與來源文件相關聯的 ACL 資訊時,才需要此資訊。

OAuth 的一次性必備步驟

在任何人可以將連接器配置為使用 OAuth v2 鑑別方法之前,在資料來源所在的 Microsoft Azure 名錄中,具有 廣域管理者 角色的使用者必須先完成步驟,以在 Microsoft Azure中登錄 Discovery 企業應用程式。 每個 Discovery 服務實例必須完成一次此步驟。

管理者不需要在 Azure中建立應用程式。 當他們選擇 SharePoint Online 作為資料來源時,Discovery 服務會自動產生應用程式。 如後續程序中所述,在設定連接器期間,管理者必須使用 Microsoft Azure 名錄中具有 廣域管理者 角色之使用者的認證登入 Microsoft,並容許登錄企業應用程式。

廣域管理者必須僅針對每個服務實例完成下列步驟一次:

  1. 檢閱將套用至 Microsoft Azure中企業應用程式的預設使用者存取設定。

    企業應用程式可以透過多種方式處理使用者存取權。 透過完成下列步驟,檢查預設值以確保它們適用於您的部署:

    1. 登入 Microsoft Azure
    2. Azure Active Directory中的「企業應用程式」頁面,按一下 同意及許可權

    Azure企業應用程式權限使用者介面
    Microsoft Azure企業應用程式權限使用者介面

    1. 執行下列其中一項作業:

      • 如果選取 容許使用者同意應用程式,則不需要其他動作。

      • 如果選取 容許使用者同意來自已驗證發佈者的應用程式,針對選取的許可權,請完成下列步驟:

        按一下 許可權分類 鏈結,然後確定至少已配置下列許可權:

        • Office 365 SharePoint 線上: MyFiles。讀取
        • Office 365 SharePoint 線上: AllSites。讀取
        • Microsoft Graph: offline_access
        • Microsoft Graph: 設定檔

      不支援 不容許使用者同意選項

      您指定的設定將在後續步驟中套用至 Discovery 所建立的企業應用程式。

  2. 從 Discovery的導覽窗格中,選擇 管理集合

  3. 按一下新增收藏集

  4. 按一下 SharePoint 線上,然後按 下一步

  5. 組織 URL 欄位中加入 URL。

  6. 按一下使用 Microsoft 登入

    必須在 Web 瀏覽器中啟用此網站的蹦現畫面。

    使用「開放式鑑別」向外部資料來源進行鑑別的 使用 Microsoft 登入 選項是測試版特性。

    使用您的使用者名稱和密碼登入 Microsoft SharePoint 帳戶,然後在必要時完成雙因素鑑別。

    請記住,您使用的認證必須在 Microsoft Azure 名錄中具有 廣域管理者 角色。 如果系統未提示您輸入使用者名稱和密碼,請注意。 您可能已登入 Microsoft Sharepoint 帳戶。 如果您已登入不想用於此連接器的帳戶,請在這裡停止。 (將自動使用您登入的任何帳戶。 而且您稍後無法變更帳戶配置。) 以隱式模式開啟 Web 瀏覽器,並從步驟 1 開始此程序。

    探索會產生企業應用程式,它將向您指定的 SharePoint 組織登錄。 企業應用程式名稱的格式為 IBM App Connect_{unique name}

  7. 檢閱與「探索」將登錄之企業應用程式相關聯的許可權,然後選取 代表您組織的同意

    許可權要求對話框,要求您代表您的組織同意容許應用程式 1。 讀取使用者檔案。2. 讀取所有網站集合中的項目。3. 維護對您已授與其存取權之資料的存取權。4. 檢視使用者的基本設定檔。
    發現權限請求對話框

  8. 按一下 接受

  9. 如果您想要建立集合,您可以命名該集合,然後按一下 完成

    否則,您可以按 上一步 來結束集合建立程序。

現在,您組織中在相同 Discovery 服務實例所管理專案中工作的任何人都可以使用 SharePoint 線上連接器建立集合。

OAuth 支援修訂

2022 年 2 月隨軟體更新新增了 OAuth 鑑別方法支援。 如果您要更新現有連接器以使用 OAuth 而非 SAML,則必須重建連接器。 您無法變更現有連接器的鑑別機制。

OAuth 鑑別方法已於 2023 年 1 月更新。 向 Microsoft Azure 登錄的企業應用程式現在只需要 讀取 存取權。 先前,企業應用程式需要 寫入 存取權。 如果您想要利用這項變更,請刪除現行企業應用程式,並重建連接器。 如需如何刪除企業應用程式的相關資訊,請參閱 Microsoft 文件

連接至資料來源

若要配置 Microsoft SharePoint Online 資料來源,請在 Discovery中完成下列步驟:

  1. 從導覽窗格中,選擇 管理集合

  2. 按一下新增收藏集

  3. 按一下 需要連接至資料來源旁邊的鏈結? 欄位,按一下 SharePoint 線上,然後按 下一步

  4. 組織 URL 欄位中加入 URL。

  5. 若要啟用外部資料來源的存取權,請從下列選項中選擇您要用來向資料來源進行鑑別的方法:

    開放式鑑別 (OAuth v2)

    按一下使用 Microsoft 登入

    必須在 Web 瀏覽器中啟用此網站的蹦現畫面。

    使用「開放式鑑別」向外部資料來源進行鑑別的 使用 Microsoft 登入 選項是測試版特性。

    使用您的使用者名稱和密碼登入 Microsoft SharePoint 帳戶,然後在必要時完成雙因素鑑別。

    安全主張標記語言 (SAML)

    指定有權存取您要搜索的網站之使用者的使用者名稱及密碼,然後按 下一步

  6. 網站集合路徑 欄位中指定您要搜索的路徑。

  7. 命名集合。

  8. 如果網站上文件的語言不是英文,請選取適當的語言。

    如需受支援語言的清單,請參閱語言支援

  9. 選用: 變更同步化排程。

    如需相關資訊,請參閱 搜索排程選項

  10. 選用: 如果您要儲存您搜索的 SharePoint 文件中存在的任何存取控制資訊,請在 安全 區段中,將 併入存取控制清單 參數設為 On

    當您啟用此選項時,會保留儲存在 SharePoint 來源文件中的 SharePoint 存取規則相關資訊,並在新增至集合的文件中儲存為 meta 資料。

    此特性與啟用集合的文件層次安全不同。 Discovery 搜尋未使用文件 meta 資料中的存取規則。 啟用此特性只會儲存資訊,以便您在建置自訂搜尋解決方案時可以利用存取規則。

    使用此特性會增加集合中產生的文件大小,並增加搜索時間。 只有在您的使用案例需要您儲存 SharePoint 文件 ACL 資訊時,才啟用此特性。

    如果您啟用此功能,則在 Microsoft SharePoint 中具有管理者角色的人員必須採取額外步驟,以確保搜索網站的使用者有權存取 ACL meta 資料。

    管理者必須完成下列步驟:

    1. 登入 Microsoft SharePoint。

    2. 開啟 SharePoint 網站的頁面。

    3. 從設定功能表中,選擇 網站許可權

    4. 按一下 Advanced permission settings(進階權限設定 )。

    5. 請確定要在搜索期間收集存取控制資訊的人員具有或是具有網站 完整控制 許可權之群組的成員。

      顯示 SharePoint 使用者介面,您可以在其中定義使用者和群組的許可權。
      Microsoft SharePoint權限使用者介面

      未擷取存取控制清單資訊時,對所有搜索內容的使用者而言,讀取 許可權已足夠。

  11. 如果您想要限制要新增至集合的檔案類型,您可以列出要併入或排除之檔案類型的副檔名。

    當您選擇列出要排除之檔案類型的副檔名時,必須至少新增一個副檔名。 依預設,延伸過濾器 僅適用於 SharePoint 文件庫列出項目附件 物件。 若要將過濾器套用至所有 SharePoint 物件類型,請將 將延伸過濾器套用至所有 SharePoint 物件類型 設為使用者介面上的 開啟

    如需受支援檔案類型的清單,請參閱 支援的檔案類型

  12. 如果您想要搜索器從網站上的影像擷取文字,請展開 其他處理設定,並將 套用光學字元辨識 (OCR) 設為 On

    當啟用 OCR 且您的文件包含影像時,處理需要較長的時間。 如需相關資訊,請參閱 光學字元辨識

  13. 按一下完成

會快速建立集合。 將資料新增至集合時,需要花費更多時間來處理資料。

如果您要檢查進度,請跳至「活動」頁面。 從導覽窗格中,按一下 管理集合,然後按一下以開啟集合。

您目前無法稍後變更與 OAuth 設定相關聯的使用者帳戶,也無法變更連接器配置使用之現有使用者帳戶的任何詳細資料。 例如,在 SharePoint中變更密碼之後,您無法更新用來設定連線的密碼。

存取控制清單資訊範例

下列畫面擷取說明當您併入存取控制清單時,儲存在文件中的 ACL 資訊類型。

顯示儲存在文件 meta 資料中來源物件的 Microsoft ACL 資訊。
文檔元資料中 ACL 資訊的表示