IBM Cloud Docs
Microsoft SharePoint On Prem

Microsoft SharePoint On Prem

抓取儲存在 Microsoft 內部 SharePoint 資料來源中的文件。

IBM Cloud Pak for Data IBM Software Hub

此資訊僅適用於已安裝的部署。 For more information about connecting to an on-premises SharePoint site from a managed deployment, see SharePoint On Prem.

抓取哪些文件

  • 只有 Discovery 支援的文件才會被抓取,其他文件都會被忽略。 如需詳細資訊,請參閱 支援的檔案類型
  • 支援文件層級安全性。 啟用此選項後,您的使用者可以抓取和查詢他們登入 SharePoint 時可以存取的相同內容。 如需詳細資訊,請參閱 支援文件層級安全性
  • 當重新抓取來源時,會新增文件,更新的文件會修改為目前的版本,而刪除的文件則會從集合的索引中刪除。
  • 所有 Discovery 資料來源連線器都是唯讀的。 無論授予爬取帳戶的權限如何,Discovery 永遠不會寫入、更新或刪除原始資料來源中的任何內容。

資料來源需求

In addition to the 資料來源需求 for all installed deployments, your SharePoint On Prem data source must meet the following requirements:

  • 資料來源連線支援 SharePoint 2013、2016 或 2019。
  • 您必須取得要連線的資料來源所需的服務授權。 有關授權的詳細資訊,請聯絡資料來源的系統管理員。

For more information about SharePoint On Prem, see Microsoft SharePoint 開發人員文件.

必要步驟

在建立 SharePoint On Prem 收集之前,您必須執行下列事項:

  1. 與 Sharepoint 管理員合作,協調設定 Web 應用程式的完整讀取存取。

    如需詳細資訊,請參閱 管理 Sharepoint Server 中 Web 應用程式的權限

  2. 如果要啟用文件層級安全性,您必須採取一些步驟來設定。 如需詳細資訊,請參閱 支援文件層級安全性

    您必須向 LDAP 管理員收集下列資訊:

    LDAP 伺服器 URL
    要連線的 LDAP 伺服器 URL,例如 ldap://<ldap_server>:<port>
    LDAP 綁定使用者名稱
    用於綁定目錄服務的使用者名稱。 在大多數情況下,此使用者名稱是識別名稱 (DN)。 登入名稱可能有時適用於 Active Directory。 但與一般 Windows 登入不同,它是區分大小寫的。 識別名稱總是有效的。
    LDAP 綁定使用者密碼
    用於綁定目錄服務的密碼。
    LDAP 基本 DN
    在 LDAP 中搜尋使用者項目的起點,例如 CN=Users,DC=example,DC=com
    LDAP 使用者篩選器
    用於在 LDAP 中搜尋使用者項目的使用者篩選器。 如果未指定,預設值為 (userPrincipalName={0})

如果您使用的是 2.2.1 或更早版本,則必須完成一些額外的先決任務,才能連線到資料來源。 如需詳細資訊,請參閱 SharePoint關於先前版本的 Premerequisite 步驟

連接至 SharePoint On Prem 資料來源

從您的 Discovery 專案,完成下列步驟:

  1. 從導覽窗格中,選擇 Manage collections

  2. 按一下新增收藏集

  3. Click SharePoint On Prem, and then click 下一頁.

  4. 為收藏命名。

  5. 如果 SharePoint 中的文件語言不是英文,請選擇適當的語言。

    如需受支援語言的清單,請參閱語言支援

  6. 選用:變更同步排程。

    如需詳細資訊,請參閱 爬行排程選項

  7. Enter your credentials 部分,請填寫下列欄位:

    使用者名稱
    SharePoint 使用者的使用者名稱,該使用者有權存取所有需要爬取和編制索引的網站和清單。
    密碼
    SharePoint 使用者的密碼。

    此值不會傳回,只有在您建立或修改憑證時才會使用。

  8. 選購: If you want to use Security Assertion Mark-up Language (SAML) claims-based authentication, set the 啟用 SAML 驗證 switch to On. 否則會使用 Windows NT LAN Manager (NTLM) 驗證。 為下列欄位新增數值:

    身分提供者端點
    身份提供者端點的 URL,例如 https://adfs.server.example.com/adfs/services/trust/2005/UsernameMixed
    信賴憑證方端點
    選用。 信賴憑證方信任端點的 URL。 如果未指定,則使用下列值:https://<sharepoint_server>:<port>/_trust/
    信賴憑證者信賴識別碼
    信賴憑證方信任識別碼的 URL,例如 urn:sharepoint:sample。 如果未指定,則使用下列值:https://<sharepoint_server>:<port>/_trust/。 此特性在 2013、2016 和 2019 版本中可用。
  9. Specify what you want to crawl(指定您要抓取的內容 )部分,將 SharePoint Web service URL 新增至 Web Application Url 欄位。 例如,https://<host>:<port>

  10. 選購: If you are using a proxy server to access the data source server, then in the 代理伺服器設定 section, set the 啟用代理設定 switch to On. 為下列欄位新增數值:

    使用者名稱
    選用。 如果代理伺服器需要驗證,則需要驗證的代理伺服器使用者名稱。 如果不知道您的使用者名稱,則可以自 Proxy 伺服器的管理者取得該名稱。
    密碼
    選用。 如果代理伺服器需要驗證,則需要驗證的代理伺服器密碼。 如果不知道您的密碼,則可以自 Proxy 伺服器的管理者取得該密碼。
    代理伺服器主機名稱或 IP 位址
    代理伺服器的主機名稱或 IP 位址。
    Proxy 伺服器埠號
    您要連接至代理伺服器的網路連接埠。
  11. 選購: If you want to activate document-level security, in the 安全性 section, set the 啟用文件層級安全性 switch to On.

    啟用此選項後,您的使用者可以抓取和查詢他們登入 SharePoint 時可以存取的相同內容。 完成 必要步驟 以新增支援。

    啟用此選項時,您必須提供下列欄位的值:

    LDAP 伺服器 URL
    要連線的 LDAP 伺服器 URL,例如 ldap://<ldap_server>:<port>
    LDAP 綁定使用者名稱
    用於綁定目錄服務的使用者名稱。 在大多數情況下,此使用者名稱是識別名稱 (DN)。 登入名稱可能有時適用於 Active Directory。 但與一般 Windows 登入不同,它是區分大小寫的。 識別名稱總是有效的。
    LDAP 綁定使用者密碼
    用於綁定目錄服務的密碼。
    LDAP 基本 DN
    在 LDAP 中搜尋使用者項目的起點,例如 CN=Users,DC=example,DC=com
    LDAP 使用者篩選器
    用於在 LDAP 中搜尋使用者項目的使用者篩選器。 如果未指定,預設值為 (userPrincipalName={0})
  12. If you want the crawler to extract text from images on the site, expand 更多處理設定, and set 應用光學字元識別 (OCR) to On.

    啟用 OCR 且您的文件包含影像時,處理時間會較長。 如需詳細資訊,請參閱 光學字元識別

  13. 按一下完成

集合快速建立。 當資料被加入集合時,需要更多時間來處理。

如果您要檢查進度,請前往 Activity 頁面。 從導覽窗格,按一下 管理收藏集,然後按一下開啟收藏集。

先前版本的先決步驟

如果您使用的是 2.2.1 或更早版本,則必須先完成這些額外的步驟,才能連線到資料來源:

  • 從您的 Discovery 群集取得 Web 服務套件。 此 Web 服務套件是自訂模組,搜索器會使用此模組來取得必要資訊,以順利進行搜索。 如需詳細資訊,請參閱 取得網路服務套件
  • 在 SharePoint 伺服器上部署 Web 服務套件。 如需詳細資訊,請參閱 在 SharePoint 伺服器上部署網路服務

取得網路服務套件

若要從 Discovery 群集取得 Web 服務套件,請完成下列步驟:

  1. 登入 Discovery 叢集。

  2. 輸入下列指令以取得您的 crawler pod 名稱:

    oc get pods | grep crawler
    

    您可能會看到類似以下訊息的輸出:

    wd-discovery-crawler-57985fc5cf-rxk89     1/1     Running     0          85m
    
  3. 輸入下列指令取得 ESSPSolution.wsp 檔案,將 {crawler-pod-name} 改為上一步取得的 crawler pod 名稱:

    oc exec {crawler-pod-name} -- ls -l /opt/ibm/wex/zing/resources/ | grep ESSPSolution
    

    您可能會看到類似以下訊息的輸出:

    -rw-r--r--. 1 dadmin dadmin  8600 Feb  3 08:23 ESSPSolution-${build-version}.wsp
    
  4. 輸入下列指令,將 ESSPSolution.wsp 檔案複製到主伺服器,將 {build-version} 改為上一步的建立版本號碼,將 {crawler-pod-name} 改為 crawler pod 名稱:

    oc cp {crawler-pod-name}:/opt/ibm/wex/zing/resources/ESSPSolution-${build-version}.wsp ESSPSolution.wsp
    

在 SharePoint 伺服器上部署網路服務

您可以在 SharePoint 伺服器上手動部署 Web 服務,或執行自動部署它們的 Script。

執行自動部署 Web 服務的指令碼:

  1. 在 SharePoint 伺服器上執行 ESSPSolution.wsp script,方法是輸入下列 Windows PowerShell cmdlet:Add-SPSolution -LiteralPath C:\files\ESSPSolution.wsp

  2. 在 SharePoint, 中開啟 SharePoint Central Administration,然後開啟系統設定。

  3. 使用農場解決方案部署套件。

  4. 選取 esspsolution.wsp 解決方案,並部署此解決方案。

    在部署完成之後,伺服器陣列解決方案會列在 SharePoint 管理主控台中。 管理者可以啟用或停用解決方案,而且可以排定觸發時間。

  5. 可選:無論您使用何種方式部署 Web 服務,要在某些環境中完成部署,您可能需要將下列設定套用到主機 SharePoint 伺服器和 Web 服務的 Internet Information Services (IIS) 伺服器:

    • 容許 IIS 上的 .NET 模擬
    • 將 ASP.NET 信任程度變更為 WSS_Medium

    您可以在 Internet Information Services Manager 中套用這些設定。