Microsoft SharePoint On Prem
抓取儲存在 Microsoft 內部 SharePoint 資料來源中的文件。
IBM Cloud Pak for Data IBM Software Hub
此資訊僅適用於已安裝的部署。 For more information about connecting to an on-premises SharePoint site from a managed deployment, see SharePoint On Prem.
抓取哪些文件
資料來源需求
In addition to the 資料來源需求 for all installed deployments, your SharePoint On Prem data source must meet the following requirements:
- 資料來源連線支援 SharePoint 2013、2016 或 2019。
- 您必須取得要連線的資料來源所需的服務授權。 有關授權的詳細資訊,請聯絡資料來源的系統管理員。
For more information about SharePoint On Prem, see Microsoft SharePoint 開發人員文件.
必要步驟
在建立 SharePoint On Prem 收集之前,您必須執行下列事項:
-
與 Sharepoint 管理員合作,協調設定 Web 應用程式的完整讀取存取。
如需詳細資訊,請參閱 管理 Sharepoint Server 中 Web 應用程式的權限。
-
如果要啟用文件層級安全性,您必須採取一些步驟來設定。 如需詳細資訊,請參閱 支援文件層級安全性。
您必須向 LDAP 管理員收集下列資訊:
- LDAP 伺服器 URL
- 要連線的 LDAP 伺服器 URL,例如
ldap://<ldap_server>:<port>
。 - LDAP 綁定使用者名稱
- 用於綁定目錄服務的使用者名稱。 在大多數情況下,此使用者名稱是識別名稱 (DN)。 登入名稱可能有時適用於 Active Directory。 但與一般 Windows 登入不同,它是區分大小寫的。 識別名稱總是有效的。
- LDAP 綁定使用者密碼
- 用於綁定目錄服務的密碼。
- LDAP 基本 DN
- 在 LDAP 中搜尋使用者項目的起點,例如
CN=Users,DC=example,DC=com
。 - LDAP 使用者篩選器
- 用於在 LDAP 中搜尋使用者項目的使用者篩選器。 如果未指定,預設值為
(userPrincipalName={0})
。
如果您使用的是 2.2.1 或更早版本,則必須完成一些額外的先決任務,才能連線到資料來源。 如需詳細資訊,請參閱 SharePoint關於先前版本的 Premerequisite 步驟。
連接至 SharePoint On Prem 資料來源
從您的 Discovery 專案,完成下列步驟:
-
從導覽窗格中,選擇 Manage collections。
-
按一下新增收藏集。
-
Click SharePoint On Prem, and then click 下一頁.
-
為收藏命名。
-
如果 SharePoint 中的文件語言不是英文,請選擇適當的語言。
如需受支援語言的清單,請參閱語言支援。
-
選用:變更同步排程。
如需詳細資訊,請參閱 爬行排程選項。
-
在 Enter your credentials 部分,請填寫下列欄位:
- 使用者名稱
- SharePoint 使用者的使用者名稱,該使用者有權存取所有需要爬取和編制索引的網站和清單。
- 密碼
- SharePoint 使用者的密碼。
此值不會傳回,只有在您建立或修改憑證時才會使用。
-
選購: If you want to use Security Assertion Mark-up Language (SAML) claims-based authentication, set the 啟用 SAML 驗證 switch to
On
. 否則會使用 Windows NT LAN Manager (NTLM) 驗證。 為下列欄位新增數值:- 身分提供者端點
- 身份提供者端點的 URL,例如
https://adfs.server.example.com/adfs/services/trust/2005/UsernameMixed
。 - 信賴憑證方端點
- 選用。 信賴憑證方信任端點的 URL。 如果未指定,則使用下列值:
https://<sharepoint_server>:<port>/_trust/
。 - 信賴憑證者信賴識別碼
- 信賴憑證方信任識別碼的 URL,例如
urn:sharepoint:sample
。 如果未指定,則使用下列值:https://<sharepoint_server>:<port>/_trust/
。 此特性在 2013、2016 和 2019 版本中可用。
-
在 Specify what you want to crawl(指定您要抓取的內容 )部分,將 SharePoint Web service URL 新增至 Web Application Url 欄位。 例如,
https://<host>:<port>
。 -
選購: If you are using a proxy server to access the data source server, then in the 代理伺服器設定 section, set the 啟用代理設定 switch to
On
. 為下列欄位新增數值:- 使用者名稱
- 選用。 如果代理伺服器需要驗證,則需要驗證的代理伺服器使用者名稱。 如果不知道您的使用者名稱,則可以自 Proxy 伺服器的管理者取得該名稱。
- 密碼
- 選用。 如果代理伺服器需要驗證,則需要驗證的代理伺服器密碼。 如果不知道您的密碼,則可以自 Proxy 伺服器的管理者取得該密碼。
- 代理伺服器主機名稱或 IP 位址
- 代理伺服器的主機名稱或 IP 位址。
- Proxy 伺服器埠號
- 您要連接至代理伺服器的網路連接埠。
-
選購: If you want to activate document-level security, in the 安全性 section, set the 啟用文件層級安全性 switch to
On
.啟用此選項後,您的使用者可以抓取和查詢他們登入 SharePoint 時可以存取的相同內容。 完成 必要步驟 以新增支援。
啟用此選項時,您必須提供下列欄位的值:
- LDAP 伺服器 URL
- 要連線的 LDAP 伺服器 URL,例如
ldap://<ldap_server>:<port>
。 - LDAP 綁定使用者名稱
- 用於綁定目錄服務的使用者名稱。 在大多數情況下,此使用者名稱是識別名稱 (DN)。 登入名稱可能有時適用於 Active Directory。 但與一般 Windows 登入不同,它是區分大小寫的。 識別名稱總是有效的。
- LDAP 綁定使用者密碼
- 用於綁定目錄服務的密碼。
- LDAP 基本 DN
- 在 LDAP 中搜尋使用者項目的起點,例如
CN=Users,DC=example,DC=com
。 - LDAP 使用者篩選器
- 用於在 LDAP 中搜尋使用者項目的使用者篩選器。 如果未指定,預設值為
(userPrincipalName={0})
。
-
If you want the crawler to extract text from images on the site, expand 更多處理設定, and set 應用光學字元識別 (OCR) to
On
.啟用 OCR 且您的文件包含影像時,處理時間會較長。 如需詳細資訊,請參閱 光學字元識別。
-
按一下完成。
集合快速建立。 當資料被加入集合時,需要更多時間來處理。
如果您要檢查進度,請前往 Activity 頁面。 從導覽窗格,按一下 管理收藏集,然後按一下開啟收藏集。
先前版本的先決步驟
如果您使用的是 2.2.1 或更早版本,則必須先完成這些額外的步驟,才能連線到資料來源:
- 從您的 Discovery 群集取得 Web 服務套件。 此 Web 服務套件是自訂模組,搜索器會使用此模組來取得必要資訊,以順利進行搜索。 如需詳細資訊,請參閱 取得網路服務套件。
- 在 SharePoint 伺服器上部署 Web 服務套件。 如需詳細資訊,請參閱 在 SharePoint 伺服器上部署網路服務。
取得網路服務套件
若要從 Discovery 群集取得 Web 服務套件,請完成下列步驟:
-
登入 Discovery 叢集。
-
輸入下列指令以取得您的
crawler
pod 名稱:oc get pods | grep crawler
您可能會看到類似以下訊息的輸出:
wd-discovery-crawler-57985fc5cf-rxk89 1/1 Running 0 85m
-
輸入下列指令取得
ESSPSolution.wsp
檔案,將{crawler-pod-name}
改為上一步取得的crawler
pod 名稱:oc exec {crawler-pod-name} -- ls -l /opt/ibm/wex/zing/resources/ | grep ESSPSolution
您可能會看到類似以下訊息的輸出:
-rw-r--r--. 1 dadmin dadmin 8600 Feb 3 08:23 ESSPSolution-${build-version}.wsp
-
輸入下列指令,將
ESSPSolution.wsp
檔案複製到主伺服器,將{build-version}
改為上一步的建立版本號碼,將{crawler-pod-name}
改為crawler
pod 名稱:oc cp {crawler-pod-name}:/opt/ibm/wex/zing/resources/ESSPSolution-${build-version}.wsp ESSPSolution.wsp
在 SharePoint 伺服器上部署網路服務
您可以在 SharePoint 伺服器上手動部署 Web 服務,或執行自動部署它們的 Script。
執行自動部署 Web 服務的指令碼:
-
在 SharePoint 伺服器上執行
ESSPSolution.wsp
script,方法是輸入下列 Windows PowerShell cmdlet:Add-SPSolution -LiteralPath C:\files\ESSPSolution.wsp
-
在 SharePoint, 中開啟 SharePoint Central Administration,然後開啟系統設定。
-
使用農場解決方案部署套件。
-
選取
esspsolution.wsp
解決方案,並部署此解決方案。在部署完成之後,伺服器陣列解決方案會列在 SharePoint 管理主控台中。 管理者可以啟用或停用解決方案,而且可以排定觸發時間。
-
可選:無論您使用何種方式部署 Web 服務,要在某些環境中完成部署,您可能需要將下列設定套用到主機 SharePoint 伺服器和 Web 服務的 Internet Information Services (IIS) 伺服器:
- 容許 IIS 上的 .NET 模擬
- 將 ASP.NET 信任程度變更為 WSS_Medium
您可以在 Internet Information Services Manager 中套用這些設定。