Microsoft SharePoint 本地
搜寻存储在本地托管的 Microsoft SharePoint 数据源中的文档。
IBM Cloud 仅IBM Cloud
此信息仅适用于受管部署。 有关从已安装的部署连接到本地 SharePoint 数据源的更多信息,请参阅 SharePoint On Prem。
要搜寻的文档
在初始搜寻内容期间,将搜寻可从您指定的站点集合路径访问的所有对象中的文档并将其添加到集合中。 还将搜寻与 SharePoint 内容关联的定制元数据。 您可以搜寻每个集合的一个站点集合路径。 无法搜寻 个人 SiteCollections。
在后续调度的重新搜寻期间,将仅搜寻新的和已修改的文档,并且会在集合中反映任何更改。 不会从集合中删除从外部数据源中删除的文档。
所有 Discovery 数据源连接器都是只读的。 无论向搜寻帐户授予何种许可权,Discovery 从不写入,更新或删除原始数据源中的任何内容。
下表说明了 Discovery 可搜寻的对象。
数据源 | 已搜寻的对象 |
---|---|
Microsoft SharePoint 本地 | SiteCollections,网站、SubSites,网站、列表、列表项、文档库、列表项附件 |
数据源需求
除了所有受管部署的 数据源需求 外,SharePoint On Prem 数据源还必须满足以下需求:
- 您可以连接到 SharePoint 2013、2016 或 2019 内部部署数据源。
- 用户标识必须具有
SiteCollection Administrator
许可权,并且能够访问他们要搜寻的所有站点和列表。 - 搜寻器仅支持 Windows 新技术 LAN Manager (NTLM) v1 认证。 它不支持 NTLM v2 或安全性断言标记语言 (SAML) 认证。
开始之前需要的内容
您必须准备好以下信息。 如果您不知道,请要求 SharePoint 管理员提供信息或查阅 Microsoft SharePoint 开发者文档:
- 用户名
- 用于连接到要搜寻的 SharePoint On Prem Web 应用程序的用户名。 例如,
siteadmin01
。 - 密码
- 连接到要抓取的 SharePoint On Prem 网络应用程序的密码。 从不返回此值,仅当创建或修改凭证时才会使用此值。
- Web 应用程序 URL
- SharePoint 网络应用 URL。 例如,
https://sharepointwebapp.com:8443
。 如果您没有输入端口号,则默认值80
将用于 HTTP,URL 和443
将用于 HTTPS。 - 域
- SharePoint On Prem 帐户的域名。 例如,
sharepoint.mycointernal
。
限制
Discovery 只能连接到 on-prem 服务器,无需任何网关即可访问。SharePoint IBM Cloud
连接到数据源
要配置 Microsoft SharePoint On Prem 数据源,请在 Discovery中完成以下步骤:
-
从导航窗格中,选择 管理集合。
-
单击“新建收藏”。
-
单击 需要连接到数据源旁边的链接? 字段,单击 SharePoint On Prem,然后单击 下一步。
-
向以下字段添加值:
- 用户名
- 密码
- Web 应用程序 URL
- 域
单击下一步。
-
命名集合。
-
如果站点上文档的语言不是英语,请选择相应的语言。
有关受支持语言的列表,请参阅语言支持。
-
可选: 更改同步调度。
有关更多信息,请参阅 搜寻调度选项。
-
如果要限制要添加到集合的文件类型,那么可以列出要包含或排除的文件类型的文件扩展名。
选择列出要排除的文件类型的扩展名时,必须至少添加一个文件扩展名。
有关受支持文件类型的列表,请参阅 受支持的文件类型。
-
如果希望搜寻器从站点上的图像中抽取文本,请展开 更多处理设置,并将 应用光学字符识别 (OCR) 设置为
On
。启用 OCR 并且您的文档包含图像时,处理需要更长时间。 有关更多信息,请参阅 光学字符识别。
-
单击完成。
将快速创建集合。 将数据添加到集合时,处理数据需要更多时间。
如果要检查进度,请转至“活动”页面。 在导航窗格中,单击 管理集合,然后单击以打开集合。