FileNet P8
搜寻存储在 FileNet P8中的文档。
IBM Cloud Pak for Data IBM Software Hub
此信息仅适用于已安装的部署。
要搜寻的文档
-
仅搜寻 Discovery 支持的文件类型; 将忽略所有其他文件类型。 有关更多信息,请参阅 支持的文件类型。
-
支持文档级别安全性。 启用此选项后,您的用户可以搜寻并查询登录到 FileNet时可访问的内容。Discovery 在搜寻 FileNet P8时不支持基于角色的安全性。
有关文档级安全性的更多信息,请参阅 支持文档级安全性。
-
仅搜寻具有与您指定的文件扩展名过滤规则匹配的文件扩展名的文件。 随 4.7.0 发行版一起添加。
-
当重新抓取资源时,会添加新文档,将更新后的文档修改为当前版本,并将已删除的文档从集合索引中删除。
-
所有 Discovery 数据源连接器都是只读的。 无论向搜寻帐户授予何种许可权,Discovery 从不写入,更新或删除原始数据源中的任何内容。
数据源需求
除了所有已安装部署的 数据源需求 外,FileNet P8 数据源还必须满足以下需求:
- 数据源可以搜寻安装在 IBM Cloud Pak for Automation上的 FileNet 服务器的 FileNet P8 5.5.0 和 Content Engine Web Service (CEWS)。
- FileNet P8 5.5.0 和 Cloud Pak for Automation 上的 FileNet 支持 HTTP 和 HTTPS 协议。
必备步骤
如果要启用文档级安全性,那么必须执行一些步骤来设置该安全性。 有关更多信息,请参阅关于文档级别安全性。
连接到 FileNet P8 数据源
请从您的 Discovery 项目开始,完成以下步骤:
-
从导航窗格中,选择 管理集合。
-
点击 “新收藏”。
-
单击 FileNet P8,然后单击 下一步。
-
命名集合。
-
如果 FileNet 中文档的语言不是英语,请选择相应的语言。
有关受支持语言的列表,请参阅语言支持。
-
可选: 更改同步调度。
有关更多信息,请参阅 搜寻调度选项。
-
请在 “输入您的凭据”部分填写以下信息:
- 内容引擎网络服务 URL
-
IBM FileNet P8 服务器的 内容引擎网络服务 URL。
当您输入 URL 时,请使用格式:
<protocol>://<server>:<port>/wsi/FNCEWS40MTOM
。 可以使用 HTTP 或 HTTPS 协议。<server>
是部署了 Content Platform Engine 的服务器的主机名,<port>
是应用程序服务器使用的 HTTP 端口,或者部署了 Content Platform Engine。 - 用户
-
用于搜寻 FileNet P8 服务器的用户名。 可以从 FileNet 管理员那里获取用户名。
- 密码
-
与用户关联的密码。
-
在 指定要搜寻的内容 部分中,输入要用于在 ObjectStore 名称 字段中创建,搜索,检索和存储文档的对象库的显示名称。
-
在搜寻器空间类型中,选择文件夹或类。
-
完成以下字段:
- 文件夹子路径或子类名称
-
您可以在 RootFolder 下指定子文件夹路径,该路径将抓取指定文件夹或
Document
类自定义子类中的所有文档。 在此字段中指定任何内容之前,请记住以下项:- 可以使用
Class
和Folder
类型指定多个搜寻器空间,并搜寻属于该文件夹名称和类名的文档。 - 不能指定您所定义的对象存储之外的类。
- 不支持指定属于
Custom Object
和Folder
的子类的类。
- 可以使用
-
输入一个或多个路径后,单击添加。
-
可选: 在 安全性 部分中,如果要启用文档级别安全性,请将 启用文档级别安全性 开关设置为
On
。设置为 On 时,您的用户可以搜寻他们在 FileNet中有权访问的相同内容。
-
如果要限制要添加到集合的文件类型,那么可以列出要包含或排除的文件类型的文件扩展名。
有关受支持文件类型的列表,请参阅 受支持的文件类型。
在 4.7.0 发行版中添加了对此选项的支持。
-
如果希望搜寻器从文档中的图像中抽取文本,请展开 更多处理设置,并将 应用光学字符识别 (OCR) 设置为
On
。启用 OCR 并且您的文档包含图像时,处理需要更长时间。 有关更多信息,请参阅 光学字符识别。
-
单击完成。
将快速创建集合。 将数据添加到集合时,处理数据需要更多时间。
如果要检查进度,请转至“活动”页面。 在导航窗格中,单击 管理集合,然后单击以打开集合。