连接到IBM Knowledge Catalog(IKC)
将IBM® watsonx.data与IBM Knowledge Catalog(IKC) 集成,可为需要使用数据资产来获得洞察力的知识工作者提供对数据资产(表和视图)的自助式访问。
IBM Knowledge Catalog-watsonx.data集成支持以下用于治理的连接器:
- Hive
- Iceberg
- 胡迪
- Delta Lake
- Oracle
- Postgresql
- MySQL
- SQL Server
- Db2
准备工作
要启用 IKC 集成,请确保满足以下前提条件:
- 有效的 watsonx.data 环境。
- 工作IBM Knowledge Catalog(IKC)环境。
- IBM Knowledge Catalog和watsonx.data在IBM Cloud 中配置了 服务对服务授权。
- 从 watsonx.data 版本 2.1 开始,您只能与以下政策引擎之一集成。
- Apache Ranger
- IBM Knowledge Catalog
watsonx.data 和 IKC 都必须出现在 IBM Cloud 环境中。 您可以为 Presto (C++) 和 Presto ( Java ) 引擎定义 IKC 治理策略。
从 watsonx.data 连接并导入资产元数据到 IKC
-
登录到 IBM Cloud。
-
去资源列表>人工智能 /Machine Learning>IBM Knowledge Catalog。
-
单击 IBM Cloud Pak for Data 中的“启动”。 IBM Knowledge Catalog 主页将打开。
将打开一个弹出窗口,其中有创建新目录和类别的选项。 如果您现在不想创建它们,您可以关闭窗口。
-
从左窗格中,转至 目录 > 查看所有目录。 此时将打开“目录”页面,其中包含可用目录的列表。
-
创建新目录
- 单击 新建目录。
- 在新目录页:
- 在名称字段中,为目录添加名称。
- 在描述字段中,添加描述。
- 来自对象存储实例下拉列表中,选择一个对象存储。 如果您没有,请单击 UI 中的链接创建一个实例。
- 选择执行数据保护和数据位置规则当您尝试访问目录中的数据资产时,复选框会自动强制执行数据保护和数据位置规则。
- 切换控制切换到开启位置以允许报告资产元数据。
- 选择处理来自重复资产处理部分。
- 单击创建。 将创建目录并打开目录页面。
-
转至 添加到目录 > 连接。
-
在新连接翻页、搜索和选择IBM® watsonx.data。
-
输入以下详细信息:
新建连接 字段 描述 名称 输入连接名称。 描述 输入连接描述。 联系 IBM watsonx.data on IBM Software Hub 请不要勾选此复选框。 主机名或 IP 地址 输入 watsonx.data 的实例 URL。 有关主机名检索的信息,请参阅 获取连接信息。 端口 请输入端口号。 有关恢复端口的信息,请参阅 获取连接信息。 实例标识 输入实例ID。 您可以在 watsonx.data 实例主页(信息图标)上获取实例ID。 实例名称 输入 watsonx.data 实例名称。 CRN 输入云资源名称。 您可从 watsonx.data 实例主页(信息图标)获取CRN。 用户名 输入您的用户名 ( ibmlhapikey_<EMAIL_ID>
)。密码 输入您的 IAM API 密钥。 要创建一个,请参阅 创建API密钥。 SSL 已启用 请勾选复选框。 SSL 证书 使用网络浏览器从 watsonx.data 控制台下载证书,并粘贴在此字段中。 引擎主机名或 IP 地址 在 watsonx.data 控制台中输入不带端口号的引擎主机名和 :
。引擎标识 在 watsonx.data 控制台中输入发动机ID。 发动机端口 输入发动机端口号和主机名。 -
可选:单击“测试连接”测试连接。
-
单击创建。 连接已添加到目录中。
-
转至 添加到目录 > 已连接的资产。
-
在连接的资产中,单击 Select source 并导航到要导入的资产。
-
选择资产并单击添加。 资产已成功添加到 IKC。
在 IBM® watsonx.data UI 中配置 IKC
-
登录到 IBM® watsonx.data。
-
从左窗格中,转至 访问控制。
-
选择目录以打开目录详细信息页面。
-
转至 集成 选项卡,然后单击 集成服务。
-
输入以下详细信息:
不感恩的服务 字段 描述 服务 选择 IBM Knowledge Catalog. 存储目录 选择适用于IKC管理的存储目录。 IKC 端点 在 https://
后面加上api.
,即可配置IKC API URL。 例如,如果 URL 是https://dataplatform.cloud.ibm.com
,则端点应为https://api.dataplatform.cloud.ibm.com
。 如果 URL 带有位置信息(https://<region>.dataplatform.cloud.ibm.com
),则端点应为https://api.<region>.dataplatform.cloud.ibm.com
。 -
单击整合。
根据 IKC 中的规则验证屏蔽功能
- 登录 IBM Knowledge Catalog。
- 从左窗格中,转至 监管 > 规则。
- 从“规则”页面中,验证是否定义了与列的数据类对应的规则。 您可以使用以下方式定义新规则添加规则按钮。
所有者可以看到未屏蔽的数据。 要验证掩蔽功能是否正常运行,请登录watsonx.data以 IKC 中非资产所有者的用户身份查询该资产。
受支持的数据类型
IBM® watsonx.data IKC 集成支持以下数据类型:
- 可变字符
- 大整数
- 布尔值
- 日期
- 双
- 整数
- 小整数
- 时间戳记
- Tinyint
- 小数