IBM Cloud Docs
使用语义自动化层丰富数据

使用语义自动化层丰富数据

为了丰富您的数据,IBM® watsonx.data利用语义自动化层 (SAL)IBM Knowledge Catalog。

按照本主题中的过程,使用语义丰富功能通过业务术语和描述丰富您的数据watsonx.data。

准备工作

  • 您已在watsonx.data。

  • 您有一个简化格式的 CSV 文件,其中包含以下字段:

    • 名称:您想要定义的业务术语。
    • 工件类型:始终为“glossary_term”。
    • 说明:该业务术语的解释。

    样本文件格式:

    Name,Artifact Type,Description
    Residence Address,glossary_term,"Identifies an Address at which an Individual dwells, for example John Doe Resides At 102 Oak Court."
    Involved Party Markets Product Limit Condition,glossary_term,"Identifies a Limit Condition that applies to the Involved Party's marketing of the Product; for example, minimum audience or venues."
    Social Security Number,glossary_term,The unique number assigned to an Individual by a governmental agency for the purposes of qualifying for Social Security benefits.
    Rating Provider,glossary_term,"Identifies a Rating Issuer that supplies the Rating; for example, Credit Agency XYZ Provides Rating For a customer's Credit Risk Rating."
    

过程

具有以下角色的用户可以在watsonx.data:

  • 管理员或 Metastore 管理员:这些角色可以注册语义自动化层并访问丰富数据选项卡及其所有用于丰富数据的功能。
  • 用户或 Metastore 查看者:这些角色无法查看配置语义自动化层注册选项卡或丰富数据标签。 但是,当浏览表格中的数据时,他们可以看到任何已发布的丰富信息,例如业务术语和描述。
  1. 登录 watsonx.data 控制台。

  2. 从导航菜单中,选择数据管理器并点击丰富数据标签。

  3. 点击丰富设置并选择管理词汇表上传包含您的业务条款和描述的 CSV 文件。

    要让 LLM 为watsonx.data 中的表和列提出标签和描述建议,请上传 CSV 文件,其中包含所需格式的业务术语(标签)、工件类型及其相应描述。 CSV 文件必须符合以下模板:名称、工件类型、用户界面中显示的描述。

  4. 在里面管理词汇表窗口,单击上传词汇表并将 CSV 文件拖拽至框中或者单击上传。

  5. 选择合并选项:

    • 替换所有值:覆盖所有现有标签和描述。
    • 仅替换定义的值:仅当上传的文件中存在该术语时才替换现有值。
    • 仅替换空值:仅将文件中的标签和描述添加到没有现有标签和描述。
  6. 点击上传词汇表。 词汇表显示标签及其描述的列表。

  7. 点击丰富设置并选择调整阈值修改不同类型浓缩的阈值。 点击保存所有更改

    业务术语语义丰富结果的准确性在很大程度上取决于 IKC 将上传术语与所选表和列进行匹配的能力。 建议的阈值可以调整,以平衡匹配度和置信度。 如果需要更多可能置信度较低的匹配结果,请降低阈值。 如果匹配的数量较少,可信度较高,则提高阈值。

  8. 选择要丰富的模式。

    对于精简版计划用户,您只能从列表中丰富一个模式。 丰富一个模式后,将无法进一步选择其他模式。 丰富的数据将包含针对模式中每个表的每一列的业务术语和描述。

  9. 单击与所选架构对应的溢出菜单,然后选择运行丰富。 您还可以选择一个或多个架构,然后单击丰富

  10. 单击所选架构旁边的溢出菜单,然后选择查看丰富内容。 该页面显示模式内的表列表。

  11. 单击任意表格即可查看详细信息。

  12. 手动分配业务术语和描述:

    a. 将鼠标悬停在业务术语上并选择查看更多,选择治理并点击分配业务条款

    b. 从上传的词汇表中选择相关术语,然后单击分配

  13. 手动添加显示名称和描述:

    a. 将鼠标悬停在业务术语上并选择查看更多,选择细节并点击编辑图标。

    b. 修改显示名称或者描述并点击节省

  14. 查看丰富的列并点击列旁边的溢出菜单或更多的选项并选择标记为已审核

  15. 进入表格视图,检查审核状态是否完成。

  16. 单击所选架构旁边的溢出菜单,然后选择发布。 该页面显示架构内丰富的表的列表。

    当您在 watsonx.data 中发布表格的元数据充实时,新的显示名称、描述和标签等内容就会显示出来,其他用户可以在数据管理器中进行搜索。

  17. 验证浏览数据选项卡数据管理器通过选择成功完成发布后您已丰富的模式。

相关应用程序接口

如需了解相关API的信息,请参阅