创建项目
项目是在 IBM Watson® Discovery 应用程序中收集和管理资源的便捷方法。 您可以分配 项目类型,并通过创建集合将数据连接到项目。
在创建项目之前,请决定哪种项目类型最适合您的需求。
项目描述
需求 | 目标 | 项目类型 |
---|---|---|
我要抽取数据以支持重复文档处理任务的自动化。 | 我希望快速了解从我的文档中提取的数据,并通过应用扩充项来改进数据。 | 智能文档处理 |
哪个文档包含我问题的答案? | 在包含结构化和非结构化数据混合的源中查找有意义的信息,并将其显示在独立企业搜索应用程序或业务应用程序的搜索字段中。 | 文档检索 |
我的任务需要的合同部分在何处? | 快速从合同中提取关键信息。 | 合同的文档检索 |
我希望构建的聊天机器人使用我拥有的知识。 | 让虚拟助手快速访问存储在各种外部数据源和文档格式中的技术信息,以回答客户问题。 | 会话式搜索 |
我想要揭示我不知道的洞察。 | 从模式分析中获取洞察或执行根本原因分析。 | 内容挖掘 |
如果将 Discovery 服务作为 IBM Cloud Pak for Data 的一部分作为服务部署创建,那么 Discovery 项目将与 IBM Cloud中显示的部署项目分开且不同。
要创建项目,请完成以下步骤:
-
选择 “我的项目” 打开项目页面。
-
点击 “新建项目”。 命名项目,然后选择项目类型。
有关每种类型的更多信息,请参阅 项目类型。
-
如果选择 文档检索 项目类型,并且数据源为英语,请决定是否启用 Content Intelligence 功能。
如果数据源包含合同,请通过选择 应用合同扩充项来启用该功能。 滚动以查看复选框 (如果需要)。
-
单击下一步。
-
选择并配置数据源。
有关受支持的数据源的更多信息,请参阅 创建集合。
利用页面标题中提供的以下资源:
- 要打开产品文档,请单击“帮助”图标
。
- 要查看所有项目,请单击 我的项目。
项目类型
选择项目类型以自动将正确的扩充项集应用于文档。 可用的改进工具因项目类型而异,部署方法 (针对每个用例进行了优化) 也是如此。
以下项目类型可供选择:
智能文档处理
使用此项目类型可快速了解 Discovery 从文档中抽取的数据。 您可以在富文本格式预览中查看抽取的数据 (缺省视图为 PDF)。 如果抽取的数据不满足您的需求,那么可以应用扩充项来改进数据。
此项目类型仅可从 IBM Cloud管理的实例获取。
您添加到此类型的项目的文档将通过以下方式自动扩充:
- 实体 (例如,适当的名词) 已识别并标记。
文档检索
使用此项目类型可在数据中搜索和查找最相关的答案。 此类型的项目通常部署为添加到 Web 站点或其他应用程序的搜索字段组件。
您添加到此类型的项目的文档将通过以下方式自动扩充:
- 实体 (例如,适当的名词) 已识别并标记。
稍后当将自然语言短语作为搜索查询提交以返回智慧响应时,将使用此标记信息。
您可以使用样本文档检索项目进行探索。 更多信息,请参阅 Watson Discovery 入门指南。
合同的文档检索
如果您正在使用英语法律合同,请启用 Content Intelligence 功能以应用合同扩充项,该扩充项可以识别和标记数据中与合同相关的概念。 使用此项目类型可自动执行复杂的业务流程,例如合同复审和协商。 此项目类型可帮助提高生产力,最大限度降低成本,并减少您的法律风险。
只有已安装部署或高级或企业计划管理部署的用户才能创建此类项目。
除了应用于典型文档检索项目的扩充项外,还会自动生成以下扩充项:
- 对源文档中的表中的内容进行了标记,以便稍后可以找到该内容。
- 合同详细信息 (例如,合同中涉及的付款条款或参与方) 将进行标识和标记。
对于您添加到项目的任何集合,将自动启用光学字符识别 (OCR),以便处理来自已扫描文档或其他图像的文本。
应用合同扩充项时,无法使用“智能文档理解”对文档进行注释。 将自动应用可识别合同相关信息的预训练 SDU 模型。 表格理解增强功能自动应用。
有关更多信息,请参阅 了解合同。
会话式搜索
对话式搜索 项目将来自已连接数据集合的信息作为客户询问聊天机器人 (也称为 助手) 的问题的答案。
将 IBM® watsonx™ Assistant 和 Discovery 一起用于授予助手对技术内容和其他知识库资源的访问权,而不必重新定位或复制公司数据。 内置同步功能意味着助手可以共享可用的最新信息。 使用随 watsonx Assistant 提供的集成来部署助手,以在几分钟内将此项目连接到各种平台 (包括公司 Web 站点)。
您添加到此类型的项目的文档不会自动扩充。
如果需要从虚拟助手执行更复杂的搜索,那么可能要创建 Document Retrieval 项目,而不是 Conversational Search 项目。 有关更多信息,请参阅 为聊天机器人选择正确的项目类型。
IBM Cloud 要考虑启用的另一个功能是 强调答案 功能。 启用后,返回给与助手交互的客户的答案将显示搜索响应中以粗体突出显示的准确答案。 有关如何确定准确答案的更多信息,请参阅 答案查找。
有关构建 watsonx Assistant 搜索技能的更多信息,请参阅相应的部署文档:
内容挖掘
使用此项目类型可发现数据中隐藏的洞察、趋势和关系。
只有已安装部署或高级或企业计划管理部署的用户才能创建此类项目。
此项目类型对于分析结构化数据 (例如,通过上载 CSV 文件或通过连接到数据库数据源添加的数据) 特别有用。 只能从 Discovery 用户界面将一个集合添加到此类型的项目。
您作为初始集合的一部分添加的文档将通过以下方式自动扩充:
- 识别并标记语音部分。
在添加集合并 (可选) 将更多扩充项应用于数据之后,将提供一个全功能应用程序供您部署。 您可以使用该应用程序来深入研究数据。 有关使用应用程序的更多信息,请参阅 使用已部署的内容挖掘应用程序分析数据。
从“内容挖掘”应用程序中,您可以创建其他项目类型中不可用的以下扩充类型:
您可以从已部署的内容挖掘应用程序创建集合。 您创建的集合不会添加到现有内容挖掘项目。 将创建新的内容挖掘项目以存储集合。 集合只能包含已上载的 CSV 文件。 将为生成的项目提供您为集合指定的名称。
由于您添加到此类型的项目的数据通常是结构化的,因此请考虑使用 API 以发现查询语言 (DQL) 提交查询。 通过 DQL 查询,您可以从特定字段获取信息或查找特定扩充项类型提及项。 不能将相关性训练应用于 内容挖掘 项目。
定制
如果您不希望使用其他某个项目类型,请选择此类型。 不会自动应用任何扩充项,因此您只能添加您的用例所必需的那些扩充项。
基本项目缺省值
缺省情况下,某些扩充项和查询结果设置将应用于每种项目类型。
项目类型 | 缺省扩充项 | 缺省查询结果设置 |
---|---|---|
智能文档处理 | 实体 | 构面 (按实体),传递 |
文档检索 | 实体 | 构面 (按实体),传递 |
合同的文档检索 | 实体,表理解和合同 | “构面”(按类别、性质、合同期限、合同付款期限、合同类型、合同货币、发票买方、发票供应商、发票货币、采购单买方、采购单供应商、采购单付款期限)和“表检索” |
会话式搜索 | 无 | 段落 |
内容挖掘 | 词性 | 无 |
定制 | 无 | 段落 |
项目限制
您可以创建的项目数量取决于您的 Discovery 计划类型。
计划 | 每个服务实例的项目 |
---|---|
Cloud Pak for Data | 无限制 |
Premium | 100 |
企业 | 100 |
加号 (包括试用) | 20 |
样本项目将从项目总数中排除。
重命名项目
无法重命名 样本项目。
要在创建项目后对其进行重命名,请完成以下步骤:
- 前往 “我的项目” 页面。
- 找到要重命名的项目,单击 项目操作 图标
,然后选择 重命名。
- 编辑项目名称,然后点击 “应用”。
删除项目
如果要删除项目,但保留项目中的集合,请先与其他项目共享该集合,然后再完成这些步骤。 从另一个项目 (允许多个集合的类型),打开 管理集合 选项卡。 单击 新建集合,然后单击 复用现有集合中的数据。 选择您想要保留的收藏,然后点击完成。
无法删除 样本项目。
要删除项目,请完成以下步骤:
- 前往 “我的项目” 页面。
- 找到要删除的项目,单击 项目操作 图标
,然后选择 删除。
- 单击删除。