IBM Cloud Docs
常见问题

常见问题

这是有关 IBM® watsonx.data 服务的常见问题及解答 (FAQ) 的集合。

总则

IBM® watsonx.data 是什么?

IBM® watsonx.data 是一个混合、开放的数据湖,可随时随地利用您的所有数据为人工智能和分析提供支持。 它是一种数据管理解决方案,用于通过单一统一数据平台收集,存储,查询和分析所有企业数据 (结构化,半结构化和非结构化)。 它提供了一个灵活可靠的平台,经过优化,可在开放式数据格式上工作。

我可以对 IBM® watsonx.data执行哪些操作?

您可以使用 IBM® watsonx.data 通过单一统一数据平台收集,存储,查询和分析所有企业数据。 您可以连接到多个位置中的数据,并在几分钟内开始使用内置的监管,安全和自动化功能。 您可以使用多个查询引擎来运行分析和 AI 工作负载,从而将数据仓库成本降低高达 50%。

IBM® watsonx.data中支持哪些数据格式?

在 IBM® watsonx.data中支持以下数据格式:

  1. 采集: IBM® watsonx.data 中的数据采集支持 CSV 和 Parquet 数据文件格式。
  2. 根据文件创建表: 根据 IBM® watsonx.data 中的文件创建表支持 CSV,Parquet,JSON 和 TXT 数据文件格式。

IBM watsonx.data有哪些关键功能?

IBM® watsonx.data 的主要功能包括:

  • 一种完全分离计算,元数据和存储的架构,提供最终的灵活性。
  • 多个引擎,例如Presto(Java ),Presto(C++) 和 Spark 可快速、可靠、高效地处理大规模大数据。
  • 用于分析数据集的开放式格式,允许不同引擎同时访问和共享数据。
  • 通过公共 Iceberg 表格式支持,连接器和可共享元数据存储,在 watsonx.data,Db2® Warehouse和 Netezza Performance Server 或任何其他数据管理解决方案之间进行数据共享。
  • 与现有解决方案兼容的内置治理,包括IBM Knowledge Catalog。
  • 在混合云和多云环境中提供经济有效的简单对象存储。
  • 与 IBM一流解决方案和第三方服务的强大生态系统集成,支持轻松开发和部署关键用例。

默认 IBM 受管存储的最大大小是多少?

IBM 管理的存储默认为 10 GB。

Presto

什么是Presto?

Presto是一个分布式 SQL 查询引擎,能够查询位于不同数据源中的庞大数据集,从而大规模地解决数据问题。

Presto服务器类型有哪些?

Presto安装包括三种服务器类型:协调器、工作器和资源管理器。

IBM watsonx.data中支持哪些 SQL 语句?

有关受支持的 SQL 语句的信息,请参阅 支持的 SQL 语句

Metastore

什么是 HMS (Hive Metastore)?

HiveMetastore(HMS)是一种服务,用于在后端关系数据库管理系统(RDBMS)或Hadoop分布式文件系统(HDFS)中存储与Presto和其他服务相关的元数据。

安装和设置

如何供应 IBM® watsonx.data 服务实例?

要供应实例,请参阅 watsonx.data

如何删除 IBM® watsonx.data 实例?

要删除实例,请参阅 删除 watsonx.data 实例

如何访问 IBM® watsonx.data Web 控制台?

要访问 IBM® watsonx.data Web 控制台,请登录到 IBM Cloud 帐户,并遵循此处提到的步骤,在 watsonx.data打开 Web 控制台

如何供应引擎?

从 IBM® watsonx.data Web 控制台,转至基础架构管理器以供应引擎。 有关更多信息,请参阅 供应引擎

如何配置商品目录或元商店?

要配置具有引擎的目录,请参阅 使目录与引擎相关联

如何配置存储器?

从 IBM® watsonx.data Web 控制台,转到基础架构管理器配置存储。 有关更多信息,请参阅 添加存储目录对

访问

如何管理 IBM® watsonx.data的 IAM 访问权?

IBM Cloud® Identity and Access Management (IAM) 控制帐户中用户对 IBM® watsonx.data 服务实例的访问。 访问 IBM® watsonx.data 服务的每个用户都必须分配一个具有 IAM 角色的访问策略。 有关更多信息,请参阅 管理 watsonx.data的 IAM 访问权

如何添加和除去用户?

要在组件中添加或除去用户,请参阅 管理用户访问权

如何为用户提供访问控制?

要为用户提供访问控制以限制未经授权的访问,请参阅 管理数据策略规则

向用户分配访问权的过程是什么?

要向用户分配访问权,请参阅 管理角色和特权

要将访问权分配给组的过程是什么?

要分配对组的访问权,请参阅 管理角色和特权

Presto发动机

如何创建引擎?

要创建引擎,请参阅 供应引擎

如何暂停和恢复引擎?

要暂停引擎,请参阅 暂停引擎

要恢复已暂停的引擎,请参阅 恢复引擎

如何删除引擎?

要删除引擎,请参阅 删除引擎

如何运行 SQL 查询?

您可以使用 IBM® watsonx.data 中的“查询”工作空间界面来针对数据运行 SQL 查询和脚本。 有关更多信息,请参阅 运行 SQL 查询

数据库和连接器

如何添加数据库?

要添加数据库,请参阅 添加数据库/目录对

如何除去数据库?

要除去数据库,请参阅 删除数据库/目录对

IBM® watsonx.data 当前支持哪些数据源?

IBM® watsonx.data 当前支持以下数据源:

  1. IBM Db2
  2. IBM Netezza
  3. Apache Kafka
  4. MongoDB
  5. MySQL
  6. PostgreSQL
  7. SQL Server
  8. 定制
  9. Teradata
  10. SAP HANA
  11. Elasticsearch
  12. SingleStore
  13. Snowflake
  14. IBM Data Virtualization Manager for z/OS

如何将数据装入 IBM® watsonx.data?

有 3 种方法可将数据装入到 IBM® watsonx.data中。

  1. Web 控制台: 您可以使用“数据管理器”页面中的“采集作业”选项卡将数据安全轻松地装入到 IBM® watsonx.data 控制台中。 有关更多信息,请参阅 使用 Spark 采集数据
  2. 命令行界面: 您可以通过 CLI 将数据装入到 IBM® watsonx.data 中。 有关更多信息,请参阅 通过 CLI 装入或摄入数据
  3. 创建表: 您可以使用“创建表”选项来装入或摄入本地数据文件以创建表。 有关更多信息,请参阅 创建表

如何创建表?

您可以使用 Web 控制台通过“数据管理器”页面创建表。 有关更多信息,请参阅 创建表

如何创建模式?

您可以使用 Web 控制台通过“数据管理器”页面创建模式。 有关更多信息,请参阅 创建模式

如何查询装入的数据?

您可以使用 IBM® watsonx.data 中的“查询”工作空间界面来针对数据运行 SQL 查询和脚本。 有关更多信息,请参阅 运行 SQL 查询

摄入

有哪些存储选项?

可用的存储选项包括 IBM Storage Ceph、IBM Cloud Object Storage (COS)、AWS S3 和 MinIO 对象存储。

可以采集哪种类型的数据文件?

只能采集 Parquet 和 CSV 数据文件。

可以同时采集多个文件的文件夹吗?

是,将采集多个数据文件的文件夹。 必须使用其中的数据文件创建 S3 文件夹以进行摄入。 源文件夹必须包含所有 parquet 文件或所有 CSV 文件。 有关创建 S3 文件夹的详细信息,请参阅 准备摄入数据

在摄入期间,命令行界面中支持哪些命令?

有关摄入期间命令行界面中支持的命令,请参阅 通过 CLI 装入或摄入数据

价格套餐

在何处可以了解有关每个定价套餐的更多信息?

watsonx.data 作为服务提供三个定价套餐:

  1. Lite 套餐: 它在 30 天的时间范围内提供 2000 个资源单元 (在 IBM Cloud的 "计费和使用情况" 页面上监视) 的免费使用限制。 上限值显示在 IBM Cloud 目录供应页面上,并且在供应时反映在 watsonx.data 实例中的计费页面上。
  2. 企业套餐: 您为添加的每个基础架构资源按小时付费。 从支持服务开始,然后构建所需的引擎和服务。 这具有在映射到付款方式 (无论是 "现收现付" 还是 "预订") 的“资源单位”中计算的每小时费率。

更多信息,请参阅 订购计划

Lite 套餐

轻量套餐信用卡免费吗?

是,如果您使用 IBM 云试用帐户,那么轻量套餐将免费提供信用卡。 您在 30 天的时间范围内设置了 2000 个资源单位的免费使用限制,以先试用该产品的日期为准。 更多信息,请参阅 订购计划

轻量套餐中包含哪些内容?

为您提供了轻量套餐以试用 watsonx.data 的基本功能,并且可供所有 IBM Cloud 帐户类型 (例如试用,现收现付和预订) 使用。 它仅支持基本功能。 它在 AWS 上不可用,并且限制为每个 IBM Cloud 帐户 (跨区域) 一个 watsonx.data 实例。

主要支持的功能:

  1. 能暂停和恢复Presto引擎。
  2. 能够连接到 IBM Cloud 提供的 Cloud Object Storage (COS),并为您自己的 COS 或 S3 存储提供凭据。
  3. 能够删除 Presto、Milvus 以及与您的存储空间的连接。

限制:

  1. 它限于为每个资源组供应单个实例。
  2. 在暂挂实例之前,它限制为 2000 个资源单元 (RU)。 上限值显示在 IBM Cloud 目录供应 页面上,并且在供应时反映在 watsonx.data 实例中的计费页面上。 您的许可证将在达到 2000 个 RU 的上限或超过 30 天的试用期时到期。
  3. 最多只能有一个 Presto 引擎或 Milvus 服务,以及一个启动器大小(每小时 1.25 RU)或两者兼而有之。
  4. 它限于每个引擎和服务的最小节点大小和概要文件。 不能增大节点大小。
  5. 精简版实例不能用于生产目的。
  6. 轻量实例可随时移除,并且不可恢复 (无 BCDR)。
  7. 引擎缩放功能不可用。

使用精简版计划的限额是多少?

watsonx.data 实例的 Lite 套餐通常是免费使用的试用帐户,具有容量限制 (2000 个资源单元),功能部件的时间范围为 30 天。 您可以使用该帐户来探索和熟悉 watsonx.data。 您需要创建付费 IBM 云帐户 ("现收现付" 或 "预订"),然后供应企业套餐实例以访问所有功能部件和功能。

我已耗尽所有资源单元。 如何删除我的精简版计划实例?

您可以从资源组中删除轻量套餐实例,否则 IBM 云资源集合将在 40 天后将其除去。

轻量套餐已结束。 如何升级到企业套餐?

在轻量套餐结束之前或之后,您可以创建付费帐户,无论是 "Subscription" 还是 "Pay as you go" IBM Cloud。 现在,您可以创建新的 watsonx.data 实例。 企业套餐在 IBM Cloud 和 AWS 环境中可用。 您可以在创建付费 IBM 云帐户 ("Subscription" 或 "Pay as you go") 后创建企业套餐实例,然后可以使用您拥有的 Cloud Object Store 存储区来存储数据。 有关更多信息,请参阅 如何为 watsonx.data 企业套餐 创建实例,并参阅 如何使用您拥有的 Cloud Object Store 存储区来存储数据

如何将轻量套餐中的数据保存到企业套餐?

您可以创建自己拥有的 IBM Cloud Object Store (COS) 存储区,并将其连接到 watsonx.data的轻量套餐实例。 然后,可以将数据写入您拥有的 COS 存储区。 然后,一旦创建了付费 IBM 云帐户 ("现收现付" 或 "预订"),就可以创建 watsonx.data 的企业实例,并将其连接到您拥有的相同 COS 存储区以继续使用相同的数据文件。

企业套餐

企业套餐中包含哪些内容?

除轻量套餐外,企业套餐还包含以下功能:

  1. 您为添加的每个基础架构资源按小时付费。 从支持服务开始,然后构建所需的引擎和服务。 这具有在映射到付款方式 (无论是 "现收现付" 还是 "预订") 的“资源单位”中计算的每小时费率。
  2. Presto 以及外部Spark引擎和 服务。Milvus
  3. Hive metastore 和 Iceberg 目录。
  4. 基础结构管理器和查询编辑器。
  5. Db2 Warehouse 和 Netezza 集成。
  6. 可缩放(增加和减少)Presto引擎的节点大小。
  7. 在 IBM Cloud 和 AWS 环境中都可用。

企业套餐下有哪些不同的付款计划?

企业套餐下的不同支付套餐为 "Subscription" 或 "Pay as you go"。

企业计划中是否包含 Milvus 等服务费用?

是的,Milvus 服务包含在企业计划中。