IBM Cloud Docs
使用 watsonx.data

使用 watsonx.data

关于 watsonx.data

IBM® watsonx.data 是一种数据管理解决方案,用于通过单一统一数据平台收集,存储,查询和分析所有企业数据。 它提供了一个灵活可靠的平台,经过优化,可在开放式数据格式上工作。 IBM® watsonx.data 的主要功能包括:

  • 一种完全分离计算,元数据和存储的架构,提供最终的灵活性。
  • 基于 Presto的分布式查询引擎,旨在处理具有高度弹性和可伸缩性的现代数据格式。
  • watsonx.data,IBM Db2 Warehouse SaaS,NPSaaS 或任何其他数据管理解决方案之间通过公共 Iceberg 表格式支持,连接器和可共享元数据存储进行数据共享。

要供应 watsonx.data 实例,请参阅 watsonx.data

Analytics Engine 的用例

您需要 IBM Analytics Engine Spark 实例以使用 watsonx.data 来实现以下特定用例:

  • 将大量数据采集到 watsonx.data 表 (S3,COS 或兼容存储器) 中。 您还可以在采集之前使用 Spark 过程代码来清理和变换数据。 您可以使用 watsonx.data中的可用引擎来查询表中的数据。
  • 用于增强表的 watsonx.data 性能的表维护操作。 通过使用 Iceberg 表格式,您可以使用 Spark 来执行诸如文件压缩,快照清除,移除孤立文件,模式演进等操作。
  • 对于难以表示为查询的复杂分析,Spark 过程编程是适合数据转换的解决方案。

要开始使用 watsonx.data 和 IBM Analytics Engine Serverless Spark,请参阅 供应 Analytics Engine 实例