IBM Cloud Docs
watsonx.data での作業

watsonx.data での作業

watsonx.data の概要

IBM® watsonx.data は、単一の統合データ・プラットフォームを使用してすべてのエンタープライズ・データを収集、保管、照会、および分析するためのデータ管理ソリューションです。 オープン・データ・フォーマットで動作するように最適化された、柔軟で信頼性の高いプラットフォームを提供します。 IBM® watsonx.data の主な機能は以下のとおりです。

  • 計算、メタデータ、およびストレージを完全に分離して究極の柔軟性を提供するアーキテクチャー。
  • Prestoに基づく分散照会エンジン。高度な弾力性と拡張性を備えた最新のデータ・フォーマットを処理するように設計されています。
  • watsonx.data、 IBM Db2 Warehouse SaaS、および NPSaaS またはその他の任意のデータ管理ソリューション間での、共通の Iceberg テーブル・フォーマット・サポート、コネクター、および共有可能なメタデータ・ストアを介したデータ共有。

watsonx.data インスタンスをプロビジョンするには、 watsonx.dataを参照してください。

Analytics Engine のユース・ケース

以下の特定のユース・ケースを実現するには、 IBM Analytics Engine Spark インスタンスが watsonx.data と連携する必要があります。

  • 大量のデータを watsonx.data テーブル (S3、COS、または互換性のあるストレージ) に取り込む。 取り込みの前に、Spark プロシージャー・コードを使用してデータをクレンジングおよび変換することもできます。 watsonx.dataの使用可能なエンジンを使用して、表からデータを照会できます。
  • 表の watsonx.data のパフォーマンスを向上させるための表保守操作。 Isceberg テーブル・フォーマットを使用すると、Spark を使用して、ファイルの圧縮、スナップショットのクリーンアップ、孤立ファイルの削除、スキーマの進化などの操作を実行できます。
  • 照会として表現するのが難しい複雑な分析の場合、Spark プロシージャー型プログラミングはデータ変換に適したソリューションです。

watsonx.data および IBM Analytics Engine Serverless Spark の使用を開始するには、 Analytics Engine インスタンスのプロビジョニングを参照してください。