watsonx.data での作業
watsonx.data の概要
IBM® watsonx.data は、単一の統合データ・プラットフォームを使用してすべてのエンタープライズ・データを収集、保管、照会、および分析するためのデータ管理ソリューションです。 オープン・データ・フォーマットで動作するように最適化された、柔軟で信頼性の高いプラットフォームを提供します。 IBM® watsonx.data の主な機能は以下のとおりです。
- 計算、メタデータ、およびストレージを完全に分離して究極の柔軟性を提供するアーキテクチャー。
- Prestoに基づく分散照会エンジン。高度な弾力性と拡張性を備えた最新のデータ・フォーマットを処理するように設計されています。
- watsonx.data、 IBM Db2 Warehouse SaaS、および NPSaaS またはその他の任意のデータ管理ソリューション間での、共通の Iceberg テーブル・フォーマット・サポート、コネクター、および共有可能なメタデータ・ストアを介したデータ共有。
watsonx.data インスタンスをプロビジョンするには、 watsonx.dataを参照してください。
Analytics Engine のユース・ケース
以下の特定のユース・ケースを実現するには、 IBM Analytics Engine Spark インスタンスが watsonx.data と連携する必要があります。
- 大量のデータを watsonx.data テーブル (S3、COS、または互換性のあるストレージ) に取り込む。 取り込みの前に、Spark プロシージャー・コードを使用してデータをクレンジングおよび変換することもできます。 watsonx.dataの使用可能なエンジンを使用して、表からデータを照会できます。
- 表の watsonx.data のパフォーマンスを向上させるための表保守操作。 Isceberg テーブル・フォーマットを使用すると、Spark を使用して、ファイルの圧縮、スナップショットのクリーンアップ、孤立ファイルの削除、スキーマの進化などの操作を実行できます。
- 照会として表現するのが難しい複雑な分析の場合、Spark プロシージャー型プログラミングはデータ変換に適したソリューションです。
watsonx.data および IBM Analytics Engine Serverless Spark の使用を開始するには、 Analytics Engine インスタンスのプロビジョニングを参照してください。