IBM Cloud Docs
IBM® watsonx.data 概述

IBM® watsonx.data 概述

IBM® watsonx.data 是一个混合的开放式数据湖,可随时随地利用您的所有数据为人工智能和分析提供支持。 它结合了数据仓库和数据湖的元素,带来一流的功能和优化,使 watsonx.data 成为下一代人工智能、数据分析和自动化的最佳选择。

它可以帮助您的组织打破数据孤岛,在不中断业务的情况下释放价值,从而将您的所有数据统一起来,用于人工智能和分析。 它还通过开放的现代数据堆栈来增强您当前的数据投资。

它允许开源技术和专有产品共存,并提供一个单一平台,您可以在其中存储数据或附加当前数据源,用于管理和分析企业数据。 附加数据源有助于减少数据重复,降低在多个位置存储数据的成本。

它使用带有应用程序接口(API)和机器学习库的开放数据格式,使数据科学家和数据工程师能够更轻松地使用数据。架构可确保架构和数据完整性,从而更轻松地实施可靠的数据安全和管理机制。

您可以使用 watsonx.data 存储任何类型的数据(结构化、半结构化和非结构化),并使人工智能(AI)和 Business Intelligence (BI)能够直接访问这些数据。 它使用带有API和机器学习库的开放数据格式,使数据科学家和数据工程师能够更轻松地使用数据。watsonx.data 架构可确保架构和数据完整性,从而更轻松地实施可靠的数据安全和管理机制。

主要功能

  • 完全分离计算、元数据和存储的架构,提供极高的灵活性。
  • 多种引擎,如 Presto ( Java )、Presto (C++)、Spark和 Milvus,适用于不同的使用案例,能够快速、可靠、高效地处理大规模数据。
  • 分析数据集的开放格式,允许不同引擎同时访问和共享数据。
  • 通过通用冰山表格式支持、连接器和可共享元数据存储,在watsonx.data、Db2® Warehouse 和Netezza Performance Server或任何其他数据管理解决方案之间共享数据。
  • 内置管理功能与现有解决方案兼容,包括 IBM Knowledge Catalog 和 Apache Ranger。
  • 经济高效、简单易用的对象存储,适用于混合云和多云环境。
  • 与IBM最佳解决方案和第三方服务的强大生态系统集成,从而轻松开发和部署关键用例。

部署选项

watsonx.data 提供以下部署选项:

  • 软件—— watsonx.data 的本地版本可以部署在 IBM Software Hub 上。 欲了解更多详情,请访问 IBM watsonx.data on IBM Software Hub。
  • SaaS – 的 版本可以部署在 或 云上。watsonx.data SaaS IBM Cloud AWS 更多详情,请参阅:
  • 开发者——开发者版本是面向学生、开发者和合作伙伴社区的入门级 watsonx.data。 更多详情,请参阅 设置 watsonx.data 开发者版本