IBM Cloud Docs
IBM Analytics Engine 无服务器实例的发行说明

IBM Analytics Engine 无服务器实例的发行说明

使用这些发行说明来了解按日期分组的 IBM Analytics Engine 无服务器实例的最新更新。

2024 年 2 月

2024 年 2 月 2 日

现在,实例主目录 中提供了应用程序日志
现在,缺省情况下,应用程序日志将转发到 Analytics Engine 实例主目录。 您可以从 IBM Cloud Object Storage (COS) 存储区访问日志信息。 您可以从路径 <instance_id>/logs/<app_id> 下载任何特定应用程序的日志文件,以用于记录,共享和调试目的。 有关更多信息,请参阅 将日志转发到实例主目录
用于记录 Spark 应用程序事件的新位置
从 7 2024 年 2 月开始,Spark 应用程序事件将记录在实例主存储区中可用的新路径 (/<instance_id>/spark-events) 上。 要在 Spark 历史记录界面上查看较旧的应用程序,请将 Spark 应用程序事件复制到新位置。 有关复制事件的更多信息,请参阅 Spark 历史服务器

2023 年 12 月

2023 年 12 月 1 日

加密 Spark 工作负载的内部网络数据
现在,您可以通过在实例级别或作业级别配置 IBM Analytics Engine 属性,为传输中的内部网络数据 (Spark 应用程序组件之间的内部通信) 启用数据加密。 有关加密 Spark 工作负载的内部网络数据的更多信息,请参阅 加密 Spark 工作负载的内部网络数据

2023 年 11 月

2023 年 11 月 22 日

配置 Spark 日志级别信息
IBM Analytics Engine Serverless Spark 应用程序中的缺省日志级别将在 2023 年 1 月之前更改为 "ERROR"。3 您可以在 "INFO" 级别更改日志记录的现有日志配置,以显示相关的简明消息。 有关更改日志级别的更多信息,请参阅 配置 Spark 日志级别信息

2023 年 10 月

2023 年 10 月 19 日

除去开发 (*-devel) 软件包
出于安全原因,从现在开始,未在 Spark 运行时上预安装 *-devel 软件包 (操作系统开发软件包)。 如果您已在使用开发包,那么无法编译使用开发包的程序。 有关任何查询,请联系 IBM 支持人员。

2023 年 10 月 9 日

除去 Spark 3.1 支持
IBM Analytics Engine 不再支持 Spark 3.1。 将现有 IBM Analytics Engine 实例升级到 Spark 3.3 以获取最新功能和增强功能。 有关升级的更多信息,请参阅 替换实例缺省运行时

从当前发行版开始,Spark 3.3 是 IBM Analytics Engine 实例的缺省运行时版本。

2023 年 9 月

2023 年 9 月 29 日

与 watsonx.data 集成
IBM Analytics Engine 现在与 IBM® watsonx.data 集成,以利用 watsonx.data的功能功能。 有关集成以及使用 watsonx.data的更多信息,请参阅 使用 watsonx.data

2023 年 9 月 6 日

支持 Spark 3.4
现在,您可以供应缺省 Spark 运行时设置为 Spark 3.4的 IBM Analytics Engine 无服务器套餐实例,这使您能够在 Spark 上运行 Spark 应用程序 3.4。

2023 年 8 月

2023 年 8 月 23 日

不推荐使用来自 Spark 3.1 和 Spark 3.3 运行时的 R v3.6 支持
IBM Analytics Engine 不推荐使用在 2023 年 9 月 6 之前从 Spark 3.1 和 Spark 3.3 运行时对 R v3.6 的支持。 已针对 Spark 3.1 和 Spark 3.3 运行时部署对 R v4.2 的支持。 确保使用新版本的 R v4.2 测试 Spark 应用程序,以了解在 2023 年 9 月 06 日之前发生的任何故障。 如有任何问题,请与 IBM 支持人员联系。 要测试 Spark 应用程序,请参阅 Spark 应用程序 REST API

2023 年 8 月 9 日

不推荐使用对 Spark 的支持 3.1
不推荐使用对 IBM Analytics Engine 上的 Spark 3.1 版本的支持,将很快 (在 2023 年 10 月 9 日之前) 移除该支持。 要确保无缝体验并利用最新功能和改进,请将现有 IBM Analytics Engine 实例升级到 Spark 3.3。 要将实例升级到 Spark 3.3,请参阅 替换实例缺省运行时。 从此发行版开始,Spark 3.3 将是所有已创建的新 IBM Analytics Engine 实例的缺省运行时版本。 此更改使您能够从最新版本中提供的增强功能和优化中获益。

2023 年 7 月

2023 年 7 月 7 日

3.3 的 Spark 维护发行版版本更新
运行时设置为 Spark 3.3 的 Spark 应用程序将从现在开始使用 Spark 3.3.2 在内部运行。 现在,补丁版本已从 3.3.0 升级到 3.3.2。

2023 年 5 月

2023 年 5 月 29 日

从 Spark 3.1 和 Spark 3.3 运行时除去 Python v3.9 支持
IBM Analytics Engine-Serverless Spark 应用程序计划由 June15,2023 停止来自 Spark 3.1 和 Spark 3.3 运行时的 Python v3.9 支持。 已针对 Spark 3.1 和 Spark 3.3 运行时部署对 Python v3.10 的支持。 根据工作负载,确保在 2023 年 6 月 15 日之前使用新版本的 PythonV 3.10 测试 Spark 应用程序是否存在任何故障。 如有任何问题,请与 IBM 支持人员联系。 请参阅测试 Spark 应用程序 使用非缺省语言版本运行 Spark 应用程序 的过程。

2023 年 5 月 25 日

REST API 和 CLI 中应用程序列表的分页
现在,您可以限制 Analytics Engine 无服务器 REST API 端点,SDK 方法和 CLI 命令针对 列示应用程序 返回的应用程序数。 使用查询参数限制来指定要返回的应用程序数,并将 API 响应中 next.startprevious.start 的值指定为开始查询参数的值,以访存结果的下一页或上一页。 这些应用程序将根据提交时间以降序列出,最新的应用程序是第一个应用程序。

分页是此发行版中的可选功能部件。 从服务的下一个发行版开始,缺省情况下将对结果进行分页。

2023 年 1 月 5 日

分析在 Spark 历史记录服务器上运行的应用程序

现在,您可以在 IBM Analytics Engine 无服务器实例上运行 Spark 历史记录服务器。

Spark 历史记录服务器提供了 Web UI 来查看转发到定义为实例主目录的 Object Storage 存储区的 Spark 事件。 Web UI 通过显示以下有用信息来帮助您分析 Spark 应用程序的运行方式:

  • 应用程序在运行时经历的阶段的列表
  • 每个阶段中的任务数
  • 配置详细信息,例如正在运行的执行程序和内存使用情况

在 Spark 历史记录服务器运行时,将对其使用的 CPU 核心和内存收费。 费率为每虚拟处理器核心小时 $0.1475 美元,每千兆字节小时 $0.014 美元。

请参阅 使用 Spark 历史记录服务器

2022 年 9 月

2022 年 9 月 21 日

支持 Spark 3.3
现在,您可以供应缺省 Spark 运行时设置为 Spark 3.3的 IBM® Analytics Engine 无服务器套餐实例,这使您能够在 Spark 上运行 Spark 应用程序 3.3。

2022 年 9 月 9 日

现在,使用 Spark SQL 时,可以使用 Hive metastore 来管理与应用程序表,列和分区信息相关的元数据。
您可以选择将此元存储数据库外部化到外部数据存储,例如 IBM Cloud Data Engine (先前为 SQL Query) 或 IBM Cloud Databases for PostgreSQL 实例。 有关详细信息,请参阅 使用 Spark SQL 和外部元存储

2022 年 7 月

2022 年 7 月 12 日

现在,您可以在新区域中供应 IBM® Analytics Engine 无服务器实例。
除了 IBM Cloud® us-south (达拉斯) 区域外,您现在还可以在 eu-de (Frankurt) 区域中供应无服务器实例。

2022 年 7 月 8 日

用于平台日志记录的新 API
开始使用 log_forwarding_config API 将平台日志从 IBM Analytics Engine 实例转发到 IBM Log Analysis。 虽然您仍可以使用 logging API,但不推荐使用此 API,并且将在不久的将来除去此 API。 有关如何使用 log_forwarding_config API 的详细信息,请参阅 配置和查看日志

2022 年 5 月 13 日

支持 Python 3.9
现在,您可以在 IBM Analytics Engine 无服务器实例上使用 Python 3.9来运行 Spark 应用程序。

2022 年 4 月 4 日

关于 Spark 应用程序可运行时间的限制
Spark 应用程序最多可运行 3 天 (72 小时)。 将自动清除在此时间段之后运行的任何应用程序,以便遵循 Analytics Engine中应用程序的安全性和合规性补丁管理流程。

2022 年 3 月 30 日

开始使用 Analytics Engine 无服务器 CLI
使用本教程可帮助您快速开始简单配置 Analytics Engine 无服务器实例,以及提交和监视 Spark 应用程序。 请参阅 使用 CLI 创建服务实例并提交应用程序

2021 年 9 月 9 日

IBM Analytics Engine Apache Spark 简介

IBM Analytics Engine Apache Spark 能够在几秒内启动 IBM Analytics Engine 无服务器实例,使用您选择的库包对其进行定制,并运行 Spark 工作负载。

新增: IBM Analytics Engine Apache Spark 的标准无服务器套餐现在在达拉斯 IBM Cloud 服务区域中为 GA。

此套餐提供了使用 Apache Spark 的新使用模型,仅当 Spark 工作负载正在运行时,才会分配和使用资源。

IBM Analytics Engine 针对 Apache Spark 的标准无服务器套餐中提供的功能包括:

  • 运行 Spark 批处理和流式应用程序
  • 为交互式用例创建和使用 Jupyter 内核
  • 通过类似于 Apache Livy 的接口运行 Spark 批处理应用程序
  • 使用您自己的库定制实例
  • 自动缩放 Spark 工作负载
  • 将 Spark 工作负载的日志聚集到 Log Analysis 服务器

要开始使用无服务器套餐,请参阅 开始使用无服务器 IBM Analytics Engine 实例