Speech to Text for IBM Cloud Pak for Data 的版本注意事項

IBM Cloud Pak for Data

針對 IBM Cloud Pak for Data，已安裝或內部部署 IBM Watson® Speech to Text 的每一個版本及更新包含下列特性及變更。除非另有說明，否則所有變更都與舊版相容，且會自動且透通地適用於所有新的及現有應用程式。

如需服務已知限制的相關資訊，請參閱已知限制。

如需 IBM Cloud的服務版本及更新項目的相關資訊，請參閱 Speech to Text for IBM Cloud 的版本注意事項。

2024 年 10 月 30 日（版本 4.8.7

4.8.7 版現已上市: Speech to Text 適用於 IBM Cloud Pak for Data 4.8.7 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2024 年 9 月 25 日 (版本 5.0.3 )

版本 5.0.3 現已推出: Speech to Text 版本 5.0.3 的 IBM Cloud Pak for Data 現已推出。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2024 年 8 月 28 日 (版本 4.8.6 )

4.8.6 版現已上市: Speech to Text 適用於 IBM Cloud Pak for Data 4.8.6 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2024 年 8 月 28 日 (版本 5.0.2 )

版本 5.0.2 現已推出: Speech to Text 版本 5.0.2 的 IBM Cloud Pak for Data 現已推出。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2024 年 7 月 31 日（版本 5.0.1

版本 5.0.1 現已推出: Speech to Text 版本 5.0.1 的 IBM Cloud Pak for Data 現已推出。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2024 年 6 月 19 日 (版本 5.0.0 )

版本 5.0.0 現已推出: Speech to Text 版本 5.0.0 的 IBM Cloud Pak for Data 現已推出。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2024 年 4 月 24 日（版本 4.8.5

4.8.5 版現已上市: Speech to Text 適用於 IBM Cloud Pak for Data 4.8.5 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2024 年 3 月 27 日（版本 4.8.4

4.8.4 版現已上市: Speech to Text 適用於 IBM Cloud Pak for Data 4.8.4 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2024 年 2 月 28 日（版本 4.8.3

4.8.3 版現已上市: Speech to Text 適用於 IBM Cloud Pak for Data 4.8.3 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2024 年 1 月 31 日（版本 4.8.2

4.8.2 版現已上市: Speech to Text 適用於 IBM Cloud Pak for Data 4.8.2 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2023 年 11 月 30 日（版本 4.8.0

4.8.0 版現已上市: Speech to Text 適用於 IBM Cloud Pak for Data 4.8.0 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2023 年 9 月 27 日（版本 4.7.3

4.7.3 版現已上市: Speech to Text 適用於 IBM Cloud Pak for Data 4.7.3 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2023 年 7 月 28 日 (版本 4.7.1 )

版本 4.7.1 現已推出: Speech to Text 適用於 IBM Cloud Pak for Data 4.7.1 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2023 年 6 月 9 日（版本 4.7.0

4.7.0 版現已上市: Speech to Text 適用於 IBM Cloud Pak for Data 4.7.0 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

2023 年 5 月 2 日 ( 4.6.5版)

現在提供 4.6.5 版

Speech to Text for IBM Cloud Pak for Data 版本 4.6.5 現在可用。此版本支援 IBM Cloud Pak for Data 4.6.x 版及 Red Hat OpenShift 4.10 版和 4.12版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

新日本新一代電話系統模型

該服務現在為日文提供新一代電話系統模型: ja-JP_Telephony。新模型支援低延遲且已正式發行。它也支援語言模型自訂作業和文法。有關下一代機型和低延遲的詳細資訊，請參閱：

改良新一代英文和日文模型的語言模型自訂作業

服務現在為新一代英文和日文模型提供改良的語言模型自訂作業:

en-AU_Multimedia
en-AU_Telephony
en-IN_Telephony
en-GB_Multimedia
en-GB_Telephony
en-US_Multimedia
en-US_Telephony
ja-JP_Multimedia
ja-JP_Telephony

模型的可見改良: 新技術可改善新英文和日文模型的預設行為。在其他變更中，新技術會最佳化下列參數的預設行為:

基於這些模型新版本的自訂模型的預設 customization_weight 會從 0.2 變更為 0.1。
對於以這些模型的新版本為基礎的自訂模型，預設的 character_insertion_bias 依舊是 0.0，但模型已經改變，這使得語音辨識的參數變得不那麼必要。

升級至新模型: 如果要利用改良的技術，您必須升級以新模型為基礎的任何自訂語言模型。若要升級至這些基本機型的新版本：

透過新增或修改模型包含的自訂字組、語料庫或文法來變更自訂模型。您所做的任何變更都會將模型移至 ready 狀態。
使用 POST /v1/customizations/{customization_id}/train 方法來重新訓練模型。重新訓練會將自訂模型升級至新技術，並將模型移至 available 狀態。

已知問題： 目前，您無法使用 POST /v1/customizations/{customization_id}/upgrade_model 方法將自訂模型升級為新的基本模型之一。此問題將在未來的版本中解決。

使用新模型: 升級至新的基礎模型之後，建議您特別注意用於語音辨識的 customization_weight 及 character_insertion_bias 參數，以評估已升級自訂模型的效能。當您重新訓練自訂模型時:

自訂模型會針對您的自訂模型使用新的預設 customization_weight 0.1。與您的自訂模型相關聯的非預設 customization_weight 會被移除。
自訂模型可能不再需要使用 character_insertion_bias 參數來達到最佳語音識別效果。

語言模型自訂作業的改進使這些參數對於高品質語音辨識而言不太重要:

如果您使用這些參數的預設值，請在升級之後繼續這樣做。預設值仍可提供最佳的語音辨識效果。
如果為這些參數指定非預設值，請在升級後使用預設值進行實驗。您的自訂模型可能適用於具有預設值的語音辨識。

如果您覺得對這些參數使用不同的值可能會改善您的自訂模型的語音辨識，請實驗漸進式變更，以判定是否需要參數來改善語音辨識。

注意： 目前，語言模型自訂的改進只適用於基於前面列出的下一代英文或日文基本語言模型的自訂模型。隨著時間的推移，這些改進將提供給其他下一代語言模型。

更多資訊： 有關升級和使用這些參數進行語音辨識的詳細資訊，請參閱：

語音服務自訂資源的新環境變數

文件現在包括建立環境變數 ${CUSTOM_RESOURCE_SPEECH} 的指示。您將新變數附加至 cpd_vars.sh Script，並建立 Script 來源以在環境中使用該變數。如需相關資訊，請參閱安裝 Watson 語音服務中的 完成這項作業所需的資訊，或參閱語音服務的任何升級主題。

問題修正: 瑞典文電話系統和義大利文多媒體模型現在可用

問題報告修正: 瑞典文電話系統 (sv-SE_Telephony) 和義大利文多媒體 (it-IT_Multimedia) 模型現在可用於安裝。先前，它們無法使用。

問題修正: 改良新一代自訂語言模型的訓練時間

問題報告修正: 現在已大幅改善新一代自訂語言模型的訓練時間。先前，訓練時間比訓練日文自訂語言模型所需的時間要長得多，因為有報告指出訓練日文自訂語言模型。內部修正程式已更正問題。

問題修正: 文法檔案現在可正確處理數字字串

問題報告修正: 當使用文法時，服務現在會正確處理較長的數字字串。先前，它無法完成辨識或傳回不正確的結果。

問題修正程式: 動態產生的文法檔案現在正常運作

問題報告修正: 動態產生的文法檔案現在可以正常運作。先前，動態文法檔案可能會導致內部失敗，如 Speech to Text 與 IBM® watsonx™ Assistant的整合所報告。內部修正程式已更正問題。

問題修正程式: 美式英文日期的智慧型格式化現在是正確的

問題修正: 智慧型格式化現在正確地包含星期幾及日期，例如，在說出音訊中同時呈現這兩者時，Tuesday February 28。先前，在某些情況下，會省略星期幾，且日期不正確地呈現。智慧型格式化是測試版功能。

問題修正: 更新新一代模型之語音猶豫單字的文件

缺陷修正： 更新了下一代機型的語音遲疑字的說明文件。有關美式英文和日文猶豫詞彙的詳細資料已提供。新一代模型在轉錄結果中包含實際猶豫單字，不像前一代模型只包含猶豫標記。如需相關資訊，請參閱語音猶豫和猶豫標記。

已解決安全漏洞

已修復下列安全漏洞：

2023 年 3 月 29 日 ( 4.6.4版)

現在提供 4.6.4 版

Speech to Text for IBM Cloud Pak for Data 版本 4.6.4 現在可用。此版本支援 IBM Cloud Pak for Data 4.6.x 版及 Red Hat OpenShift 4.10 版和 4.12版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

重要：升級至 4.6.3 或 4.6.4 版之前，請先備份您的資料

重要提示： 在您升級到 Watson Speech 服務版本 4.6.3 或 4.6.4 之前，您必須先備份您的資料。將備份保留在安全位置。有關備份 Watson Speech 服務資料的更多信息，請參閱管理 Watson Speech 服務中的備份和恢復 Watson Speech 服務資料。該主題還包括必要時還原資料的相關資訊。

已知問題: 瑞典電話和義大利多媒體模型尚無法使用

已知問題： 尚未提供瑞典語電話 ( sv-SE_Telephony ) 和義大利語多媒體 ( it-IT_Multimedia ) 機型。它們在版本 4.6.5 中提供。

問題報告修正程式: 您現在可以使用進階安裝選項來變更已安裝的模型和語音

問題報告修正: 在安裝期間，您現在可以使用指令行介面的進階安裝選項來指定不同的模型或語音。先前，服務一律會安裝預設模型和語音。此限制繼續適用於 Watson Speech 服務 4.6.0版、4.6.2及 4.6.3版。如需安裝模型和語音的相關資訊，請參閱安裝 Watson 語音服務中的 指定其他安裝選項。

設定負載平衡器逾時

Watson 語音服務要求您將伺服器和用戶端的負載平衡器逾時設定變更為 300 秒。這些設定可確保長時間執行的語音辨識要求 (那些具有長或困難音訊的要求) 有足夠時間來完成。如需相關資訊，請參閱安裝 Watson 語音服務中的 完成此作業所需的資訊。

已解決安全漏洞

已修正下列安全漏洞:

2023 年 2 月 23 日 ( 4.6.3版)

現在提供 4.6.3 版

現在可以使用 Speech to Text for IBM Cloud Pak for Data 4.6.3 版。此版本支援 IBM Cloud Pak for Data 4.6.x 版及 Red Hat OpenShift 4.10版。不再支援 Red Hat OpenShift 4.8 版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

重要事項: 所有前一代模型都已淘汰，將在 2023 年 7 月 31 日結束服務

重要事項: 所有前一個產生模型都已淘汰，並將從 2023 年 7 月 31 日開始結束服務。在該日期，會從服務及文件中移除所有前一個產生模型。前次淘汰日期是 2023 年 3 月 3 日。新的日期可讓使用者有更多時間移轉至適當的下一代模型。但使用者必須在 2023 年 7 月 31 日之前移轉至同等的下一代模型。

大部分前一代模型已在 2022 年 3 月 15 日淘汰。先前未淘汰阿拉伯文和日文模型。現在，淘汰適用於所有前一個產生模型。

如需您可以從每一個已淘汰模型移轉至其中的下一代模型的相關資訊，請參閱上一代語言和模型
如需從前一代模型移轉至下一代模型的相關資訊，請參閱移轉至下一代模型。
如需所有下一代模型的相關資訊，請參閱下一代語言和模型

附註: 從服務移除前一代 en-US_BroadbandModel 時，下一代 en-US_Multimedia 模型將變成語音辨識要求的預設模型。

已知問題: 您無法使用進階安裝選項來變更已安裝的模型和語音

已知問題: 您目前無法使用進階安裝選項來指定不同的模型或語音。服務一律會安裝預設模型和語音。如需在安裝之後變更模型的相關資訊，請參閱 Watson 上的語音服務 IBM Cloud Pak for Data的管理主題中的 更新 Watson 語音服務的模型和語音。

已知問題: 升級至 4.6.3 版可能無法完成

已知問題: 升級至 4.6.3版時，MinIO 備份工作在完成時可能無法刪除。如果發生這種情況，解決方案是刪除工作，在此之後，升級會正常進行。執行下列步驟解決問題。

若要判定 MinIO 備份工作是否保持未刪除狀態，請發出下列指令:
```
oc get job --namespace {${PROJECT_CPD_INSTANCE} | grep speech-cr-ibm-minio-backup
```
未刪除的 MinIO 工作由下列格式的項目識別:
```
speech-cr-ibm-minio-backup   1/1   3m25s   1d
```

若要刪除 MinIO 備份工作，請發出下列指令:

oc delete job speech-cr-ibm-minio-backup --namespace ${PROJECT_CPD_INSTANCE}

刪除備份工作之後，升級會繼續並完成。

問題修正: 更新加拿大法文下一代電話系統模型 (需要升級)

問題報告修正: 已更新加拿大法文下一代電話系統模型 fr-CA_Telephony，以解決可能在語音辨識期間造成錯誤的內部不一致問題。 您需要升級以 fr-CA_Telephony 模型為基礎的任何自訂模型。 如需更多關於升級自訂模型的資訊，請參閱

問題修正: 現在提供新一代巴西葡萄牙文多媒體模型

問題報告修正: 現在 IBM Cloud Pak for Data的 Speech to Text 可以使用新一代巴西葡萄牙文多媒體模型。先前，模型無法使用。

將字組直接新增至基於下一代模型的自訂模型會增加訓練時間

將自訂字組直接新增至基於下一代模型的自訂模型，會導致模型訓練所花費的時間比否則的時間長幾分鐘。如果您要使用使用 POST /v1/customizations/{customization_id}/words 或 PUT /v1/customizations/{customization_id}/words/{word_name} 方法所新增的自訂字組來訓練模型，請為模型留出幾分鐘的額外訓練時間。如需相關資訊，請參閱：

使用服務實例的相關資訊

文件現在包括使用指令行介面 (cpl-cli) 建立服務實例以及管理服務實例的相關資訊。如需相關資訊，請參閱 Watson 語音服務 on IBM Cloud Pak for Data的下列主題:

後置安裝設定 下的 建立 Watson 語音服務實例
管理下的 管理 Watson 語音服務實例

已解決安全漏洞

已修正下列安全漏洞:

安全公告: IBM Watson Speech Services Cartridge for IBM Cloud Pak for Data 在 Pipa Setuptools 中容易遭到阻斷服務的攻擊(CVE-2022-40897)

2023 年 1 月 30 日 ( 4.6.2版)

現在提供 4.6.2 版

Speech to Text for IBM Cloud Pak for Data 版本 4.6.2 現在可用。此版本支援 IBM Cloud Pak for Data 4.6.x 版及 Red Hat OpenShift 4.8 和 4.10版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

自訂資源現在包含新的 fileStorageClass 內容

除了現有的 blockStorageClass 內容之外，Watson Speech 服務的自訂資源現在還包含 fileStorageClass 內容。安裝或升級服務時，您可以同時指定區塊及檔案儲存空間類別。在從舊版升級期間，cli manage apply-cr 指令上的 --file_storage_class 選項會自動將新內容新增至自訂資源。

如需與每一個支援的儲存空間解決方案搭配使用之可用區塊及檔案儲存空間類別的相關資訊，請參閱 Watson 上的語音服務 IBM Cloud Pak for Data中「安裝 Watson 語音服務」頁面上 完成此作業所需的資訊 下的 儲存體需求 表格。

佈建服務實例的其他相關資訊

文件現在包含以程式化方式建立服務實例的相關資訊。它還包括列出服務實例及刪除服務實例的範例。如需相關資訊，請參閱 Watson IBM Cloud Pak for Data中 後置安裝設定 說明文件中的 建立 Watson 語音服務實例。

MinIO 資料儲存庫已啟用伺服器端加密

現在，語音服務已在 MinIO 資料儲存庫中啟用物件儲存空間的伺服器端加密。您不需要採取任何動作。

變更為審核 Webhook

語音服務現在已移除審核 Webhook 相依關係。服務現在會將審核事件直接寫入伺服器。升級至 4.6.2版之後，部分 Webhook 資源可能會保留，直到所有服務都可以移除相依關係為止。其餘資源將在未來版本中移除。您不需要採取任何動作。

新的荷蘭荷蘭新一代多媒體模型

該服務現在為荷蘭荷蘭文提供下一代多媒體模型: nl-NL_Multimedia。新模型支援低延遲且已正式發行。它也支援語言模型自訂作業和文法。如需下一代模型及低延遲的相關資訊，請參閱

新的瑞典下一代電話系統模型

該服務現在為瑞典文提供下一代電話系統模型: sv-SE_Telephony。新模型支援低延遲且已正式發行。它也支援語言模型自訂作業和文法。如需下一代模型及低延遲的相關資訊，請參閱

更新英國新一代電話系統模型

英文下一代電話機型已更新，語音識別功能得到改善：

en-AU_Telephony
en-GB_Telephony
en-IN_Telephony
en-US_Telephony

所有這些模型都繼續支援低延遲。您不需要升級基於這些模型的自訂模型。如需所有可用的下一代模型的相關資訊，請參閱下一代語言和模型。

max_alternatives 參數現在可與下一代模型搭配使用

max_alternatives 參數現在可與所有下一代模型搭配使用。此參數一般適用於所有下一代模型。如需相關資訊，請參閱替代項目數上限。

問題修正: 容許將 max_alternatives 及 end_of_phrase_silence_time 參數與下一代模型搭配使用

問題修正: 當您將相同要求中的 max_alternatives 和 end_of_phrase_silence_time 參數與下一代模型搭配使用時，服務現在會傳回多個替代文字記錄，同時也遵守指出的暫停間隔。先前，在單一要求中使用這兩個參數會產生失敗。 (將 max_alternatives 參數與下一代模型搭配使用之前已提供給有限數目的客戶作為實驗性特性。)

問題修正: 更新至日文下一代多媒體模型 (需要升級)

問題修正: 已更新日文下一代多媒體模型 ja-JP_Multimedia，以解決內部不一致的問題，這可能導致在低延遲語音辨識期間發生錯誤。 您需要升級以 ja-JP_Multimedia 模型為基礎的任何自訂模型。 如需更多關於升級自訂模型的資訊，請參閱

問題修正: 新增文件準則，以根據下一代模型來建立日文類似音

問題修正: 在以下一代模型為基礎的日文自訂語言模型的類似音中，字元序列 ウー 在部分左側環境定義中不明確。請勿使用以標音 /o/ 結尾的字元 (音節)，例如 ロ 和 ト。在這種情況下，請使用 ウウ 或僅使用 ウ 而非 ウー。例如，使用 ロウウマン 或 ロウマン 來取代 ロウーマン。如需相關資訊，請參閱適用於日文的準則。

問題修正: 在轉錄結果中正確使用 display_as 欄位

問題報告修正: 對於具有下一代模型的語言模型自訂作業，自訂字組的 display_as 欄位值現在會出現在所有文字記錄中。先前，word 欄位的值有時會出現在轉錄結果中。

已解決安全漏洞

已修正下列安全漏洞:

2022 年 11 月 30 日 ( 4.6.0版)

現在提供 4.6.0 版

Speech to Text for IBM Cloud Pak for Data 版本 4.6.0 現在可用。此版本支援 IBM Cloud Pak for Data 4.6.x 版及 Red Hat OpenShift 4.8 和 4.10版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

現在支援 Amazon Web Services (AWS)

Watson Amazon Web Services™ (AWS™) 現在支援 IBM Cloud Pak for Data 的語音服務。服務支援 Amazon Elastic Block Store，您可以透過將語音服務自訂資源的 blockStorageClass 內容設為 gp2-csi 或 gp3-csi 來指定。

現在支援新的儲存類別

Watson IBM Cloud Pak for Data 的語音服務現在支援兩個額外的儲存空間類別:

IBM Cloud Block Storage (ibmc-block-gold)
NetApp Trident (ontap-nas)

您可以使用語音服務自訂資源的 blockStorageClass 內容來指定儲存類別。如需所有受支援儲存類別的相關資訊，請參閱 Watson 上的語音服務 IBM Cloud Pak for Data中的下列主題:

安裝 Watson 語音服務 中的 開始之前
使用 Watson 語音服務自訂資源 中的 指定儲存類別

已知問題: 部分 Watson 語音服務 Pod 沒有用於排程的註釋

已知問題: 部分 Watson 語音服務 Pod 遺漏 cloudpakInstanceId 註釋。如果您使用 IBM Cloud Pak for Data 排程服務，則任何沒有 cloudpakInstanceId 註釋的 Watson 語音服務 Pod 都會是

由預設 Kubernetes 排程器而非排程服務排程
未包括在配額強制執行中

現在可以監視 PostgreSQL 資料儲存庫

您現在可以啟用 PostgreSQL 資料儲存庫的監視，以接收 Watson Speech 服務對其使用情形及狀態的更新。事件可以由 Prometheus 監視軟體或您用於監視的任何應用程式使用。除了預設平台監視之外，您還可以對使用者定義專案啟用監視，以使用 Red Hat® OpenShift® Container Platform 監視堆疊來監視您自己的專案。此功能在語音服務自訂資源中包含其他內容 spec.global.datastores.postgressql.enablePodMonitor。

如需相關資訊，請參閱 Watson 上的語音服務 IBM Cloud Pak for Data的管理一節中的主題 監視 Watson 語音服務的 PostgreSQL 資料儲存庫。

問題修正: 如果僅啟用執行時期微服務，則不再安裝 PostgreSQL 資料儲存庫

問題報告修正: 如果僅啟用執行時期微服務，則不再安裝 PostgreSQL 資料儲存庫。現在，只有在至少已安裝其中一個 sttAsync、sttCustomization 或 ttsCustomization 微服務時，才會安裝資料儲存庫。如果稍後停用這些微服務，則不會解除安裝 PostgreSQL。

在 4.6.0版之前，PostgreSQL 一律隨語音服務一起安裝。如果您是現有的客戶，且只使用 4.6.0版之前的語音服務執行時期微服務，則 PostgreSQL 仍會維持已安裝，但不會使用。在此情況下，PostgreSQL 的安裝會在升級之間持續保存。

一律會安裝 MinIO 資料儲存庫，因為執行時期微服務相依於它。只有在已安裝 sttAsync 微服務時，才會安裝 RabbitMQ 資料儲存庫。

如需相關資訊，請參閱 Watson 上的語音服務 IBM Cloud Pak for Data中 使用 Watson 語音服務自訂資源 中的 資料儲存庫內容。

問題修正: PostgreSQL 運算子不再需要建立「網路原則」來監視其運算元

問題報告修正程式: 對於 4.6.0，不需要建立「網路原則」來容許 PostgreSQL 運算子監視其運算元，如 2022 年 11 月 10 日(4.0.x 版和 4.5.x版) 服務更新中所述。從 4.6.0版，服務會自動處理此狀況。

問題修正: 已更新部分新一代模型，以改善低延遲回應時間

問題修正: 已更新下列下一代模型，以改善使用 low_latency 參數時的回應時間:

en-IN_Telephony
hi-IN_Telephony
it-IT_Multimedia
nl-NL_Telephony

先前，這些模型在使用 low_latency 參數時未如預期般快速傳回辨識結果。您不需要升級基於這些模型的自訂模型。如需所有可用的下一代模型的相關資訊，請參閱下一代語言和模型。

問題報告修正程式: 改善自訂模型命名文件

問題報告修正: 文件現在提供命名自訂語言模型和自訂聲學模型的詳細規則。如需相關資訊，請參閱：

已解決安全漏洞

已修正下列安全漏洞:

2022 年 11 月 10 日 ( 4.0.x 和 4.5.x版)

已知問題: 已更新 PostgreSQL 運算子所需的網路原則

已知問題: 對於語音服務 4.0.x 版 (不包括 4.0.0版) 和 4.5.x，如果 PostgreSQL 運算子和語音服務安裝在不同的名稱空間中，則 PostgreSQL 運算子無法監視語音服務的 PostgreSQL 運算元。操作員無法透過針對語音服務而備妥的「網路原則」來監視運算元。

此問題不會阻止 PostgreSQL 叢集正常運作。叢集會保持作用中且完全運作。不過，當您升級至新版本的語音服務時，操作器無法更新運算元。

問題的解決方案是建立 PostgreSQL 運算子的其他「網路原則」，如下列步驟中所示。不論 PostgreSQL 操作器是安裝在與語音服務相同的名稱空間中，還是安裝在不同的名稱空間中，您都可以執行這些步驟。

以安裝語音服務之 Red Hat® OpenShift® 專案的管理者身分登入。

輸入下列指令，以更新語音服務的網路原則:

cat << EOF | oc apply -f -
apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  labels:
    app.kubernetes.io/component: stt
    app.kubernetes.io/instance: {{ <custom-resource-name> }}
    app.kubernetes.io/name: speech-to-text
    release: {{ <custom-resource-name> }}
  name: <custom-resource-name>-postgres-network-policy
  namespace: {{ <cpd-instance-namespace> }}
spec:
  ingress:
  - from:
    - namespaceSelector: {}
      podSelector:
        matchLabels:
          app.kubernetes.io/name: cloud-native-postgresql
EOF

其中

<custom-resource-name> 是語音服務自訂資源的名稱。 4.0.x 版的建議名稱是 speech-prod-cr; 4.5.x 版的建議名稱是 speech-cr。
<cpd-instance-name> 是在其中安裝語音服務的專案 (名稱空間) 名稱。文件使用環境變數 ${PROJECT_CPD_INSTANCE} 來識別名稱空間。

若要驗證更新的「網路原則」是否容許操作員監視運算元，以及 PostgreSQL 叢集是否處於健全狀態，請輸入下列指令，其中 <custom-resource-name> 及 <cpd-instance-name> 是您在前一個步驟中使用的值:
```
oc -get cluster {{ <custom-resource-name> }}-postgres -n {{ <cpd-instance-namespace> }}
```
如果 PostgreSQL 叢集正常運作，則指令會產生類似下列的輸出:
```
NAME                 AGE   INSTANCES   READY   STATUS                     PRIMARY
speech-cr-postgres   14d   3           3       Cluster in healthy state   speech-cr-postgres-1
```

這些步驟不會導致操作員將運算元更新至最新版本。不過，當您下次升級 Speech 服務軟體時，會依照預期來升級運算元。

2022 年 10 月 13 日 ( 4.5.3版)

現在提供 4.5.3 版

Speech to Text for IBM Cloud Pak for Data 版本 4.5.3 現在可用。此版本支援 IBM Cloud Pak for Data 4.5.x 版及 Red Hat OpenShift 4.6版、4.8版及 4.10版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

審核事件可用於語音服務

IBM Cloud Pak for Data 審核記載服務會產生並轉遞 Speech to Text 及 Text to Speech 服務的審核事件。審核事件符合具有公用服務之 Activity Tracker 可用的那些事件。如需相關資訊，請參閱審核事件。

您無法解除安裝個別的語音服務元件

文件現在指出您無法在安裝個別服務元件 (微服務) 之後將它們解除安裝。若要移除下列任何元件，您必須完整地解除安裝 Watson Speech 服務，並只重新安裝您需要的元件：Speech to Text runtime、Speech to Text asynchronous HTTP、Speech to Text customization、Text to Speech runtime 和 Text to Speech customization。如需安裝 Speech 服務的詳細資訊，請參閱 Watson 上的 Speech 服務 IBM Cloud Pak for Data。

新的法國加拿大下一代多媒體模型

該服務現在為法屬加拿大提供下一代多媒體模型: fr-CA_Multimedia。新模型支援低延遲且已正式發行。它也支援語言模型自訂作業和文法。如需下一代模型及低延遲的相關資訊，請參閱

更新英國新一代電話系統模型

英文下一代電話機型已更新，語音識別功能得到改善：

en-AU_Telephony
en-GB_Telephony
en-IN_Telephony
en-US_Telephony

所有這些模型都繼續支援低延遲。您不需要升級基於這些模型的自訂模型。如需所有可用的下一代模型的相關資訊，請參閱下一代語言和模型。

義大利新一代多媒體模型現在支援低延遲

義大利新一代多媒體模型 it-IT_Multimedia 現在支援低延遲。如需下一代模型及低延遲的相關資訊，請參閱

疑難排解從 4.0.x 版升級至 4.5.x 版的問題

當您將語音服務從 4.0.x 版升級至 4.5.x版時，可能會遇到 PostgreSQL Pod 停留在 Terminating 狀態的問題。如果在升級期間發生此問題，請執行下列步驟來解決問題。在 Watson Speech 服務 on IBM Cloud Pak for Data的升級主題中，將 Watson 語音服務從 4.0 版升級至 4.5 也會記載這些資訊和步驟。

使用下列指令來識別仍處於 Terminating 狀態的 Pod:

oc get pods -n ${PROJECT_CPD_INSTANCE} -o wide | awk {'print $1'}

使用下列指令來設定環境變數 pods，以包括保持 Terminating 狀態的 Pod 清單:

pods=$(oc get pods -n ${PROJECT_CPD_INSTANCE} -o wide | awk {'print $1'})

使用下列指令來刪除停滯的 Pod，以便升級程序可以繼續進行:

pods=$(oc get pods -n ${PROJECT_CPD_INSTANCE} -o wide | grep Terminating | awk {'print $1'})

問題報告修正程式: 修正自訂資源項目說明文件

問題報告修正: 語音服務自訂資源的說明文件現在在模型 koKrTelephony 和 nlNlTelephony 的名稱之後包含冒號。先前，這兩個項目的文件省略了冒號。

已解決安全漏洞

已修正下列安全漏洞:

2022 年 8 月 19 日 ( 4.5.1版)

重要事項: 大部分前一代模型的淘汰日期現在是 2023 年 3 月 3 日

已取代: 此淘汰通知已由 2023 年 2 月 23 日服務更新取代。所有前一個產生模型的服務結束日期現在是 2023 年 7 月 31 日。

2022 年 3 月 15 日，阿拉伯文和日文以外所有語言的前一代模型已淘汰。此時，已淘汰的模型將保持可用，直到 2022 年 9 月 15 日為止。為了讓使用者有更多時間移轉至適當的下一代模型，淘汰的模型現在將保持可用，直到 2023 年 3 月 3 日為止。如同起始淘汰注意事項，阿拉伯文和日文前一代模型不會淘汰。如需所有已淘汰模型的完整清單，請參閱 2022 年 3 月 15 日(4.0.6版)服務更新。

在 2023 年 3 月 3 日，將從服務及文件中移除已淘汰的模型。如果您使用任何已淘汰的模型，則必須在 2023 年 3 月 3 日之前移轉至對等的下一代模型。

如需您可以從每一個已淘汰模型移轉至其中的下一代模型的相關資訊，請參閱上一代語言和模型
如需下一代模型的相關資訊，請參閱下一代語言和模型
如需從前一代模型移轉至下一代模型的相關資訊，請參閱移轉至下一代模型。

附註: 從服務移除前一代 en-US_BroadbandModel 時，下一代 en-US_Multimedia 模型將變成語音辨識要求的預設模型。

2022 年 8 月 3 日 ( 4.5.1版)

現在提供 4.5.1 版

Speech to Text for IBM Cloud Pak for Data 版 4.5.1 現在可用。此版本支援 IBM Cloud Pak for Data 4.5.x 版及 Red Hat OpenShift 4.6版、4.8版及 4.10版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

支援啟用 FIPS 的叢集

Speech to Text (適用於 IBM Cloud Pak for Data ) 和 Text to Speech (適用於 IBM Cloud Pak for Data ) 現在支援在啟用「美國聯邦資訊處理標準 (FIPS)」的叢集上執行。如需相關資訊，請參閱支援 FIPS 的服務。

問題報告修正程式: 修正暫時儲存體計算，以防止偶爾發生 Pod 收回

問題報告修正程式: 已修正問題，現在對於 Speech to Text for IBM Cloud Pak for Data 和 Text to Speech for IBM Cloud Pak for Data 執行時期，暫時儲存體限制的計算更為精確。這些變更會在服務的執行時期負載過重時，防止偶爾發生 Pod 收回。

問題報告修正: 更新語音猶豫及猶豫標記文件

缺陷修復： 更新了言語猶豫和猶豫標記的文檔。前一代模型包含猶豫標記，以取代大部分語言的轉錄結果中的語音猶豫; 智慧型格式化會從美式英文最終文字記錄中移除猶豫標記。下一代模型包括轉錄結果中的實際語音猶豫; 智慧型格式化不會影響它們併入最終轉錄結果中。

如需相關資訊，請參閱：

已解決安全漏洞

已修正下列安全漏洞:

2022 年 6 月 29 日 ( 4.5.0版)

現在提供 4.5.0 版

Speech to Text for IBM Cloud Pak for Data 版本 4.5.0 現在可用。此版本支援 IBM Cloud Pak for Data 4.5.x 版及 Red Hat OpenShift 4.6版、4.8版及 4.10版。如需詳細資訊，請參閱 Watson 上的發言服務 IBM Cloud Pak for Data。

IBM Cloud Pak for Data 文件的統一語音服務

Speech to Text 和 Text to Speech 的安裝與管理文件現在結合在 IBM Cloud Pak for Data 文件中。如需安裝及管理語音服務的相關資訊，請參閱 Watson 上的語音服務 IBM Cloud Pak for Data。

變更為語音服務自訂資源

現在，當您起始安裝語音服務時，即會建立自訂資源。 IBM Cloud Pak for Data 安裝說明文件中說明了此程序。自訂資源的內容已變更:

自訂資源的建議名稱已從 speech-prod-cr 變更為 speech-cr。
儲存類別的所有參照都已從 storageClass 的變式變更為 blockStorageClass。
Portworx 區塊儲存空間類別的名稱已從 portworx-shared-gp3 變更為 portworx-db-gp3-sc。
已移除 MinIO 及 PostgreSQl 資料儲存庫的 createSecret 內容。內容僅在內部使用。如果您建立密鑰物件，則語音服務一律會使用密鑰物件，如果未提供任何密鑰物件，則它們一律會自動建立該物件。

現在 RabbitMQ 資料儲存庫支援使用者提供的密碼物件

您現在可以提供 RabbitMQ 資料儲存庫的安全認證，就像您可以提供 MinIO 及 PostgreSQL 資料儲存庫的安全認證一樣。所有三個資料儲存庫所記載的處理程序都類似。

新的義大利文 it-IT_Multimedia 下一代模型

該服務現在為義大利文提供下一代多媒體模型: it-IT_Multimedia。新模型已正式發行。它不支援低延遲，但支援語言模型自訂作業及文法。如需所有可用的下一代模型的相關資訊，請參閱下一代語言和模型。

更新韓文電話系統和多媒體新一代模型

現有的韓國下一代型號已更新:

已更新 ko-KR_Telephony 模型，以改良語音辨識的低延遲支援。
ko-KR_Multimedia 機型已更新，改善了語音辨識功能。模型現在也支援低延遲。

這兩個模型都已正式發行，且都支援語言模型自訂作業及文法。您不需要升級以這些模型為基礎的自訂語言模型。如需所有可用的下一代模型的相關資訊，請參閱下一代語言和模型。

多個新一代電話系統模型的更新

下列新一代英語電話機型已更新，以改善語音辨識能力：

en-AU_Telephony
en-GB_Telephony
en-IN_Telephony
en-US_Telephony

您不需要升級基於這些模型的自訂模型。如需所有可用的下一代模型的相關資訊，請參閱下一代語言和模型。

問題修正: 現在會報告所有轉錄結果的信任評分

問題修正: 現在會針對所有轉錄結果報告信任評分。先前，當服務針對單一語音辨識要求傳回多個文字記錄時，可能不會針對所有文字記錄傳回信任評分。

已解決安全漏洞

4.5.0版未修正任何安全漏洞。

2022 年 5 月 25 日 ( 4.0.9版)

現在提供 4.0.9 版

Speech to Text for IBM Cloud Pak for Data 版本 4.0.9 現在可用。此版本支援 IBM Cloud Pak for Data 4.x 版及 Red Hat OpenShift 4.6 版和 4.8版。如需安裝及管理服務的相關資訊，請參閱安裝 Watson Speech to Text。

新的巴西葡萄牙文 pt-BR_Multimedia 下一代模型

該服務現在為巴西葡萄牙文提供下一代多媒體模型: pt-BR_Multimedia。新模型支援低延遲且已正式發行。它也支援語言模型自訂作業和文法。如需下一代模型及低延遲的相關資訊，請參閱

更新德國 de-DE_Multimedia 下一代模型以支援低延遲

新一代德國型號 de-DE_Multimedia 現在支援低延遲。您不需要升級以更新的德文基本模型為基礎的自訂模型。如需下一代模型及低延遲的相關資訊，請參閱

新一代模型的新測試版 character_insertion_bias 參數

所有新一代模型現在都支援新的測試版參數 character_insertion_bias，它可與所有語音辨識介面搭配使用。依預設，服務會針對每一個個別模型進行最佳化，以平衡其識別不同長度的候選字串。模型特定的偏誤相當於 0.0。對於大部分語音辨識要求而言，每一個模型的預設偏誤都已足夠。

不過，某些使用案例可能會受益於偏好具有較短或較長字串的假設。該參數接受 -1.0 與 1.0 之間的值，這些值代表模型預設值的變更。負值指示服務偏好較短的字元字串。正值指示服務偏好較長的字元字串。如需相關資訊，請參閱字元插入偏誤。

語音服務不支援 OADP 備份及還原公用程式

Watson 語音服務不支援 IBM Cloud Pak for Data OpenShift API for Data Protection (OADP) 備份及還原公用程式。如果語音服務安裝在叢集上，您可能無法使用 IBM Cloud Pak for Data OADP 備份及還原公用程式來備份該叢集上安裝的其他服務。這項限制適用於 4.0.0 版及更新版本的語音服務。

已解決安全漏洞

已修正下列安全漏洞:

2022 年 5 月 1 日 ( 1.2.x版)

重要事項: IBM Cloud Pak for Data 3.5 上 Speech to Text 1.2.x 版的服務結束: 重要事項: IBM Cloud Pak for Data 版本 3.5 上的 Speech to Text 版本 1.2.x 從 2022 年 5 月 1 日開始無法運作。不再支援、提供或記載 Speech to Text 1.2.x 版。有關Speech to Text （屬於Watson API Kit 的一部分）的服務終止的更多信息，請參閱軟體支援終止：IBM Watson API Kit for IBM Cloud Pak for Data 1.2.x

2022 年 4 月 27 日 ( 4.0.8版)

現在提供 4.0.8 版

Speech to Text for IBM Cloud Pak for Data 版本 4.0.8 現在可用。此版本支援 IBM Cloud Pak for Data 4.x 版及 Red Hat OpenShift 4.6 版和 4.8版。如需安裝及管理服務的相關資訊，請參閱安裝 Watson Speech to Text。

IBM Cloud Pak for Data 文件中使用的新環境變數

IBM Cloud Pak for Data 文件的 Speech to Text 中的大部分指令已更新為使用一組一般環境變數。文件提供 Script，可在您執行安裝、升級及管理指令之前自動匯出環境變數。在取得 Script 之後，您可以從文件複製大部分指令並執行它們，而無需進行任何變更。

Script 定義的環境變數包括下列各項:

${PROJECT_CPD_INSTANCE} 識別您計劃在其中安裝 IBM Cloud Pak for Data 及語音服務的專案。
${PROJECT_CPD_OPS} 識別 IBM Cloud Pak for Data 平台操作器的專案。
${PROJECT_CPFS_OPS} 識別 IBM Cloud Pak for Data 基礎服務的專案。

如需使用環境變數的相關資訊，請參閱最佳作法: 設定安裝變數。

已不再記載 ttsVoiceMarginalCPU 內容

已從語音服務自訂資源的說明文件中移除 ttsVoiceMarginalCPU 內容。此內容會管理並行與語音合成速度之間的權衡。預設值 400 可確保大部分客戶的合理平衡，並維護即時合成。

新型德國新一代多媒體模型

該服務現在為德文提供下一代多媒體模型: de-DE_Multimedia。新模型已正式發行。它不支援低延遲。它確實支援語言模型自訂作業和文法作為正式發行的功能。

如需所有可用的下一代模型及其自訂作業支援的相關資訊，請參閱

測試版新一代 en-WW_Medical_Telephony 模型現在支援低延遲

測試版新一代 en-WW_Medical_Telephony 模型現在支援低延遲。如需所有新一代模型及低延遲的相關資訊，請參閱

已解決安全漏洞

已修正下列安全漏洞:

2022 年 4 月 8 日 ( 4.0.7版)

現在已針對基於下一代模型的自訂模型記錄了對音效的支援

對於以下一代模型為基礎的自訂語言模型，現在已針對自訂字組的類似音規格記載支援。自 2021 年底以來，已提供對音效的支援。

對於基於下一代模型和上一代模型的自訂模型，使用 sounds_like 欄位之間存在差異。如需將 sounds_like 欄位與基於下一代模型的自訂模型搭配使用的相關資訊，請參閱使用下一代模型的自訂字組。

重要事項: 已從文件中移除已淘汰的 customization_id 參數

重要事項: 在 2018 年 10 月 9 日，所有語音辨識要求的 customization_id 參數已淘汰，並取代為 language_customization_id 參數。現在已從語音辨識方法的文件中移除 customization_id 參數:

用於 WebSocket 要求的 /v1/recognize
用於同步 HTTP 要求（包括多部分要求）的 POST /v1/recognize
用於非同步 HTTP 要求的 POST /v1/recognitions

附註: 如果您使用 Watson SDK，請確保已更新任何應用程式碼以使用 language_customization_id 參數而非 customization_id 參數。從 SDK 的下一個主要版本開始，customization_id 參數將不再提供於 SDK 的對等方法。如需語音辨識方法的相關資訊，請參閱 API 和 SDK 參照。

2022 年 3 月 30 日 ( 4.0.7版)

現在提供 4.0.7 版

Speech to Text for IBM Cloud Pak for Data 版本 4.0.7 現在可用。此版本支援 IBM Cloud Pak for Data 4.x 版及 Red Hat OpenShift 4.6 版和 4.8版。如需安裝及管理服務的相關資訊，請參閱安裝 Watson Speech to Text。

用於指定預設模型的自訂資源內容

語音辨識要求的預設語音是 en-US_BroadbandModel。如果您未安裝 en-US_BroadbandModel，則必須執行下列動作:

使用 model 參數來傳遞要與每一個要求搭配使用的語音。
使用 Speech 服務自訂資源中的 defaultSTTModel 內容，為 IBM Cloud Pak for Data 的 Speech to Text 安裝指定新的預設模型。如需相關資訊，請參閱安裝 Watson Speech to Text 及使用預設模型。

更新英文和法文新一代多媒體模型以支援低延遲

下列多媒體模型已更新為支援低延遲:

澳洲英文: en-AU_Multimedia
英式英文: en-GB_Multimedia
美式英文: en-US_Multimedia
法文： fr-FR_Multimedia

您不需要升級在這些基礎模型上建置的自訂語言模型。如需下一代模型及低延遲的相關資訊，請參閱

新型卡斯提亞西班牙新一代多媒體模型

該服務現在為卡斯提亞西班牙文提供下一代多媒體模型: es-ES_Multimedia。新模型支援低延遲且已正式發行。它也支援語言模型自訂作業和文法。

如需所有可用的下一代模型及其自訂作業支援的相關資訊，請參閱

測試版新一代 en-WW_Medical_Telephony 模型現在支援智慧型格式化

測試版下一代 en-WW_Medical_Telephony 模型現在支援美式英文音訊的 smart_formatting 參數。如需所有下一代模型的相關資訊，請參閱下一代語言和模型

已解決安全漏洞

已修正下列安全漏洞:

Red Hat CVE-2022-24407: 在 Cyrus SASL 隨附的 SQL 外掛程式中發現缺失。由於無法適當地跳出 SQL 輸入，而導致輸入驗證漏洞不適當。這個缺失可讓攻擊者執行任意 SQL 指令，並且能夠變更其他帳戶的密碼，以便提升專用權。
安全公告: jwt-go 漏洞會影響 IBM Watson Speech Services Cartridge for IBM Cloud Pak for Data(CVE-2020-26160)
安全公告: Golang Go 中的漏洞會影響 IBM Watson Speech Services Cartridge for IBM Cloud Pak for Data(CVE-2021-29923)
安全公告: IBM Watson Speech Services Cartridge for IBM Cloud Pak for Data 受到 Spring Framework 中的遠端程式碼執行影響，但未分類為有漏洞(CVE-2022-22965)
Security Bulletin: IBM Watson Speech Services Cartridge for IBM Cloud Pak for Data 很容易遭到使用 IBM WebSphere Application Server(CVE-2021-23450)執行任意程式碼的攻擊

2022 年 3 月 17 日 ( 4.0.6版)

新一代模型的文法支援現在已正式上市

文法支援現在已正式發行 (GA)，適用於符合下列條件的下一個一般模型:

模型已正式發行。
模型支援語言模型自訂作業。

如需相關資訊，請參閱下列主題：

如需新一代模型文法支援狀態的相關資訊，請參閱新一代模型的自訂作業支援。
如需文法的相關資訊，請參閱文法。

2022 年 3 月 15 日 ( 4.0.6版)

重要事項: 淘汰大部分先前產生的模型

已取代: 此淘汰通知已由 2023 年 2 月 23 日服務更新取代。所有前一個產生模型的服務結束日期現在是 2023 年 7 月 31 日。

從 2022 年 3 月 15 日開始，阿拉伯文和日文以外所有語言的前一代模型已淘汰。已淘汰的模型在 2022 年 9 月 15 日將從服務和文件中移除之前仍然可用。阿拉伯文和日文前一世代模型不會淘汰。

現在已淘汰下列前一個產生模型:

中文 (普通話): zh-CN_NarrowbandModel 和 zh-CN_BroadbandModel
荷蘭文 (荷蘭): nl-NL_NarrowbandModel 及 nl-NL_BroadbandModel
英文 (澳洲): en-AU_NarrowbandModel 及 en-AU_BroadbandModel
英文 (英國): en-UK_NarrowbandModel 及 en-UK_BroadbandModel
英文 (美國): en-US_NarrowbandModel、en-US_BroadbandModel 及 en-US_ShortForm_NarrowbandModel
法文 (加拿大): fr-CA_NarrowbandModel 和 fr-CA_BroadbandModel
法文 (法國): fr-FR_NarrowbandModel 和 fr-FR_BroadbandModel
德文: de-DE_NarrowbandModel 及 de-DE_BroadbandModel
義大利文: it-IT_NarrowbandModel 和 it_IT_BroadbandModel
韓文: ko-KR_NarrowbandModel 和 ko-KR_BroadbandModel
葡萄牙文 (巴西): pt-BR_NarrowbandModel 及 pt-BR_BroadbandModel
西班牙文 (阿根廷): es-AR_NarrowbandModel 和 es-AR_BroadbandModel
西班牙文 (卡斯提亞): es-ES_NarrowbandModel 及 es-ES_BroadbandModel
西班牙文 (智利): es-CL_NarrowbandModel 和 es-CL_BroadbandModel
西班牙文 (哥倫比亞): es-CO_NarrowbandModel 和 es-CO_BroadbandModel
西班牙文 (墨西哥): es-MX_NarrowbandModel 和 es-MX_BroadbandModel
西班牙文 (秘魯): es-PE_NarrowbandModel 及 es-PE_BroadbandModel

如果您使用任何這些已淘汰的模型，則必須在服務結束日期之前移轉至對等的下一代模型。

如需您可以從每一個已淘汰模型移轉至其中的下一代模型的相關資訊，請參閱上一代語言和模型
如需下一代模型的相關資訊，請參閱下一代語言和模型
如需從前一代模型移轉至下一代模型的相關資訊，請參閱移轉至下一代模型。

附註: 在 9 月 15 日從服務中移除前一代 en-US_BroadbandModel 時，下一代 en-US_Multimedia 模型將變成語音辨識要求的預設模型。

新一代模型現在支援音訊剖析參數

所有下一代模型現在都支援下列音訊剖析參數作為正式發行的特性:

end_of_phrase_silence_time 指定暫停間隔的時間長度，服務會在此間隔將謄本分割成多個最終結果。如需相關資訊，請參閱詞組結尾的靜音時間。
split_transcript_at_phrase_end 指示服務根據輸入的語意特徵，將謄本分割成多個最終結果。如需相關資訊，請參閱在詞組結尾分割文字記錄。

問題報告修正程式: 正確的說話者標籤文件

缺陷修復： 說話者標籤的文檔在多個位置包含以下錯誤聲明：對於下一代模型，不支援將說話者標籤與中期結果或低延遲一起使用。 支援說話者標籤與下一代模型的過渡結果及低延遲搭配使用。如需相關資訊，請參閱說話者標籤。

2022 年 2 月 23 日 ( 4.0.6版)

現在提供 4.0.6 版

Speech to Text for IBM Cloud Pak for Data 版本 4.0.6 現在可用。此版本支援 IBM Cloud Pak for Data 4.x 版及 Red Hat OpenShift 4.6 版和 4.8版。如需安裝及管理服務的相關資訊，請參閱安裝 Watson Speech to Text。

匯入/匯出 Script 的更新

import_export.sh 和 transfer_ownership.sh Script 已更新。這些 Script 用來在叢集之間匯入及匯出資料、備份及還原資料，以及將資料從 3.5 版移轉至 4.0.x版。已修改及改良 Script，如下所示:

現在，transfer_ownership.sh Script 需要在指令行的 <custom_resource_name> 引數之前包含 -c 選項。
transfer_ownership.sh Script 現在需要 -v <version> 選項及引數，以指出要將資源所有權傳送至其中的版本。指定 35 (若為 3.5 版) 或 40 (若為 4.0.x版)。
現在，transfer_ownership.sh Script 需要在指令行的 <postgres_auth_secret_name> 引數之前包含 -p 選項。
<postgres_auth_secret_name> 引數提供 Kubernetes 密鑰，用於向您要向其傳送所有權的 PostgreSQL 資料儲存庫進行鑑別。如果與預設值相同 (<custom-resource-name>-postgres-auth-secret 代表 4.0.x版，user-provided-postgressql 代表 3.5版)，則可以省略鑑別密碼。如果密鑰與預設值不同，則必須提供該密鑰。
這兩個 Script 現在都包含 -h (--help) 選項，可顯示 Script 及其用法的相關資訊。

如需相關資訊，請參閱：

管理 Watson Speech to Text，特別是 匯入及匯出資料 及 備份及還原資料。
升級 Watson Speech to Text，特別是 Migrating data from IBM Cloud Pak for Data Version 3.5。

已更新 OpenShift Container Storage 的建議

從語音服務 4.0.6版開始，OpenShift Container Storage 的建議儲存空間類別是 ocs-storagecluster-ceph-rbd。

如果您要安裝 Speech services 4.0.6或從IBM Cloud Pak for Data version 3.5升級到 Speech services 4.0.6，請在安裝或升級期間指定 ocs-storagecluster-ceph-rbd 儲存類別。
如果您要從先前更新的 Cloud Pak for Data 4.0版升級至語音服務 4.0.6，請繼續使用 ocs-storagecluster-cephfs。您無法變更現有部署中使用的儲存體。

此值是使用語音服務自訂資源中的 storageClass 內容來指定:

################
# Storage class
################
  storageClass: "ocs-storagecluster-ceph-rbd"

語音服務可與任一 OpenShift Container Storage 版本搭配使用。新建議版本具有更嚴格的存取權。如需相關資訊，請參閱：

現在提供新的測試版 en-WW_Medical_Telephony 模型

現在提供新的測試版新一代 en-WW_Medical_Telephony。新模型瞭解醫學和藥理學領域的術語。在您需要轉錄一般醫療術語 (例如藥物名稱、產品品牌、醫療程序、疾病、醫生類型或 COVID-19-related 術語) 的情況下，請使用此模型。常見使用案例包括病患與醫療提供者 (例如，醫生、護士或藥劑師) 之間的交談。

將 enWwMedicalTelephony 設為 enabled: true，以從語音服務自訂資源安裝新模型。此模型適用於所有受支援的英文用語: 澳洲、印度、英國及美國。

模型支援語言模型自訂作業和文法作為測試版功能。
它支援大部分與 en-US_Telephony 模型相同的參數。
它不支援下列參數: low_latency、profanity_filter、redaction 及 speaker_labels。
目前，它不支援 smart_formatting IBM Cloud Pak for Data。

如需相關資訊，請參閱英文醫療電話系統模型。

更新至中文 zh-CN_Telephony 模型

新一代中文模型 zh-CN_Telephony 已更新，以改善語音辨識。模型繼續支援低延遲。依預設，服務會自動使用更新的模型來處理所有語音辨識要求。如需所有可用的下一代模型的相關資訊，請參閱下一代語言和模型。

如果您有以更新的模型為基礎的自訂語言模型，您必須使用 POST /v1/customizations/{customization_id}/upgrade_model 方法升級現有的自訂模型，以利用更新的優勢。如需相關資訊，請參閱升級自訂模型。

更新為日文 ja-JP_Multimedia 模型以支援低延遲

下一代日文模型 ja-JP_Multimedia 現在支援低延遲。您可以將 low_latency 參數與使用模型的語音辨識要求搭配使用。您不需要升級以更新的日文基礎模型為基礎的自訂模型。如需下一代模型和低延遲的相關資訊，請參閱下一代語言和模型和低延遲。

2022 年 2 月 11 日 ( 4.0.5版)

問題報告修正程式: 改善自訂模型升級和基礎模型版本說明文件

問題報告修正: 已更新說明自訂模型升級的說明文件，以及用於不同基礎模型版本的版本字串。文件現在指出語言模型自訂作業的升級也適用於下一代模型。此外，已更新代表基礎模型不同版本的版本字串。 base_model_version 參數也可以與已升級的下一代模型搭配使用。

如需自訂模型升級、何時需要升級以及如何使用舊版自訂模型的相關資訊，請參閱

問題報告修正程式: 更新大寫說明文件

問題報告修正: 說明服務自動將文字記錄大寫的文件已更新。服務只會針對下列語言和模型將適當的名詞大寫:

所有上一代美式英文模型
新一代德國模式

如需相關資訊，請參閱大寫。

2022 年 1 月 31 日 ( 4.0.5版)

已更新 4.0.5 版

Speech to Text for IBM Cloud Pak for Data 版本 4.0.5 已更新以解決安裝問題。案例套件版本現在是 4.0.6。請使用此套件，而非 4.0.5 版套件。如需安裝及管理服務的相關資訊，請參閱安裝 Watson Speech to Text。

重要事項: 不再需要鏡映安裝的額外步驟

重要事項: 2022 年 1 月 26 日版本注意事項包含下列步驟的重要注意事項:

執行 Minio 資料儲存庫鏡映安裝的其他步驟
執行新一代機型鏡映安裝的其他步驟

不再需要這些額外步驟。已更新案例套件以更正安裝問題。

2022 年 1 月 26 日 ( 4.0.5版)

現在提供 4.0.5 版

Speech to Text for IBM Cloud Pak for Data 版本 4.0.5 現在可用。此版本支援 IBM Cloud Pak for Data 4.x 版及 Red Hat OpenShift 4.6 版和 4.8版。如需安裝及管理服務的相關資訊，請參閱安裝 Watson Speech to Text。

重要事項: 執行 Minio 資料儲存庫鏡映安裝的其他步驟

重要事項: 如果您安裝案例套件 4.0.6，則不再需要這些步驟。有關更多信息，請參閱 2022 年 1 月 31 日（版本4.0.5 ）。

如果您是執行鏡映安裝 (例如，在氣隙環境中)，則需要在完成下列任一步驟之前執行其他步驟:

使用防禦模型鏡映映像檔 的步驟 7 將映像檔鏡映至專用登錄
步驟 8 將映像檔鏡映至中間儲存器登錄中的 使用中間儲存器登錄鏡映映像檔

若要複製 Minio 資料儲存庫的必要影像，此步驟是必要的:

echo 'cp.icr.io,cp/opencontent-minio-client,1.1.4,sha256:7b4cf5e47a0455cfa7ca9ab246b80916e4dccbc1483b3e0f276fb7b0ab3e5c60,IMAGE,linux,x86_64,"",0,CASE,"",""' \
>> $CASE_PATH/ibm-watson-speech-4.0.5-images.csv

未執行此步驟將導致 Speech to Text 及 Text to Speech的安裝錯誤。

重要事項: 執行新一代機型鏡映安裝的其他步驟

重要事項: 如果您安裝案例套件 4.0.6，則不再需要這些步驟。有關更多信息，請參閱 2022 年 1 月 31 日（版本4.0.5 ）。

如果您要執行鏡映安裝 (例如，針對氣隙環境)，並計劃安裝 Speech to Text 的任何新一代機型 (如需相關資訊，請參閱後續版本注意事項)，您必須在完成下列任一步驟之前執行額外步驟:

使用防禦模型鏡映映像檔 的步驟 7 將映像檔鏡映至專用容器登錄
步驟 8 將映像檔鏡映至中間儲存器登錄中的 使用中間儲存器登錄鏡映映像檔

每一個額外步驟對於所安裝的模型而言都是唯一的。如果您安裝多個新型號，請針對您要安裝的每一個型號發出指出的指令。

若為中文電話系統模型 (zh-CN_Telephony):

echo 'cp.icr.io,cp/watson-speech/zh-cn-telephony,2022-01-05-405models,sha256:52af6dfccd64ccd81b409936442a51a71f4ee96d980e1fc6a343a05bd4ed7fbc,IMAGE,linux,x86_64,"",0,CASE,"",""' \
>> $CASE_PATH/ibm-watson-speech-4.0.5-images.csv

若為拉丁美洲西班牙文電話系統模型 (es-LA_Telephony):

echo 'cp.icr.io,cp/watson-speech/es-la-telephony,2022-01-05-405models,sha256:58e8c04abe9659472e89bf0778b7dc66e0ddceb4ea18d9d3e048a08c72125ea2,IMAGE,linux,x86_64,"",0,CASE,"",""' \
>> $CASE_PATH/ibm-watson-speech-4.0.5-images.csv

若為澳洲英文多媒體模型 (en-AU_Multimedia):

echo 'cp.icr.io,cp/watson-speech/en-au-multimedia,2022-01-05-405models,sha256:167f9a76258530a56a6abdd1c311f2ea05d6820ee0e802fbf2f96f08fb8a7646,IMAGE,linux,x86_64,"",0,CASE,"",""' \
>> $CASE_PATH/ibm-watson-speech-4.0.5-images.csv

對於英式英文多媒體模型 (en-GB_Multimedia):

echo 'cp.icr.io,cp/watson-speech/en-gb-multimedia,2022-01-05-405models,sha256:167f9a76258530a56a6abdd1c311f2ea05d6820ee0e802fbf2f96f08fb8a7646,IMAGE,linux,x86_64,"",0,CASE,"",""' \
>> $CASE_PATH/ibm-watson-speech-4.0.5-images.csv

現在已自動安裝授權伺服器

現在，Speech 服務操作員在安裝 Speech 服務時，會自動安裝必要的 License Server。您不再需要從 IBM Cloud Pak for Data 基礎服務安裝授權伺服器，也不再需要使用其他 YAML 內容來建立具有必要連結的 OperandRequest。

移除特定於 PostgreSQL EnterpriseDB 伺服器的步驟

舊版說明文件包含特定於語音服務的 PostgreSQL EnterpriseDB 伺服器的步驟。這些步驟記錄在 升級 Watson Speech to Text ( 4.0) 及 解除安裝 Watson Speech to Text主題中。這些額外步驟已不再需要，且已從文件中移除。

RabbitMQ 資料儲存庫現在僅由 sttAsync 元件使用

RabbitMQ 資料儲存庫先前已由語音服務 Speech to Text 及 Text to Speech的元件使用。它現在只處理 Speech to Text 異步 HTTP 元件 ( sttAsync ) 的非持久性訊息佇列。只有在已安裝並啟用 sttAsync 元件時，才會使用它。

新的新一代模型

服務現在支援具有 Speech to Text for IBM Cloud Pak for Data的下列下一代模型:

中文 (普通話) 電話模型 (zh-CN_Telephony)。新模型支援低延遲。
英文 (澳洲) 多媒體模型 (en-AU_Multimedia)。新模型不支援低延遲。
英文 (英國) 多媒體模型 (en-GB_Multimedia)。新模型不支援低延遲。
西班牙文 (拉丁美洲) 電話系統模型 (es-LA_Telephony)。新模型支援低延遲。

附註: 拉丁美洲西班牙文模型 es-LA_Telephony 適用於所有拉丁美洲用語。它相當於適用於阿根廷、智利、哥倫比亞、墨西哥及秘魯方言的前一代模型。如果您已針對任何這些特定用語使用前一個產生模型，請使用 es-LA_Telephony 模型來移轉至對等的下一代模型。

新模型已正式發行用於語音辨識。它們已正式發行用於語言模型自訂作業及文法的測試版。聲學模型自訂作業不支援它們。

重要事項: 如果您要執行鏡映安裝 (例如，在氣隙環境中)，並計劃安裝 Speech to Text的任何新的新一代型號，則必須在鏡映映像檔之前執行其他步驟。如需詳細資訊，請參閱先前的發行說明。
如需使用自訂資源來安裝模型的相關資訊，請參閱安裝 Watson Speech to Text。
如需所有可用的下一代模型的相關資訊，請參閱下一代語言和模型。
如需下一代模型的自訂作業支援相關資訊，請參閱下一代模型的自訂作業支援。

依預設，現在已安裝下一代美式英文模型

依預設，新一代美式英文型號 en-US_Multimedia 和 en-US_Telephony 會隨 Speech to Text for IBM Cloud Pak for Data一起安裝。這些模型會結合 en-US_BroadbandModel、en-US_NarrowbandModel、en-US_ShortForm_NarrowbandModel 作為依預設安裝的模型。現在，模型在語音服務自訂資源中具有下列項目:

########################################
# Speech to Text next-generation models
########################################
      enUsMultimedia:    # US English (en-US) Multimedia model
        enabled: true
      enUsTelephony:     # US English (en-US) Telephony model
        enabled: true

For more information about using the custom resource to install models, see Installing Watson Speech to Text.

已解決安全漏洞

已修正下列與 Apache Log4j 相關聯的安全漏洞:

2021 年 12 月 20 日 ( 4.0.4版)

現在提供 4.0.4 版

Speech to Text for IBM Cloud Pak for Data 版本 4.0.4 現在可用。此版本支援 IBM Cloud Pak for Data 4.x 版及 Red Hat OpenShift 4.6 版和 4.8版。如需安裝及管理服務的相關資訊，請參閱安裝 Watson Speech to Text。

重要事項: 變更用於停用儲存及記載使用者資料的內容

重要事項: 語音服務自訂資源的內容名稱，指定是否儲存及記載使用者資料已變更。先前自訂資源包含下列內容:

#################
# Anonymize logs
#################
  sttRuntime:
    anonymizeLogs: "false"  # If true, disables storage and logging of user data
  sttAMPatcher:
    anonymizeLogs: "false"  # If true, disables storage and logging of user data
  ttsRuntime:
    anonymizeLogs: "false"  # If true, disables storage and logging of user data

這些內容現在命名如下:

###################################
# Storage and logging of user data
###################################
  sttRuntime:
    skipAudioAndResultLogging: "false"  # If true, disables storage and logging of user data
  sttAMPatcher:
    skipAudioAndResultLogging: "false"  # If true, disables storage and logging of user data
  ttsRuntime:
    skipAudioAndResultLogging: "false"  # If true, disables storage and logging of user data

如果您已在自訂資源中設定這些內容，以將 false 的預設值變更為 true，則需要編輯自訂資源。您必須手動將內容名稱變更為新值，並儲存已更新的自訂資源。如需相關資訊，請參閱安裝 Watson Speech to Text。

重要事項: 變更 PostgreSQL 密碼物件的內容

重要事項: 當您安裝語音服務時，依預設會建立一個物件，其中包含隨機產生的 PostgreSQL 資料儲存庫密碼。您可以改為選擇手動指定密碼。如果您這麼做，則密碼物件的 YAML 檔案內容已變更。如需相關資訊，請參閱管理 Watson Speech to Text中有關管理資料儲存庫的主題。

重要事項: PostgreSQL Pod 不會以 EnterpriseDB 1.10 版運算子開頭

重要事項: 使用 IBM Cloud Pak for Data version 4.0.3的 Speech to Text，基於 EnterpriseDB 1.10 版的 PostgreSQL Pod 可能無法啟動。這會阻止語音服務啟動。此問題已有暫行解決方法。如果您的語音服務無法啟動，請參閱 PostgreSQL pod not start with EnterpriseDB 1.10 operator，以取得診斷及解決問題的相關資訊。

此問題已在 Speech to Text for IBM Cloud Pak for Data 4.0.4版中修正。

IBM Spectrum Scale Container Native 儲存類別的新支援

從 4.0.3版開始，語音服務支援 IBM Spectrum® Scale Container Native 儲存類別。如果要使用 IBM Spectrum Scale，請針對語音服務自訂資源的 storageClass 內容指定 "ibm-spectrum-scale-sc"。如需相關資訊，請參閱安裝 Watson Speech to Text。

在安裝期間與 MinIO 資料儲存庫互動語音服務

在服務的模型和語音完全上傳至 MinIO 資料儲存庫之前，無法啟動語音服務執行時期元件 sttRuntime 和 ttsRuntime。在安裝期間，服務可能會失敗並自動自行重新啟動一或多次，直到模型和語音上傳完成為止。然後，它們會適當地開始。使用者不需有任何動作。

問題報告修正程式: 正確的升級說明文件

缺陷修復： 將語音服務升級到新版本的IBM Cloud Pak for Data版本4.0.x文件在某些指令中包含不正確的參考。這些參照現在是正確的:

在這兩種情況下，字串 watsonSpeechToTextStatus 和 watsonTextToSpeechStatus 都已變更為 speechStatus。
在這兩種情況下，字串 status.watsonSpeechToTextVersion 和 status.watsonTextToSpeechVersion 都已變更為 .spec.version。

如需相關資訊，請參閱升級 Watson Speech to Text。

重要事項: 必須重建以特定新一代模型為基礎的自訂語言模型

重要事項: 如果您已根據特定下一代模型建立自訂語言模型，則必須重建自訂模型。在您重新建立自訂語言模型之前，嘗試使用自訂模型的語音識別要求會以 HTTP 錯誤代碼 400 失敗。

您需要重建根據下列新一代模型版本所建立的自訂語言模型:

對於 en-AU_Telephony 模型，這是您從 en-AU_Telephony.v2021-03-03 建立至 en-AU_Telephony.v2021-10-04 的自訂模型。
對於 en-GB_Telephony 模型，這是您從 en-GB_Telephony.v2021-03-03 建立至 en-GB_Telephony.v2021-10-04 的自訂模型。
對於 en-US_Telephony 模型，這是您從 en-US_Telephony.v2021-06-17 建立至 en-US_Telephony.v2021-10-04 的自訂模型。
對於 en-US_Multimedia 模型，這是您從 en-US_Multimedia.v2021-03-03 建立至 en-US_Multimedia.v2021-10-04 的自訂模型。

若要識別自訂語言模型所根據的模型版本， 請使用 GET /v1/customizations 方法來列出所有自訂語言模型，或使用 GET /v1/customizations/{customization_id} 方法來列出特定的自訂語言模型。輸出的 versions 欄位會顯示自訂語言模型的基礎模型。如需相關資訊，請參閱列出自訂語言模型。

若要重建自訂語言模型， 請先建立新的自訂模型。然後，將所有先前自訂模型的語料庫及自訂字組新增至新模型。然後，您可以刪除前一個自訂模型。如需詳細資訊，請參閱建立自訂語言模型。

更新多世代模型以改善語音辨識

下列新一代機型已針對改進的語音辨識功能進行更新：

澳洲英文電話系統模型 (en-AU_Telephony)
英式英文電話系統模型 (en-GB_Telephony)
美式英文多媒體模型 (en-US_Multimedia)
美式英文電話系統模型 (en-US_Telephony)
卡斯提亞西班牙文電話系統模型 (es-ES_Telephony)

如需所有可用的下一代模型的相關資訊，請參閱下一代語言和模型。

新一代模型的新測試版文法支援

文法支援現在可作為所有可用的下一代模型的測試版功能。所有下一代模型都已正式發行 (GA)，並支援語言模型自訂作業。如需相關資訊，請參閱下列主題：

如需新一代模型文法支援狀態的相關資訊，請參閱新一代模型的自訂作業支援。
如需文法的相關資訊，請參閱文法。

支援特性的新 custom_acoustic_model 欄位

GET /v1/models 和 GET /v1/models/{model_id} 方法現在會報告模型是否支援聲學模型自訂作業。 SupportedFeatures 物件現在包含另一個欄位 custom_acoustic_model，這是一個布林值，true 適用於支援聲學模型自訂作業的模型，否則為 false。目前，對於所有前一代模型，此欄位為 true，對於所有下一代模型，此欄位為 false。

如需這些方法的相關資訊，請參閱列出模型的相關資訊。
如需聲學模型自訂作業支援的相關資訊，請參閱自訂作業的語言支援。

已解決安全漏洞

已修正下列與 Apache Log4j 相關聯的安全漏洞:

安全公告: Apache Log4j 中的漏洞可能會影響 IBM Watson Speech Services Cartridge for IBM Cloud Pak for Data(CVE-2021-4428)

2021 年 12 月 20 日 ( 1.2.x版)

重要事項: 您無法再將 Speech to Text 1.2.x 版安裝在 IBM Cloud Pak for Data 3.5 版上

重要事項: 在 IBM Cloud Pak for Data 3.5版上，您無法再執行 Speech to Text 版本 1.2.x 的新安裝。您只能在 IBM Cloud Pak for Data 版本 4.x上安裝 Speech to Text 4.0.x 版。如需相關資訊，請參閱安裝 Watson Speech to Text。

IBM Cloud Pak for Data 3.5 版的語音服務達到 2022 年 4 月 30 日的支援結束日期。建議您盡早升級至最新版本 4.0.x 服務版本。如需相關資訊，請參閱升級 Watson Speech to Text。

2021 年 11 月 30 日 ( 4.0.3版)

現在提供 4.0.3 版

Speech to Text for IBM Cloud Pak for Data 版本 4.0.3 現在可用。此版本支援 IBM Cloud Pak for Data 4.x 版及 Red Hat OpenShift 4.6 版和 4.8版。如需安裝及管理服務的相關資訊，請參閱安裝 Watson Speech to Text。

授權伺服器現在是必要的必備項目

您現在必須從 IBM Cloud Pak for Data 基礎服務安裝「授權伺服器」。您必須使用所提供的 YAML 內容來安裝授權伺服器，以建立具有必要連結的 OperandRequest。您還必須在與服務 (運算元) 相同的名稱空間中安裝 License Service，這也是安裝 IBM Cloud Pak for Data 的位置。如需相關資訊，請參閱安裝 Watson Speech to Text。

就地升級的新支援

服務現在支援就地、操作器型從 4.0.0 版升級至 4.0.3版。從 IBM Cloud Pak for Data 3.5 版移至 4.0.3 版繼續需要使用移轉公用程式。如需相關資訊，請參閱升級 Watson Speech to Text。

EDB PostgreSQL 操作器及授權安裝變更

Enterprise DB PostgreSQL 操作器及授權的安裝、升級及解除安裝已變更:

IBM Cloud Pak for Data 基礎服務現在隨附安裝 EDB PostgreSQL 運算子及授權的指示。已相應地更新安裝語音服務的指示。如需相關資訊，請參閱安裝 Watson Speech to Text。
從 Speech to Text 4.0.0 版升級至 4.0.3 的指示包括解除安裝先前的 EDB PostgreSQL 操作員及授權，並使用 IBM Cloud Pak for Data 基礎服務重新安裝它們的指示。如需相關資訊，請參閱升級 Watson Speech to Text。
解除安裝語音服務的指示現在包括移除先前隨 Speech to Text一起安裝的 EDB PostgreSQL 操作員及授權的步驟。如需相關資訊，請參閱解除安裝 Watson Speech to Text。

擴增安裝架構的新指引

服務現在提供關於擴增安裝的更新指引。此資訊包括指定 Pod 數目、每個 Pod 配置的 CPU 數目，以及前一個和下一代模型的並行階段作業數目上限。如需相關資訊，請參閱管理 Watson Speech to Text。

匯入及匯出公用程式的指令行更新

與語音服務的匯入及匯出公用程式搭配使用的指令包括新的選項及引數。匯入及匯出公用程式也是備份及還原服務以及從 IBM Cloud Pak for Data 3.5 版移轉至 4.0.3版的基礎。如需使用公用程式的詳細資訊，請參閱

用於指定聲學模型訓練的 CPU 的新內容

sttAMPatcher 微服務可管理服務的聲學模型自訂作業。「AM 修補程式」會使用專用的 CPU 數目來處理要求。您可以使用新的 sttAMPatcher.resources.requestsCPU 內容來增加專用於由 AM Patcher 處理聲學模型訓練要求的 CPU 數目。如果您在聲學模型訓練期間遇到訓練失敗，則這可能是必要的。如需相關資訊，請參閱安裝 Watson Speech to Text。

新的新一代模型

服務現在支援下列新一代語言模型。所有新模型都已正式發行。

捷克文: cs-CZ_Telephony。模型支援低延遲。
比利時荷蘭文 (佛蘭德語): nl-BE_Telephony。模型支援低延遲。
法文: fr-FR_Multimedia。新模型不支援低延遲。
印度英文: en-IN_Telephony。模型支援低延遲。
印度印地語: hi-IN_Telephony。模型支援低延遲。
日文: ja-JP_Multimedia。模型不支援低延遲。
韓文: ko-KR_Multimedia。模型不支援低延遲。
韓文: ko-KR_Telephony。模型支援低延遲。
荷蘭文: nl-NL_Telephony。模型支援低延遲。

如需所有下一代模型及低延遲的相關資訊，請參閱下一代語言及模型及低延遲。

對下一代模型的更新

下列新一代機型已針對改進的語音辨識功能進行更新。所有模型都已正式發行。

阿拉伯文: ar-MS_Telephony。模型現在支援低延遲。
巴西葡萄牙文: pt-BR_Telephony。模型繼續支援低延遲。
美式英文: en-US_Telephony。模型繼續支援低延遲。
加拿大法文: fr-CA_Telephony。模型現在支援低延遲。
義大利文: it-IT_Telephony。模型現在支援低延遲。

如需所有下一代模型及低延遲的相關資訊，請參閱下一代語言及模型及低延遲。

缺陷修正：處理非同步 HTTP 故障

缺陷修正： 異步 HTTP 介面無法轉錄某些音訊。此外，要求的回呼會傳回狀態 recognitions.completed_with_results，而不是 recognitions.failed。此錯誤已解決。

問題報告修正程式: 改善說話者標籤結果

問題修正: 當您將說話者標籤與下一代模型搭配使用時，服務現在會識別輸入音訊所有字組的說話者，包括具有相同開始及結束時間戳記的非常簡短字組。

問題報告修正程式: 更新過渡期間結果和低延遲說明文件

缺陷修復： 為了清晰和正確性，描述下一代模型的中期結果和低延遲功能的文件已被重寫。如需相關資訊，請參閱下列主題：

問題報告修正程式: 更正多方承租戶文件

問題報告修正: IBM Cloud Pak for Data 主題多租戶支援錯誤地指出語音服務不支援多租戶。主題已更新，指出語音服務支援下列作業:

在個別專案中安裝服務
在相同的專案中多次安裝服務
安裝服務一次，並在相同專案中部署多個實例

語音服務特定的說明文件正確指出多方承租戶支援。

2021 年 10 月 1 日 ( 1.1.x版)

1.1.x 版已失去服務: Speech to Text 和 Text to Speech for IBM Cloud Pak for Data 版 1.1.x 於 2021 年 9 月 30 日無法運作。從 2021 年 10 月 1 日，1.1.x 版的說明文件不再可用。如需相關資訊，請參閱軟體撤銷及支援停止。

2021 年 8 月 31 日 ( 4.0.0版)

所有新一代模型現在已正式上市

所有新一代語言模型現在已正式發行 (GA)。支援在正式作業環境及應用程式中使用它們。

如需所有下一代語言模型以及 IBM Cloud Pak for Data目前可用的模型的相關資訊，請參閱下一代語言和模型。
如需每一個下一代模型支援之功能的相關資訊，請參閱下一代模型支援的功能。

新一代模型的語言模型自訂作業現在已正式發行

語言模型自訂作業現在已正式發行 (GA)，適用於所有可用的下一代語言及模型。支援下一代模型的語言模型自訂作業，以在正式作業環境及應用程式中使用。

您可以使用相同的指令來建立、管理及使用新一代模型的自訂語言模型、語料庫及自訂字組，就像您對前一代模型所做的一樣。但新一代模型的自訂作業與前一代模型的自訂作業不同。對於基於下一代模型的自訂模型:

自訂模型沒有詞彙外 (OOV) 字組的概念。
語料庫中的字組不會新增至字組資源。
您目前無法對自訂字組使用類似音特性。
當更新基礎語言模型時，您不需要升級自訂模型。
目前不支援文法。

如需將語言模型自訂作業用於下一代模型的相關資訊，請參閱

其他主題說明管理自訂語言模型、語料庫及自訂字組。

2021 年 7 月 29 日 ( 4.0.0版)

版本 4.0.0 可用

IBM Watson® Speech to Text for IBM Cloud Pak® for Data 4.0.0 版現在可用。服務的安裝及管理包含了許多變更。此版本支援 IBM Cloud Pak for Data 4.x 版及 Red Hat OpenShift 4.6版。如需安裝及管理服務的相關資訊，請參閱 Installing IBM Watson Speech to Text for IBM Cloud Pak for Data。

新一代語言模型

服務現在支援越來越多的新一代語言模型。下一代 多媒體 和 電話系統 模型可改善服務前一代寬頻和窄頻模型的語音辨識功能。新模型運用深度神經網路和雙向分析來達到更高傳輸量和更高轉錄精確度。

此時，下一代語言模型和 low_latency 參數是測試版功能。下一代模型支援有限的語言和語音辨識功能。支援的語言、模型及特性將隨著未來版本而增加。

許多下一代模型也支援新的 low_latency 參數，可讓您以降低轉錄品質的可能代價來要求更快的結果。啟用低延遲時，服務會縮減其音訊分析，這會降低轉錄的精確度。如果您的應用程式所需要的回應時間比它的最高精確度還低，則可以接受此取捨。

low_latency 參數會影響您搭配使用 interim_results 參數與 WebSocket 介面。過渡期間結果僅適用於支援低延遲的那些下一代模型，且僅當 interim_results 和 low_latency 參數都設為 true 時才可用。

如需下一代模型及其功能的相關資訊，請參閱下一代語言和模型。
如需下一代模型的語言支援以及哪些下一代模型支援低延遲的相關資訊，請參閱支援的下一代語言模型。
有關下一代型號的功能支援的更多信息，請參閱下一代型號支援的功能。
如需 low_latency 參數的相關資訊，請參閱低延遲。
如需下一代模型的 low_latency 與 interim_results 參數之間互動的相關資訊，請參閱要求過渡期間結果及低延遲。

已重新命名阿拉伯文寬頻模型

阿拉伯文寬頻模型現在命名為 ar-MS_BroadbandModel。先前的名稱 ar-AR_BroadbandModel 已淘汰。它將繼續運作至少一年，但可能會在未來某個日期移除。建議您盡快移轉至新名稱。

統一 Speech to Text 文件

IBM Watson Speech to Text for IBM Cloud Pak for Data 的文件現在已與在 IBM Cloud上管理之 Speech to Text 服務的受管理實例的文件結合。兩種服務形式的指南和參考文件都是如此。鏈結至先前個別版本的 IBM Cloud Pak for Data 文件，以將服務重新導向至統一文件。

如需識別僅與一個產品版本相關之資訊的相關資訊，請參閱關於 Speech to Text。

問題報告修正程式: 改善說明文件

問題報告修正: 已更新說明文件來更正下列資訊:

文件無法說明下一代模型不會產生猶豫標記。文件已更新，請注意只有前一個產生模型會產生猶豫標記。下一代模型包括轉錄結果中的實際猶豫。如需相關資訊，請參閱語音猶豫和猶豫標記。
文件不正確地指出，使用 smart_formatting 參數會導致服務從日文最終轉錄結果中移除猶豫標記。智慧型格式化不會從日文 (僅適用於美式英文) 的最終結果中移除猶豫標記。如需相關資訊，請參閱智慧型格式化會影響哪些結果?

1.1.x 版已失去服務

Speech to Text 及 Text to Speech for IBM Cloud Pak for Data 版本 1.1.x 在 2021 年 9 月 30 日無法運作。您必須在該日期之前升級至 IBM Cloud Pak for Data 上服務的較新版本。從 2021 年 10 月 1 日起，將不再提供 1.1.4 版的說明文件。

2021 年 4 月 12 日 ( 1.2.1版)

新增至 speech-override.yaml 檔案

最小 speech-override.yaml 檔案包含額外定義 dockerRegistryPrefix:

global:
  dockerRegistryPrefix: "{Registry}"
  image:
    pullSecret: "{Registry_pull_secret}"

{Registry} 是內部註冊表的路徑。Docker 它必須是 image-registry.openshift-image-registry.svc:5000/{namespace}，其中 {namespace} 是 IBM Cloud Pak® for Data 安裝所在的名稱空間，通常是 zen。

2021 年 4 月 9 日 ( 1.2.1版)

支援修改已安裝的模型和語音: 語音服務可讓您新增或移除 1.2 版或 1.2.1 版服務的已安裝模型和語音。

1.2.1 版 (2021 年 3 月 26 日)

版本 1.2.1 可用

Speech to Text for IBM Cloud Pak for Data 版本 1.2.1 現在可用。 1.2 和 1.2.1 版使用相同的 1.2 版說明文件和安裝指示。除了 4.5 和 3.11版之外，1.2.1 版還支援在 Red Hat OpenShift 4.6 版上安裝。

新的安裝指示

對於連接至網際網路及氣隙叢集的兩個叢集，安裝指示包括下列步驟:

使用 oc label 指令，為已安裝 IBM Cloud Pak for Data 的名稱空間設定必要標籤。
使用 oc project 指令來確保您指向正確的 OpenShift 專案。
使用 cpd-cli install 指令來安裝語音服務使用的企業資料庫 PostgreSQL 伺服器。

在安裝語音服務之前，請先執行下列步驟。

新的解除安裝指示

在解除安裝 Speech 服務的程序中新增了一個步驟，以清除安裝中的所有資源。

PostgreSQL 資料儲存庫的授權登錄

服務從中取回 PostgreSQL 資料儲存庫映像檔的授權登錄路徑已變更。登錄位置已從 cp.icr.io/cp/watson-speech 變更為 cp.icr.io/cp/cpd。這項變更對使用者是透通的。

Minio 和 PostgreSQL 資料儲存庫的密鑰

Minio 和 PostgreSQL 資料儲存庫需要其密鑰的下列寫在程式中的值:

若為 Minio，請使用 minio。
對於PostgreSQL，請使用 user-provided-postgressql。

您無法對這些密鑰使用自己的值。在安裝 Speech 服務之前，必須先建立密碼。

從 speech-override.yaml 檔案刪除

下列項目已從 speech-override.yaml 檔案中移除。已新增它們來解決現在已修正的問題。

sttRuntime:
  images:
    miniomc:
      tag:
        1.0.5
sttAMPatcher:
  images:
    miniomc:
      tag:
        1.0.5
ttsRuntime:
  images:
    miniomc:
      tag:
        1.0.5

通常已透過細部調整其內容至基本元素，進一步減少縮寫的 speech-override.yaml 檔案。

1.2 版（2020 年 12 月 9 日）

版本 1.2 可用

Speech to Text for IBM Cloud Pak for Data 1.2 版現在可供使用。服務的安裝及管理包含了許多變更。此版本支援 IBM Cloud Pak for Data 3.5 版和 3.0.1 版，以及 Red Hat OpenShift 4.5 版和 3.11 版。

新的澳洲和法國加拿大模型

服務現在提供澳洲英文及加拿大法文的寬頻及窄頻模型：

澳洲英文：en-AU_BroadbandModel 及 en-AU_NarrowbandModel
加拿大法文：fr-CA_BroadbandModel 及 fr-CA_NarrowbandModel

新模型已正式發行，而且它們同時支援語言模型及聲學模型自訂作業。

如需支援的語言和機型的詳細資訊，請參閱上一代語言和機型。
如需自訂作業語言支援的相關資訊，請參閱自訂作業的語言支援。

已更新模型以改良語音辨識

下列語言模型已更新，以改善語音辨識：

巴西葡萄牙文：pt-BR_BroadbandModel 及 pt-BR_NarrowbandModel
法文： fr-FR_BroadbandModel
德文: de-DE_BroadbandModel 及 de-DE_NarrowbandModel
日文： ja-JP_BroadbandModel
英式英文：en-GB_BroadbandModel 及 en-GB_NarrowbandModel
美式英文: en-US_ShortForm_NarrowbandModel

依預設，服務會自動使用更新的模型來處理所有語音辨識要求。如果您的自訂語言模型或自訂聲學模型以這些模型為基礎，則必須使用下列方法來升級現有的自訂模型，以充分運用這些更新項目：

POST /v1/customizations/{customization_id}/upgrade_model
POST /v1/acoustic_customizations/{customization_id}/upgrade_model

如需相關資訊，請參閱升級自訂模型。

split_transcript_at_phrase_end 參數現在普遍適用於所有語言

語音辨識參數 split_transcript_at_phrase_end 現已正式發行，適用於所有語言。先前，它僅針對美式英文及英式英文正式發行。如需相關資訊，請參閱在詞組結尾分割文字記錄。

德文的猶豫標記已變更

用於更新德國寬頻和窄頻機型的遲疑標記已從 [hesitation] 變更為 %HESITATION。如需猶豫標記的相關資訊，請參閱語音猶豫和猶豫標記。

問題報告修正: 解決具有大量文法之模型的延遲問題

**問題報告修正：**服務不再對包含大量文法的自訂語言模型具有延遲問題。初次用於語音辨識時，這類自訂模型可能需要幾秒的時間才能載入。自訂模型現在的載入速度已快上許多，大幅縮短用於辨識時的延遲。

2020 年 7 月 15 日 ( 1.1.4版)

Red Hat OpenShift 4.3 版即將失去服務: IBM Cloud Pak for Data 3.0.1 將在 2020 年 9 月 1 日淘汰對 Red Hat OpenShift 4.3 的支援。 Red Hat OpenShift 4.3 在 2020 年 10 月 22 日即將無法運作。IBM Cloud Pak for Data 引進 Red Hat OpenShift 4.5的支援。IBM Cloud Pak for Data 建議用戶端在 2020 年 10 月 22 日之前升級至 Red Hat OpenShift 4.5。 IBM 支援中心將與已經在 Red Hat OpenShift 4.3 上安裝 IBM Cloud Pak for Data 3.0.1 的任何客戶合作。想要在 Red Hat OpenShift 4.x 上安裝的新客戶，會被指示安裝 Red Hat OpenShift 4.5。

2020 年 6 月 19 日 ( 1.1.4版)

版本 1.1.4 可用

Speech to Text for IBM Cloud Pak for Data 1.1.4 版現在可供使用。服務的安裝及管理包含了許多變更。此版本支援 IBM Cloud Pak for Data 2.5 版和 3.0.1 版，以及 Red Hat OpenShift 3.11 版和 4.3 版。有關安裝和管理服務的更多信息，請參閱安裝和管理Speech to Text的IBM Cloud Pak for Data。

用來控制語音活動偵測層次的新參數

服務現在提供兩個新的選用性參數，以便控制語音活動偵測的層次。參數可以協助確定只有相關的音訊會進行語音辨識處理。

speech_detector_sensitivity 參數會調整語音活動偵測的靈敏度。您可以使用此參數來抑制來自音樂、咳嗽和其他非語音事件的字組插入。
background_audio_suppression 參數會根據音量抑制背景音訊，避免它遭到轉錄或是以其他方式干擾語音辨識。您可以使用此參數來抑制旁邊的交談或背景雜訊。

您可以個別使用參數，或一起使用。它們可用於所有介面及大部分語言模型。如需參數、其容許值，及其對語音辨識品質和延遲之影響等相關資訊，請參閱語音活動偵測。

荷蘭文和義大利文的新寬頻和窄頻模型

服務現在支援荷蘭文和義大利文的寬頻和窄頻模型：

荷蘭文寬頻模型 (nl-NL_BroadbandModel)
荷蘭文窄頻模型 (nl-NL_NarrowbandModel)
義大利文寬頻模型 (it-IT_BroadbandModel)
義大利文窄頻模型 (it-IT_NarrowbandModel)

荷蘭文及義大利文語言模型已正式發行 (GA) 可供正式作業，用於語音辨識及語言模型與聲學模型自訂作業。如需所有可用語言模型的相關資訊，請參閱

支援適用於德文和韓文的 speaker_labels 參數

服務現在支援德文及韓文語言模型的說話者標籤（speaker_labels 參數）。說話者標籤可識別哪些人在多參與者交流中講了哪些字組。如需相關資訊，請參閱說話者標籤。

改良日文窄頻模型的語音辨識

日文窄頻模型 (ja-JP_NarrowbandModel) 現在包含數字和小數位數的一些多元字組單位。不論您是否啟用智慧型格式化，服務都會傳回這些多元單位。智慧型格式化特性會瞭解並傳回模型產生的多元單位。如果您自行對轉錄結果套用後處理，則需要適當處理這些單位。如需相關資訊，請參閱智慧型格式化文件中的日文。

簡化備份及還原

服務現在提供大幅改善的備份及還原程序。公用程式現在可用於從資料儲存庫備份資料，因此您不再需要在發生災難時重建所有資料。有關詳細信息，請參閱備份和恢復Watson語音服務資料。

2020 年 4 月 1 日 ( 1.1.3版)

聲學模型自訂作業現在已正式發行: 所有支援語言的聲學模型自訂作業現在已正式發行。如需個別語言模型的相關支援資訊，請參閱自訂作業的語言支援。

2020 年 2 月 28 日 ( 1.1.3版)

版本 1.1.3 可用

Speech to Text for IBM Cloud Pak for Data 1.1.3 版現在可供使用。

新的 end_of_phrase_silence_time 參數

對於語音辨識，服務現在支援 end_of_phrase_silence_time 參數。參數指定暫停間隔的持續時間，服務會在此時將文字記錄分割成多個最終結果。每個最終結果都會表示超過暫停間隔的暫停或長時間靜音。對於大部分的語言，預設暫停間隔是 0.8 秒；中文的預設間隔是 0.6 秒。

您可以使用此參數，在產生最終結果的頻率與轉錄正確性之間進行權衡。當正確性比延遲更重要時，請加長間隔。說話者預期會說出短詞組或單一字組時，請縮短間隔。

如需相關資訊，請參閱詞組結尾的靜音時間。

新的 split_transcript_at_phrase_end 參數

對於語音辨識，服務現在支援 split_transcript_at_phrase_end 參數。此參數會指示服務根據輸入的語意特性（例如在句子結束時），將文字記錄分割成多個最終結果。服務會根據您與要求搭配使用的基礎語言模型，來瞭解語意特性。自訂語言模型和文法也可能影響服務分割文字記錄的方式和位置。

參數會導致服務將 end_of_utterance 欄位新增至每個最終結果，以指出分割的動機：full_stop、silence、end_of_data 或 reset。

如需相關資訊，請參閱在詞組結尾分割文字記錄。

改良的 speaker_labels 參數

對於語音辨識，已更新 speaker_labels 參數，以改良個別說話者的識別，以進一步分析音訊樣本。如需說話者標籤特性的相關資訊，請參閱說話者標籤。有關功能改進的詳細資訊，請參閱 IBM Research AI Advances Speaker Diarization in Real Use Cases。

2019 年 11 月 27 日 ( 1.1.2版)

版本 1.1.2 可用: Speech to Text for IBM Cloud Pak for Data 1.1.2 版現在可供使用。
自訂模型數目上限: 針對每個擁有的認證，您可以建立不超過 1024 個自訂語言模型，以及不超過 1024 個自訂聲學模型。如需相關資訊，請參閱自訂模型數目上限。

2019 年 8 月 30 日 ( 1.0.1版)

版本 1.0.1 可用

Speech to Text for IBM Cloud Pak for Data 1.0.1 版現在可供使用。服務現在適用於 IBM Cloud Pak for Data 2.1.0.1。服務現在支援搭配 Red Hat OpenShift 來安裝 IBM Cloud Pak for Data。

西班牙文用語的新寬頻和窄頻模型

現在，服務提供六種西班牙文用語的寬頻和窄頻語言模型：

阿根廷西班牙文（es-AR_BroadbandModel 和 es-AR_NarrowbandModel）
卡斯提亞西班牙文（es-ES_BroadbandModel 和 es-ES_NarrowbandModel）
智利西班牙文（es-CL_BroadbandModel 和 es-CL_NarrowbandModel）
哥倫比亞西班牙文（es-CO_BroadbandModel 和 es-CO_NarrowbandModel）
墨西哥西班牙文（es-MX_BroadbandModel 和 es-MX_NarrowbandModel）
秘魯西班牙文（es-PE_BroadbandModel 和 es-PE_NarrowbandModel）

卡斯提亞西班牙文模型並不是新模型。這些模型已正式發行，適用於語音辨識和語言模型自訂作業，但對於聲學模型自訂作業是測試版。

其他五種用語的模型是新模型，針對所有用途都是測試版。由於這些其他用語是測試版，因此它們可能未準備好用於正式作業，並且會隨時變更。這些是初始供應項目，預期品質會隨著時間和使用而提高。

如需相關資訊，請參閱下列各節：

FISMA 支援

「聯邦資訊安全管理法 (FISMA)」支援現在適用於 Speech to Text for IBM Cloud Pak for Data。服務為 FISMA High Ready。

2019 年 6 月 28 日 ( 1.0.0版)

版本 1.0.0 可用

1.0.0版 (服務的起始版本) 現在可供使用。Speech to Text for IBM Cloud Pak for Data 基於公用 IBM Cloud上的 IBM Watson® Speech to Text 服務。Speech to Text for IBM Cloud Pak for Data 與公用 Speech to Text 服務在下列方面不同。如果您已經熟悉公用 Speech to Text 上的 IBM Cloud 服務，則這些資訊可能對您非常有用。

Speech to Text for IBM Cloud Pak for Data 使用存取記號進行鑑別。如需相關資訊，請參閱 API 和 SDK 參照。
Speech to Text for IBM Cloud Pak for Data 的端點是 IBM Cloud Pak for Data 叢集所特有。如需相關資訊，請參閱 API 和 SDK 參照。
Speech to Text for IBM Cloud Pak for Data 不會執行任何要求記載。您不需要使用 X-Watson-Learning-Opt-Out 要求標頭。
Speech to Text for IBM Cloud Pak for Data 不支援 Watson 記號。您不可以使用 X-Watson-Authorization-Token 要求標頭來向服務進行鑑別。