IBM Cloud Docs
从神经声音迁移

从神经声音迁移

IBM Cloud

IBM Watson® Text to Speech 服务提供 增强的神经声音表达神经声音。 所有 神经声音 已于 2023 年 3 月 31 日从服务中移除。 新的增强神经和表达神经声音可用于过时的澳大利亚英语,荷兰语和韩语神经声音。 本主题描述了从过时的神经声音迁移到增强的或表达的神经声音所需的步骤。

步骤 1: 识别可迁移到的新声音

识别可用来代替过时神经声音的新声音。 表 1 列出了可以迁移到的新声音。

可从神经声音迁移到的声音
语言 过时的神经声音 增强的神经和表现力神经声音
澳大利亚英语 en-AU_CraigVoice
en-AU_MadisonVoice
en-AU_SteveVoice
en-AU_HeidiExpressive (表达神经)
en-AU_JackExpressive (表达神经)
荷兰语荷兰语 nl-NL_EmmaVoice
nl-NL_LiamVoice
nl-NL_MerelV3Voice (增强型神经)
韩语 ko-KR_HyunjunVoice
ko-KR_SiWooVoice
ko-KR_YoungmiVoice
ko-KR_YunaVoice
ko-KR_JinV3Voice (增强型神经)

步骤 2: 在语音合成中使用新声音

使用语音合成请求中的新声音来确定其对应用程序的有效性。 例如,以下示例使用过时的澳大利亚英语语音 en-AU_CraigVoice:

curl -X POST -u "apikey:{apikey}" \
--header "Content-Type: application/json" \
--header "Accept: audio/wav" \
--data "{\"text\":\"hello world\"}" \
--output hello_world.wav \
"{url}/v1/synthesize?voice=en-AU_CraigVoice"

以下示例将过时的语音替换为澳大利亚英语语音 en-AU_JackExpressive:

curl -X POST -u "apikey:{apikey}" \
--header "Content-Type: application/json" \
--header "Accept: audio/wav" \
--data "{\"text\":\"hello world\"}" \
--output hello_world.wav \
"{url}/v1/synthesize?voice=en-AU_JackExpressive"

在应用程序中每次使用过时的语音时重复此替换。

步骤 3: 更新基于神经声音的任何定制模型

如果使用定制模型为神经声音创建定制词的字典,那么需要验证定制词是否与增强的神经声音或表现性神经声音一起正常工作。 至少,您需要将用于神经声音的定制词的音标符号与可用于增强神经声音和表现力神经声音的符号进行比较。 表 2 提供了指向主题的链接,这些主题为过时的神经声音以及增强的神经和表达神经声音提供了音标符号。

过时的神经语音以及增强的神经语音和表现性神经语音的语音符号
语言 过时神经声音的音标符号 用于增强神经和表达神经声音的音标符号
澳大利亚英语 英语(澳大利亚)符号(过时) 英语(澳大利亚)符号
荷兰语荷兰语 荷兰语(荷兰语)符号(过时) 荷兰语(荷兰语)符号
韩语 韩国语符号(过时) 韩语音标符号

在验证定制词时,您需要了解以下信息:

  • 增强的神经和表现力神经声音支持标准国际音标 (IPA) 和 IBM 符号音标表示法 (SPR) 音标符号。 过时的神经声音仅支持 IPA 符号。
  • 增强的神经和表现力神经声音使用与过时的神经声音不同的 IPA 符号。 存在一些重叠,但您需要验证并测试所有单词的翻译,以确保它们的定义达到您的满意程度。
  • 如果在定制模型中更新定制词,那么为已存在的词添加新翻译将覆盖该词的现有翻译。

由于定制模型基于语言而不是特定声音,因此您不需要创建新的定制模型。 但是,您可能会发现更容易使用新模型,以避免模型包含的现有定制词与新定制词之间产生混淆。

有关使用定制模型和定制词的条目的更多信息,请参阅以下主题: