IBM Cloud Docs
음성 기호 이해

음성 기호 이해

IBM Watson® Text to Speech 서비스의 모든 언어와 음성은 표준 국제 음성 알파벳(IPA)과 IBM 모두 지원합니다 단어의 소리를 표현하는 상징적 음성 표현(SPR) 표기법을 모두 지원합니다. 두 표기법 모두 단어의 발음, 단어를 구성하는 소리, 소리가 음절로 어떻게 나뉘는지, 어떤 음절이 강세인지 나타내는 음성 인코딩을 제공합니다. 지원되는 언어의 음성 기호 는 각 언어의 음성 기호에 대해 설명하는 주제에 대한 링크를 제공합니다.

단어 발음 정의

단어의 음성 발음을 입력 텍스트 내에서 또는 사용자 정의 모델에 대해 정의하려면 SSML(Speech Synthesis Markup Language) 또는 동등한 메소드 매개변수의 <phoneme> 요소를 사용합니다. <phoneme> 요소에는 다음 두 개의 속성이 있습니다.

  • alphabet 속성은 발음의 표기법을 지정합니다. 발음이 SPR로 정의되어 있음을 나타내려면 ibm 값을 사용하십시오. 발음이 IPA로 정의되어 있음을 나타내려면 ipa 값을 사용하십시오.
  • ph 속성은 발음을 정의합니다. 이는 지정된 언어에 적합한 일련의 허용 가능한 기호로 구성됩니다. 기호는 <phoneme> 요소에 포함된 단어의 발음 방법을 정의합니다.

발음을 정의할 때 다음 규칙을 따르십시오.

  • 문서화된 SPR 또는 IPA 기호만 사용합니다. 서비스는 언어에서 허용되지 않은 발음 기호가 포함된 올바르지 않은 SPR 정의를 고려합니다. 필수 스펙을 따르지 않은 SPR 또는 IPA 항목은 올바르지 않습니다.
  • 여러 IPA 기호(또는 기호 조합)가 SPR 기호에 맞게 문서화되어 있는 경우 모든 IPA 기호는 단일 SPR 기호와 동등합니다. 서비스는 모든 IPA 기호를 동일하게 간주하고 IPA에서 설명할 미묘하거나 지역적 차이를 인식하지 못합니다.

자세한 정보는 다음을 참조하십시오.

IBM SPR 관련 작업

IBM SPR은 표준 IPA의 대체 표시입니다. 다음의 유효한 SPR 표기 예는 미국 영어에서 throughshocking이라는 단어를 정의합니다

<phoneme alphabet="ibm" ph=".1Tru">through</phoneme>
<phoneme alphabet="ibm" ph=".1Sa.0kIG">shocking</phoneme>

정의에서 문자는 미국 영어 발음의 특정 소리를 나타냅니다. . 는 새로운 음절의 시작을 알리고, 10 는 음절의 강세를 나타냅니다. 자세한 정보는 음절 지정을 참조하십시오.

언어음 기호

각 언어는 해당 언어의 언어음을 표시하기 위해 SPR 기호의 자체 인벤토리를 사용합니다. 다음 규칙은 SPR 기호를 지정하는 데 적용됩니다.

  • 문자는 대소문자를 구분함에 따라 eE와 같이 두 가지 다른 소리를 나타냅니다.
  • 2자 및 3자 기호는 기호 표에 표시된 경우 작은따옴표로 묶어야 합니다. 작은따옴표는 여러 문자가 실제로는 하나의 기호임을 나타냅니다. 예를 들어, 독일어 단어 heim 의 기호 'aj'"h'aj'm" 로 지정되어 있습니다.
  • 일부 세 글자 기호에는 두 글자만 작은따옴표로 묶는 경우도 있습니다. 작은따옴표는 두 문자가 하나의 기호임을 나타냅니다. 따라서 SPR은 두 개의 기호로 구성됩니다. 예를 들어 네덜란드 네덜란드어 단어 의존성에서 'a:'n 기호는 'a:' n 두 개의 기호를 포함하며 d'e:'.pEn.1d'a:'n.s@s 지정됩니다.

SPR 형식에서 단어의 발음을 정의할 때 다음 사항도 고려하십시오.

  • 모든 언어의 소리에는 해당 언어 내에서 특정한 분포 특성이 있습니다. 예를 들어, 영어의 모든 통용어에서 Gsing*(*)의 ".1sIG" 소리는 단어의 시작 부분에서 발음되지 않습니다. 특히 분포가 적은 다른 미국 영어 소리는 성문 폐쇄음(?), 탄음(F), 음절 비음(N)입니다. 일반적으로 발생하지 않는 컨텍스트에 소리 기호를 입력하면 결과 음성이 비정상적으로 들릴 수 있습니다.
  • 서비스는 소리가 자연어의 특정 컨텍스트에서 변경되는 프로세스를 반영하기 위해 정교한 언어적 규칙 세트를 입력에 적용합니다. 예를 들어, 미국 영어에서 단어 wirte(".1r1Yt")의 t 소리는 writer(".1rY.0FR")에서 탄음(F)으로 발음됩니다. SPR 입력은 일반적인 입력 텍스트처럼 이러한 수정을 수행합니다. 이 예에서 ".1rY.0tR" 또는 ".1rY.0FR"은 생성된 음성에 영향을 주지 않습니다.

IPA 관련 작업

발음 기호 또는 Unicode 값을 사용하여 IPA 발음을 정의할 수 있습니다. IPA는 산업 표준 표기법입니다. 다음은 발음 기호 및 Unicode의 tomato 단어에 대한 올바른 IPA 표기법의 예입니다.

<phoneme alphabet="ipa" ph="təˈmeɪ.ɾoʊ">tomato</phoneme>
<phoneme alphabet="ipa" ph="t&#x0259;&#x02C8;me&#x026A;.&#x027E;o&#x028A;">tomato</phoneme>

음절 지정

SPR 및 IPA 모두에서 음절 경계 및 강세를 지정할 수 있습니다.

음절 경계

.(마침표, IPA 유니코드 002E)를 사용하여 SPR 또는 IPA에서 각 음절의 시작을 표시할 수 있습니다. 그러나 언어의 올바른 음성을 보존하기 위해 서비스는 일부 경우에서 마침표를 사용하지 않도록 선택할 수 있습니다(예를 들어, 음절 경계가 언어의 올바르지 않거나 부자연스러운 위치에 배치된 경우). 일반적으로 음절 경계 또는 단어의 발음과 관련된 다른 측면에 대해 유효한 선호도를 표시할 수 있는 경우, 서비스는 그러한 요청을 존중합니다.

음절 강세

표 1에서는 발음에 대한 음절 강세를 나타내는 데 사용할 수 있는 기호를 식별합니다. IBM은 SPR 또는 IPA 중 하나에서 발음에 대한 제1강세를 표시하도록 권장합니다. 그러나 두 형식 모두에서 음절 강세 표시는 선택사항입니다. 서비스는 강세를 표시하지 않는 경우 강세가 발생하는 시점을 판별합니다.

음절 강세
강세 SPR 기호 IPA 기호 IPA 유니코드
제1강세 1 ˈ 02C8
제2강세 2 ˌ 02CC
강세 없음 0 기호 없음 값 없음

사용자는 음절 경계 내에 음절 강세 마커를 배치해야 하지만 항상 음절의 모음에서 왼쪽에 배치되어야 합니다. 강세 모음의 왼쪽 어느 위치에서나 마커를 배치할 수 있습니다. 예를 들어, 다음의 SPR 예제 각각은 단어 구성의 올바른 모음에 주강세(1)를 배치합니다

<phoneme alphabet="ibm" ph="kXn1strHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXns1trHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnst1rHkSXn">construction</phoneme>
<phoneme alphabet="ibm" ph="kXnstr1HkSXn">construction</phoneme>

음절 강세를 사용하기 위한 언어별 역할

표 2에는 음절 강세 지정에 적용하는 언어별 고려사항이 나열되어 있습니다. 표에서 언어에 대한 규칙이 규정되어 있지 않으면 이전 절에 설명된 음절 강세 기호를 사용할 수 있습니다.

언어 표기법 언어별 규칙
프랑스어 및
캐나다 프랑스어
SPR 모든 음절 강세 기호는 허용됩니다. 그러나 음절 기호는 음절 모음 앞에
  바로 와야 합니다. 프랑스어의 음절 강세는 다른 언어보다
  더 엄격합니다. 강세 기호가 올바르지 않은 위치에 있으면
  오류가 발생합니다. |

| 프랑스어 및 \n 캐나다 프랑스어 | IPA | 모든 음절 강세 기호는 무시됩니다. | | 이탈리아어 | SPR 및 IPA | 1(기본 강세)만 지정할 수 있습니다. 보조 강세를 지정하거나 강세 없음으로 지정하는 경우 오류가 발생합니다. | | 일본어 | SPR 및 IPA | 1(기본 강세) 및 0(강세 없음)만 지원할 수 있습니다. 보조 강세를 지정하는 경우 오류가 발생합니다. | | 스페인어 | SPR 및 IPA | 1(기본 강세)만 지정할 수 있습니다. 보조 강세를 지정하거나 강세 없음으로 지정하는 경우 오류가 발생합니다. |

지원되는 언어의 음성 기호

표 3에는 서비스에서 지원하는 언어가 나열되어 있으며 해당 언어의 SPR 기호, IPA 기호 및 IPA 유니코드 값을 설명하는 항목에 대한 링크가 나와 있습니다. 이 주제는 각 기호의 예제를 해당 언어의 단어로 제공합니다. 통용어 차이로 인해 예가 발음과 항상 일치하지 않을 수 있습니다.

가용성 열 은 각 음성이 IBM Cloud, IBM Cloud Pak for Data, IBM Software Hub 또는 모두 (모든 버전 ). 지원되는 음성 언어에 대한 자세한 정보는 언어와 음성을 참고하세요.

지원되는 언어의 음성 기호
언어 가용성
네덜란드어(네덜란드) 기호 모든 버전
영어(오스트레일리아) 기호 모든 버전
영어(영국) 기호 모든 버전
영어(미국) 기호 모든 버전
프랑스어(캐나다) 기호 모든 버전
프랑스어(프랑스) 기호 모든 버전
독일어 기호 모든 버전
이탈리아어 기호 모든 버전
일본어 기호 모든 버전
한국어 기호 모든 버전
포르투갈어(브라질) 기호 모든 버전
스페인어 기호 모든 버전