Text to Speech 시작하기
IBM Watson® Text to Speech 서비스는 작성된 텍스트를 자연어 음성으로 변환하여 애플리케이션에 필요한 음성 합성 기능을 제공합니다. 이 curl
기반 튜토리얼을 사용하면 서비스를 신속하게 시작할 수 있습니다. 예에서는 오디오 스트림을 요청하기 위해 서비스의 POST
및 GET /v1/synthesize
메소드를 호출하는 방법을 보여줍니다.
이 튜토리얼에서는 curl
명령줄 유틸리티를 사용하여 REST API 호출을 시연합니다. For more information about curl
, see Using curl with Watson examples.
IBM Cloud Text to Speech 서비스 시작에 대한 시각적 요약을 보려면 다음 비디오를 시청하십시오.
시작하기 전에
IBM Cloud
IBM Cloud
이 튜토리얼은 API 키를 사용하여 인증합니다. 프로덕션에서 IAM 토큰을 사용합니다. 자세한 내용은 IBM Cloud 인증하기를 참조하세요.
IBM Cloud Pak for Data
IBM Cloud Pak for Data
Text to Speech 를 설치하고 구성해야 이 튜토리얼을 시작할 수 있습니다. 자세한 정보는 Watson 음성 서비스(Cloud Pak for Data)를 참조하십시오.
- 웹 클라이언트, API 또는 명령줄 인터페이스를 사용하여 서비스 인스턴스를 만듭니다. IBM Cloud Pak for Data 에서 서비스 인스턴스를 만드는 방법에 대한 자세한 내용은 Watson 음성 서비스용 서비스 인스턴스 만들기를 참조하십시오.
-
- Watson 스피치 서비스 인스턴스 만들기의* 지침에 따라 인스턴스에 대한 무기명 토큰을 얻습니다. 이 튜토리얼에서는 무기명 토큰을 사용하여 서비스를 인증합니다.
미국 영어로 된 텍스트 합성
다음 명령은 POST /v1/synthesize
메소드를 사용하여 오디오에 대한 미국 영어 입력을 합성합니다. 이 요청은 en-US_MichaelV3Voice
음성을 사용합니다. 이는 WAV 형식의 오디오를 생성합니다.
브라우저 또는 기타 도구를 사용하여 이 튜토리얼의 예를 통해 생성된 오디오 파일을 재생할 수 있습니다. 자세한 내용은 오디오 파일 재생하기를 참조하세요.
-
다음 명령을 실행하여 문자열 "hello world"를 합성하십시오. 요청은 WAV 파일
hello_world.wav
을(를) 생성합니다.IBM Cloud
curl -X POST -u "apikey:{apikey}" \ --header "Content-Type: application/json" \ --header "Accept: audio/wav" \ --data "{\"text\":\"hello world\"}" \ --output hello_world.wav \ "{url}/v1/synthesize?voice=en-US_MichaelV3Voice"
IBM Cloud Pak for Data IBM Software Hub
{token}
와{url}
를 액세스 토큰으로, URL 를 서비스 인스턴스로 대체하십시오.
curl -X POST \ --header "Authorization: Bearer {token}" \ --header "Content-Type: application/json" \ --header "Accept: audio/wav" \ --data "{\"text\":\"hello world\"}" \ --output hello_world.wav \ "{url}/v1/synthesize?voice=en-US_MichaelV3Voice"
다른 음성 및 오디오 형식 사용
다음 명령은 POST /v1/synthesize
메소드를 사용하여 오디오에 대한 동일한 미국 영어 입력을 합성합니다. 하지만 이 요청은 en-US_AllisonV3Voice
음성을 사용하고 명시적으로 오디오를 기본 Ogg 형식으로 요청합니다.
-
다음 명령을 실행하여 문자열 "hello world"를 합성하지만 다른 음성을 사용합니다. 요청은 Ogg 파일
hello_world.ogg
을(를) 생성합니다.IBM Cloud
curl -X POST -u "apikey:{apikey}" \ --header "Content-Type: application/json" \ --data "{\"text\":\"hello world\"}" \ --output hello_world.ogg \ "{url}/v1/synthesize?voice=en-US_AllisonV3Voice"
IBM Cloud Pak for Data IBM Software Hub
{token}
와{url}
를 액세스 토큰으로, URL 를 서비스 인스턴스로 대체하십시오.
curl -X POST \ --header "Authorization: Bearer {token}" \ --header "Content-Type: application/json" \ --header "Accept: audio/wav" \ --data "{\"text\":\"hello world\"}" \ --output hello_world.wav \ "{url}/v1/synthesize?voice=en-US_AllisonV3Voice"
스페인어로 된 텍스트 합성
다음 명령에서는 GET /v1/synthesize
메소드를 사용하여 스페인어 입력을 오디오 파일로 합성합니다. GET
메소드에는 세 개의 조회 매개변수(오디오 형식을 지정하는 accept
, 오디오에 입력 텍스트를 지정하는 text
, 스페인어 음성을 지정하는 voice
)가 포함됩니다. accept
및 text
은(는) 조회 매개변수로 전달되므로 요청은 URL로 인코딩됩니다.
-
다음 명령을 실행하여 문자열 "hola mundo"를 합성하고
hola_mundo.wav
라는 이름으로 WAV 파일을 생성하십시오.IBM Cloud
curl -X GET -u "apikey:{apikey}" \ --output hola_mundo.wav \ "{url}/v1/synthesize?accept=audio%2Fwav&text=hola%20mundo&voice=es-ES_EnriqueV3Voice"
IBM Cloud Pak for Data IBM Software Hub
{token}
와{url}
를 액세스 토큰으로, URL 를 서비스 인스턴스로 대체하십시오.
curl -X POST \ --header "Authorization: Bearer {token}" \ --output hola_mundo.wav \ "{url}/v1/synthesize?accept=audio%2Fwav&text=hola%20mundo&voice=es-ES_EnriqueV3Voice"
다음 단계
- 텍스트를 받아들이고 다양한 목소리로 음성을 생성하는 응용 프로그램의 예를 보려면, Text to Speech 데모를 참조하십시오.
- 서비스의 인터페이스 및 기능에 대한 자세한 정보는 서비스 기능을 참조하십시오.
- 서비스 인터페이스의 모든 방법에 대한 자세한 정보는 API & SDK 참조를 참조하십시오.