IBM Cloud Docs
Text to Speech 시작하기

Text to Speech 시작하기

IBM Watson® Text to Speech 서비스는 작성된 텍스트를 자연어 음성으로 변환하여 애플리케이션에 필요한 음성 합성 기능을 제공합니다. 이 curl 기반 튜토리얼을 사용하면 서비스를 신속하게 시작할 수 있습니다. 예에서는 오디오 스트림을 요청하기 위해 서비스의 POSTGET /v1/synthesize 메소드를 호출하는 방법을 보여줍니다.

이 튜토리얼에서는 curl 명령줄 유틸리티를 사용하여 REST API 호출을 시연합니다. For more information about curl, see Using curl with Watson examples.

IBM Cloud Text to Speech 서비스 시작에 대한 시각적 요약을 보려면 다음 비디오를 시청하십시오.

시작하기 전에

IBM Cloud

IBM Cloud

  • 서비스의 인스턴스를 작성하십시오.

    1. Go to the Text to Speech page in the IBM Cloud catalog.
    2. 무료 IBM Cloud 계정에 가입하거나 로그인하십시오.
    3. 라이선스 계약 약관을 읽고 동의합니다.
    4. 작성을 클릭하십시오.
  • 인증할 인증 정보를 서비스 인스턴스에 복사하십시오.

    1. 서비스 인스턴스의 관리 페이지를 확인하십시오

      • 서비스 인스턴스의 시작하기 페이지에 있는 경우 주제 목록에서 관리 항목을 클릭합니다.
      • 리소스 목록 페이지에 있는 경우 이름 열에서 Machine Learning 그룹을 확장하고 서비스 인스턴스의 이름을 클릭합니다.
    2. 관리 페이지의 자격증명 상자에서 자격증명 표시를 클릭합니다.

    3. 서비스 인스턴스의 API KeyURL 값을 복사합니다.

이 튜토리얼은 API 키를 사용하여 인증합니다. 프로덕션에서 IAM 토큰을 사용합니다. 자세한 내용은 IBM Cloud 인증하기를 참조하세요.

IBM Cloud Pak for Data

IBM Cloud Pak for Data

Text to Speech 를 설치하고 구성해야 이 튜토리얼을 시작할 수 있습니다. 자세한 정보는 Watson 음성 서비스(Cloud Pak for Data)를 참조하십시오.

  1. 웹 클라이언트, API 또는 명령줄 인터페이스를 사용하여 서비스 인스턴스를 만듭니다. IBM Cloud Pak for Data 에서 서비스 인스턴스를 만드는 방법에 대한 자세한 내용은 Watson 음성 서비스용 서비스 인스턴스 만들기를 참조하십시오.
    • Watson 스피치 서비스 인스턴스 만들기의* 지침에 따라 인스턴스에 대한 무기명 토큰을 얻습니다. 이 튜토리얼에서는 무기명 토큰을 사용하여 서비스를 인증합니다.

미국 영어로 된 텍스트 합성

다음 명령은 POST /v1/synthesize 메소드를 사용하여 오디오에 대한 미국 영어 입력을 합성합니다. 이 요청은 en-US_MichaelV3Voice 음성을 사용합니다. 이는 WAV 형식의 오디오를 생성합니다.

브라우저 또는 기타 도구를 사용하여 이 튜토리얼의 예를 통해 생성된 오디오 파일을 재생할 수 있습니다. 자세한 내용은 오디오 파일 재생하기를 참조하세요.

  1. 다음 명령을 실행하여 문자열 "hello world"를 합성하십시오. 요청은 WAV 파일 hello_world.wav을(를) 생성합니다.

    IBM Cloud

    • {apikey}{url}을 사용자의 API 키 및 URL로 대체하십시오.
    curl -X POST -u "apikey:{apikey}" \
    --header "Content-Type: application/json" \
    --header "Accept: audio/wav" \
    --data "{\"text\":\"hello world\"}" \
    --output hello_world.wav \
    "{url}/v1/synthesize?voice=en-US_MichaelV3Voice"
    

    IBM Cloud Pak for Data IBM Software Hub

    • {token}{url} 를 액세스 토큰으로, URL 를 서비스 인스턴스로 대체하십시오.
    curl -X POST \
    --header "Authorization: Bearer {token}" \
    --header "Content-Type: application/json" \
    --header "Accept: audio/wav" \
    --data "{\"text\":\"hello world\"}" \
    --output hello_world.wav \
    "{url}/v1/synthesize?voice=en-US_MichaelV3Voice"
    

다른 음성 및 오디오 형식 사용

다음 명령은 POST /v1/synthesize 메소드를 사용하여 오디오에 대한 동일한 미국 영어 입력을 합성합니다. 하지만 이 요청은 en-US_AllisonV3Voice 음성을 사용하고 명시적으로 오디오를 기본 Ogg 형식으로 요청합니다.

  1. 다음 명령을 실행하여 문자열 "hello world"를 합성하지만 다른 음성을 사용합니다. 요청은 Ogg 파일 hello_world.ogg을(를) 생성합니다.

    IBM Cloud

    • {apikey}{url}을 사용자의 API 키 및 URL로 대체하십시오.
    curl -X POST -u "apikey:{apikey}" \
    --header "Content-Type: application/json" \
    --data "{\"text\":\"hello world\"}" \
    --output hello_world.ogg \
    "{url}/v1/synthesize?voice=en-US_AllisonV3Voice"
    

    IBM Cloud Pak for Data IBM Software Hub

    • {token}{url} 를 액세스 토큰으로, URL 를 서비스 인스턴스로 대체하십시오.
    curl -X POST \
    --header "Authorization: Bearer {token}" \
    --header "Content-Type: application/json" \
    --header "Accept: audio/wav" \
    --data "{\"text\":\"hello world\"}" \
    --output hello_world.wav \
    "{url}/v1/synthesize?voice=en-US_AllisonV3Voice"
    

스페인어로 된 텍스트 합성

다음 명령에서는 GET /v1/synthesize 메소드를 사용하여 스페인어 입력을 오디오 파일로 합성합니다. GET 메소드에는 세 개의 조회 매개변수(오디오 형식을 지정하는 accept, 오디오에 입력 텍스트를 지정하는 text, 스페인어 음성을 지정하는 voice)가 포함됩니다. accepttext은(는) 조회 매개변수로 전달되므로 요청은 URL로 인코딩됩니다.

  1. 다음 명령을 실행하여 문자열 "hola mundo"를 합성하고 hola_mundo.wav라는 이름으로 WAV 파일을 생성하십시오.

    IBM Cloud

    • {apikey}{url}을 사용자의 API 키 및 URL로 대체하십시오.
    curl -X GET -u "apikey:{apikey}" \
    --output hola_mundo.wav \
    "{url}/v1/synthesize?accept=audio%2Fwav&text=hola%20mundo&voice=es-ES_EnriqueV3Voice"
    

    IBM Cloud Pak for Data IBM Software Hub

    • {token}{url} 를 액세스 토큰으로, URL 를 서비스 인스턴스로 대체하십시오.
    curl -X POST \
    --header "Authorization: Bearer {token}" \
    --output hola_mundo.wav \
    "{url}/v1/synthesize?accept=audio%2Fwav&text=hola%20mundo&voice=es-ES_EnriqueV3Voice"
    

다음 단계

  • 텍스트를 받아들이고 다양한 목소리로 음성을 생성하는 응용 프로그램의 예를 보려면, Text to Speech 데모를 참조하십시오.
  • 서비스의 인터페이스 및 기능에 대한 자세한 정보는 서비스 기능을 참조하십시오.
  • 서비스 인터페이스의 모든 방법에 대한 자세한 정보는 API & SDK 참조를 참조하십시오.