IBM Cloud Docs
Utilizzo di un modello per il riconoscimento vocale

Utilizzo di un modello per il riconoscimento vocale

Utilizza il parametro model di una richiesta di riconoscimento vocale per indicare il modello che deve essere utilizzato con la richiesta. Puoi specificare un modello vocale di grandi dimensioni, un modello precedente o di nuova generazione con il parametro.

Per ulteriori informazioni sui modelli disponibili per il riconoscimento vocale, vedi

Specificare un esempio di modello di generazione precedente

La seguente richiesta di esempio dell' HTTP e utilizza il modello di riconoscimento vocale della generazione precedente, l' en-US_NarrowbandModel :

IBM Cloud

curl -X POST -u "apikey:{apikey}" \
--header "Content-Type: audio/flac" \
--data-binary @{path}audio-file.flac \
"{url}/v1/recognize?model=en-US_NarrowbandModel"

IBM Cloud Pak for Data IBM Software Hub

curl -X POST \
--header "Authorization: Bearer {token}" \
--header "Content-Type: audio/flac" \
--data-binary @{path}audio-file.flac \
"{url}/v1/recognize?model=en-US_NarrowbandModel"

Specificare un esempio di modello di nuova generazione

La seguente richiesta di esempio dell' HTTP e utilizza il modello di riconoscimento vocale dell' en-US_Telephony e di nuova generazione:

IBM Cloud

curl -X POST -u "apikey:{apikey}" \
--header "Content-Type: audio/wav" \
--data-binary @{path}audio-file.wav \
"{url}/v1/recognize?model=en-US_Telephony"

IBM Cloud Pak for Data IBM Software Hub

curl -X POST \
--header "Authorization: Bearer {token}" \
--header "Content-Type: audio/wav" \
--data-binary @{path}audio-file.wav \
"{url}/v1/recognize?model=en-US_Telephony"

Specifica un esempio di modello vocale di grandi dimensioni

La seguente richiesta di esempio dell' HTTP e utilizza il modello di riconoscimento vocale di grandi dimensioni en-US :

IBM Cloud

curl -X POST -u "apikey:{apikey}" \
--header "Content-Type: audio/wav" \
--data-binary @{path}audio-file.wav \
"{url}/v1/recognize?model=en-US"

IBM Cloud Pak for Data IBM Software Hub

curl -X POST \
--header "Authorization: Bearer {token}" \
--header "Content-Type: audio/wav" \
--data-binary @{path}audio-file.wav \
"{url}/v1/recognize?model=en-US"

Utilizzo del modello predefinito

Se si omette il parametro " model " da una richiesta di riconoscimento vocale, il servizio utilizza l'inglese americano " en-US_BroadbandModel " per impostazione predefinita. Questo valore predefinito si applica a tutte le richieste di riconoscimento vocale.

IBM Cloud Pak for Data Software Hub IBM Se non si installa il en-US_BroadbandModel, non può essere utilizzato come modello predefinito. In questo caso, è necessario

  • Utilizzare il parametro model per passare il modello che deve essere utilizzato con ogni richiesta.
  • Specifica un nuovo modello predefinito per la tua installazione di Speech to Text per IBM Cloud Pak for Data utilizzando la proprietà defaultSTTModel nella risorsa personalizzata dei servizi Speech. Per ulteriori informazioni, consultare Installazione di Watson Speech to Text.