Utilizzo di un modello per il riconoscimento vocale
Utilizza il parametro model
di una richiesta di riconoscimento vocale per indicare il modello che deve essere utilizzato con la richiesta. Puoi specificare un modello vocale di grandi dimensioni, un modello precedente o di nuova generazione
con il parametro.
Per ulteriori informazioni sui modelli disponibili per il riconoscimento vocale, vedi
- Modelli e lingue di generazione precedente
- Modelli e lingue di nuova generazione
- Lingue e modelli vocali di grandi dimensioni
Specificare un esempio di modello di generazione precedente
La seguente richiesta di esempio dell' HTTP e utilizza il modello di riconoscimento vocale della generazione precedente, l' en-US_NarrowbandModel
:
IBM Cloud
curl -X POST -u "apikey:{apikey}" \
--header "Content-Type: audio/flac" \
--data-binary @{path}audio-file.flac \
"{url}/v1/recognize?model=en-US_NarrowbandModel"
IBM Cloud Pak for Data IBM Software Hub
curl -X POST \
--header "Authorization: Bearer {token}" \
--header "Content-Type: audio/flac" \
--data-binary @{path}audio-file.flac \
"{url}/v1/recognize?model=en-US_NarrowbandModel"
Specificare un esempio di modello di nuova generazione
La seguente richiesta di esempio dell' HTTP e utilizza il modello di riconoscimento vocale dell' en-US_Telephony
e di nuova generazione:
IBM Cloud
curl -X POST -u "apikey:{apikey}" \
--header "Content-Type: audio/wav" \
--data-binary @{path}audio-file.wav \
"{url}/v1/recognize?model=en-US_Telephony"
IBM Cloud Pak for Data IBM Software Hub
curl -X POST \
--header "Authorization: Bearer {token}" \
--header "Content-Type: audio/wav" \
--data-binary @{path}audio-file.wav \
"{url}/v1/recognize?model=en-US_Telephony"
Specifica un esempio di modello vocale di grandi dimensioni
La seguente richiesta di esempio dell' HTTP e utilizza il modello di riconoscimento vocale di grandi dimensioni en-US
:
IBM Cloud
curl -X POST -u "apikey:{apikey}" \
--header "Content-Type: audio/wav" \
--data-binary @{path}audio-file.wav \
"{url}/v1/recognize?model=en-US"
IBM Cloud Pak for Data IBM Software Hub
curl -X POST \
--header "Authorization: Bearer {token}" \
--header "Content-Type: audio/wav" \
--data-binary @{path}audio-file.wav \
"{url}/v1/recognize?model=en-US"
Utilizzo del modello predefinito
Se si omette il parametro " model
" da una richiesta di riconoscimento vocale, il servizio utilizza l'inglese americano " en-US_BroadbandModel
" per impostazione predefinita. Questo valore predefinito
si applica a tutte le richieste di riconoscimento vocale.
IBM Cloud Pak for Data Software Hub IBM Se non si installa il en-US_BroadbandModel
, non può essere utilizzato come modello predefinito.
In questo caso, è necessario
- Utilizzare il parametro
model
per passare il modello che deve essere utilizzato con ogni richiesta. - Specifica un nuovo modello predefinito per la tua installazione di Speech to Text per IBM Cloud Pak for Data utilizzando la proprietà
defaultSTTModel
nella risorsa personalizzata dei servizi Speech. Per ulteriori informazioni, consultare Installazione di Watson Speech to Text.