Changes for page 10 - Riconoscimento vocale
Last modified by administrator BDP on 2024/10/21 14:52
From version 64.1
edited by administrator BDP
on 2024/10/11 17:40
on 2024/10/11 17:40
Change comment:
There is no comment for this version
To version 66.1
edited by administrator BDP
on 2024/10/14 12:55
on 2024/10/14 12:55
Change comment:
There is no comment for this version
Summary
-
Page properties (1 modified, 0 added, 0 removed)
Details
- Page properties
-
- Content
-
... ... @@ -216,6 +216,7 @@ 216 216 * Data/Ora attuale 217 217 * Data/Ora del file 218 218 * Ordinale 219 +\\ 219 219 220 220 //Scheda Motore TTS// 221 221 ... ... @@ -224,7 +224,7 @@ 224 224 Impostare il campo seguente: 225 225 226 226 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 227 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametr i**|**Descrizione**228 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione** 228 228 |**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR. 229 229 230 230 //Scheda Motore STT// ... ... @@ -234,19 +234,42 @@ 234 234 Impostare i campi seguenti: 235 235 236 236 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 237 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametr i**|**Descrizione**238 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione** 238 238 |**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//. 239 239 |**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//. 240 -|**Termina riconoscimento su ricezione digit sdopo**|Selezionare per abilitare l'interruzione della play del messaggo di invito a parlare, sia riprodotto da file che tramite //TextToSpeech//. il tempo, espresso in millisecondi, indica dopo quanto deve essere terminata la fase di riconoscimento in seguito alla pressione di un digit dda parte dell'utente.241 +|**Termina riconoscimento su ricezione digit dopo**|Selezionare per abilitare l'interruzione della play del messaggo di invito a parlare, sia riprodotto da file che tramite //TextToSpeech//. il tempo, espresso in millisecondi, indica dopo quanto deve essere terminata la fase di riconoscimento in seguito alla pressione di un digit dda parte dell'utente. 241 241 |**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento. 242 242 |**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione. 243 243 |**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative. 244 244 |**Abilita riconoscimento espressione singola**|Selezionare si si vuole migliorare la modalità di riconoscimento di singoli comandi o parole, oppure di frasi brevi e concise, ad esempio //sì// o //no//. 245 -|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi. 246 +|**Tempo massimo di attesa**|((( 247 +Indicare il tempo massimo, espresso in secondi, consentito al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi. 248 + 249 +**NOTA BENE**: questo valore ha SEMPRE la precedenza sui parametri aggiuntivi (//SpeechEndTimeout// e //SpeechStartTimeout//), quindi la fase di riconoscimento termina dopo il numero di secondi impostato in tale parametro anche se l’utente sta ancora parlando. Questo valore deve essere sempre superiore ai valori indicati nei parametri aggiuntivi. 250 +))) 246 246 |**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70. 247 247 |**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//. 248 -|**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.253 +|**Valore Parametri**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//. 249 249 255 +//Scheda Parametri aggiuntivi// 256 + 257 +In questa scheda è possibile indicare alcuni parametri aggiuntivi relativi all'aggiornamento di versione delle API Google di riconoscimento vocale (da V1 a V2). 258 + 259 +[[image:STT_skParAgg.jpg||width="400"]] 260 + 261 +I parametri aggiuntivi predefiniti sono i seguenti: 262 + 263 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 264 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione** 265 +|**Model**|Indicare il modello di apprendimento automatico interessato. Il modello consigliato è //telephony// (modello più accurato per trascrivere l'audio telefonico). 266 +|**SpeechEndTimeout**|Indicare il //timeout//, espresso in secondi, che interrompe la comunicazione con l'utente se l'audio vocale non inizia entro il periodo stabilito, cioè se la pausa iniziale supera la durata del timeout. 267 +|**SpeechStartTimeout**|Indicare il //timeout//, espresso in secondi, che interrompe la comunicazione con l'utente se l'audio vocale non riprende entro il periodo stabilito, cioè se c'è un pausa tra due frase che supera la durata del timeout. 268 +|**StopAsFirstIsFinal**|. 269 +|**EnableAutomaticPunctuation**| 270 +|**ProfanityFilter**| 271 + 272 +==== ==== 273 + 250 250 //Scheda Salvataggio scelta// 251 251 252 252 [[image:WAV_skSalva.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] ... ... @@ -254,7 +254,7 @@ 254 254 Impostare i campi seguenti: 255 255 256 256 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 257 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametr i**|**Descrizione**281 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione** 258 258 |//Salva frase riconosciuta in//| 259 259 |(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 260 260 |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. ... ... @@ -269,7 +269,7 @@ 269 269 Le funzionalità dei //Port di Uscita// del blocchetto sono le seguenti : 270 270 271 271 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 272 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametr i**|**Descrizione**296 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione** 273 273 |**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit. 274 274 |**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit. 275 275 |**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo. ... ... @@ -279,7 +279,7 @@ 279 279 Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi: 280 280 281 281 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 282 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametr i**|**Descrizione**306 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione** 283 283 |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento. 284 284 |**_ASR_Source**|((( 285 285 Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono: