Changes for page 10 - Riconoscimento vocale
Last modified by administrator BDP on 2024/10/21 14:52
From version 50.6
edited by administrator BDP
on 2021/02/23 16:24
on 2021/02/23 16:24
Change comment:
There is no comment for this version
To version 50.8
edited by administrator BDP
on 2021/02/25 12:16
on 2021/02/25 12:16
Change comment:
There is no comment for this version
Summary
-
Page properties (1 modified, 0 added, 0 removed)
Details
- Page properties
-
- Content
-
... ... @@ -154,17 +154,28 @@ 154 154 155 155 Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (//Google Speech API//). Le sue principali funzionalità sono le seguenti: 156 156 157 -* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento) 158 -* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV) 159 -* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto 157 +* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento). 158 +* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV). 159 +* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto. Nella scheda //Salvataggio scelta// è possibile salvare l'accuratezza (definita anche //confidence//) in una //transfer property// o in un //calldata.// 160 160 * Abilitare il riconoscimento di espressione singola (//single utterance//). Nel caso ci si aspetti che l’utente pronunci una singola parola breve, ad esempio un //si// o un //no//, abilitare questo parametro migliora la capacità di riconoscimento del motore stesso. 161 161 * Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//. 162 162 * In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine. 163 163 * Il testo può essere salvato in una Transfer Property o in un CallData, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata. 164 164 165 -Il servizio è disponibile anche in //compatibility mode.// 165 +(% class="box errormessage" %) 166 +((( 167 +**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi), dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// ((vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi. In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe nessun valore. Quindi il parametro che abilita la single_utterance NON andrebbe usato con BurgeIn abilitato e messaggio di invito che dura più di un paio di secondi. 168 +))) 166 166 167 167 171 + 172 + 173 + 174 + 175 + 176 +Il servizio è disponibile anche in //compatibility mode//. 177 + 178 + 168 168 === **Parametri di Configurazione** === 169 169 170 170 ==== **Proprietà** ==== ... ... @@ -173,7 +173,7 @@ 173 173 174 174 //Scheda Generale// 175 175 176 -[[image:WAV_skGenerale.png||height="517" width="400"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]187 +[[image:WAV_skGenerale.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] 177 177 178 178 Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento. 179 179 ... ... @@ -186,7 +186,7 @@ 186 186 187 187 //Scheda Messaggi per TTS// 188 188 189 -[[image:STT_skMess.png||height="518" width="400"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]200 +[[image:STT_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] 190 190 191 191 192 192 L'elenco dei campi visualizzati è il seguente: ... ... @@ -198,7 +198,7 @@ 198 198 199 199 //Scheda Messaggi per WAV// 200 200 201 -[[image:WAV_skMess.png||height="518" width="400"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]212 +[[image:WAV_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] 202 202 203 203 Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti: 204 204 ... ... @@ -214,7 +214,7 @@ 214 214 215 215 //Scheda Motore TTS// 216 216 217 -[[image:STT_skMotoreTTS.png||height="517" width="400"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]228 +[[image:STT_skMotoreTTS.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] 218 218 219 219 Impostare il campo seguente: 220 220 ... ... @@ -224,7 +224,7 @@ 224 224 225 225 //Scheda Motore STT// 226 226 227 -[[image:STT_skMotoreSST.png||height="518" width="400"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]238 +[[image:STT_skMotoreSST.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] 228 228 229 229 230 230 Impostare i campi seguenti: ... ... @@ -242,11 +242,10 @@ 242 242 |**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70. 243 243 |**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//. 244 244 |**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//. 245 -| | 246 246 247 247 //Scheda Salvataggio scelta// 248 248 249 -[[image:WAV_skSalva.png||height="517" width="400"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]259 +[[image:WAV_skSalva.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] 250 250 251 251 Impostare i campi seguenti: 252 252 ... ... @@ -258,7 +258,6 @@ 258 258 |//Salva confidence in//| 259 259 |**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza. 260 260 |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza. 261 -|(% style="text-align:right" %) | 262 262 263 263 ==== Port di Uscita ==== 264 264 ... ... @@ -280,7 +280,7 @@ 280 280 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 281 281 |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento. 282 282 |**_ASR_Source**|((( 283 -Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel Call 292 +Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono: 284 284 285 285 * **“”** (stringa vuota): nel caso in cui non sia riconosciuto l'audio e non sia rilevato alcun digit. 286 286 * **“DTMF”**: nel caso sia rilevato un digit che interrompe la fase di riconoscimento. La Transfer Property e il Call Data, eventualmente configurati come variabili di uscita, conterranno il digit ricevuto. ... ... @@ -287,10 +287,6 @@ 287 287 * **“STT”**: nel caso il motore di riconoscimento restituisca un qualsiasi valore. La Transfer Property e il Call Data, eventualmente configurati come variabili di uscita, conterranno il testo riconosciuto. 288 288 ))) 289 289 290 - 291 - 292 - 293 - 294 294 == VoiceMenu (CVoiceMenu) == 295 295 296 296 Presenta un menu di opzioni e, in base alla scelta del chiamante, effettuata tramite il riconoscimento vocale, attiva il servizio associato. Permette di configurare la sequenza di messaggi (file wav/avi, numeri, date, ecc.) da riprodurre all'utente per invitarlo a segnalare al sistema la sua scelta.