Changes for page 10 - Riconoscimento vocale
Last modified by administrator BDP on 2024/10/21 14:52
From version 53.1
edited by administrator BDP
on 2024/10/11 15:51
on 2024/10/11 15:51
Change comment:
Upload new image "STT_skGenerale.jpg", version 1.1
To version 50.6
edited by administrator BDP
on 2021/02/23 16:24
on 2021/02/23 16:24
Change comment:
There is no comment for this version
Summary
-
Page properties (1 modified, 0 added, 0 removed)
-
Attachments (0 modified, 0 added, 2 removed)
Details
- Page properties
-
- Content
-
... ... @@ -15,8 +15,7 @@ 15 15 16 16 **Parametri di Configurazione** 17 17 18 -(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 19 -(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Parametri**|**Descrizione** 18 +|=(% style="width: 200px;" %)**Parametri**|**Descrizione** 20 20 |**Tipo di motore di sintesi vocale**|((( 21 21 Selezionare il tipo di motore tra i seguenti: 22 22 ... ... @@ -40,8 +40,7 @@ 40 40 41 41 **Messaggi Disponibili** 42 42 43 -(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 44 -(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Nome File**|**Messaggio** 42 +|=(% style="width: 200px;" %)**Nome File**|**Messaggio** 45 45 |**IntroMessage.wav**|Messaggio di accoglienza con istruzioni per l'inserimento del proprio codice. 46 46 |**CharNotRecognized.wav**|Comunica che il riconoscimento del carattere corrente non è andato a buon fine. 47 47 |**RecognizedCodeIs.wav**|Messaggio del tipo: //"Il codice riconosciuto è...".// ... ... @@ -150,24 +150,21 @@ 150 150 (% class="small" style="font-family:Courier New,Courier,monospace" %)Cancel=annulla 151 151 ))) 152 152 151 + 152 + 153 153 == SpeechToText (CSpeechToText) == 154 154 155 155 Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (//Google Speech API//). Le sue principali funzionalità sono le seguenti: 156 156 157 -* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento) .158 -* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV) .159 -* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto . Nella scheda //Salvataggio scelta// è possibile salvare l'accuratezza (definita anche //confidence//) in una //transfer property// o in un //calldata.//157 +* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento) 158 +* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV) 159 +* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto 160 160 * Abilitare il riconoscimento di espressione singola (//single utterance//). Nel caso ci si aspetti che l’utente pronunci una singola parola breve, ad esempio un //si// o un //no//, abilitare questo parametro migliora la capacità di riconoscimento del motore stesso. 161 161 * Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//. 162 162 * In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine. 163 -* Il testo può essere salvato in una //transfer property// o in un //calldata//, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata. 164 -* È stata aggiunta la scheda //Parametri aggiuntivi// per permettere la definizione dei parametri addizionali relativi al passaggio delle API Google dalla versione 1 alla 2. 165 - 163 +* Il testo può essere salvato in una Transfer Property o in un CallData, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata. 166 166 167 -(% class="box errormessage" %) 168 -((( 169 -**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi), dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// (vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi. In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe alcun valore. Quindi è raccomandabile di non impostare il parametro //Single Utterance// contemporaneamente al parametro //BargeIn// se il messaggio di invito dura più di due secondi. 170 -))) 165 +Il servizio è disponibile anche in //compatibility mode.// 171 171 172 172 173 173 === **Parametri di Configurazione** === ... ... @@ -178,7 +178,7 @@ 178 178 179 179 //Scheda Generale// 180 180 181 -[[image:WAV_skGenerale.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]176 +[[image:WAV_skGenerale.png||height="517" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 182 182 183 183 Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento. 184 184 ... ... @@ -185,25 +185,25 @@ 185 185 L'elenco dei campi visualizzati è il seguente: 186 186 187 187 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 188 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 183 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 189 189 |**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. 190 190 |**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2. 191 191 192 192 //Scheda Messaggi per TTS// 193 193 194 -[[image:STT_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]189 +[[image:STT_skMess.png||height="518" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 195 195 196 196 197 197 L'elenco dei campi visualizzati è il seguente: 198 198 199 199 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 200 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 195 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 201 201 |**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo. 202 202 |**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento. 203 203 204 204 //Scheda Messaggi per WAV// 205 205 206 -[[image:WAV_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]201 +[[image:WAV_skMess.png||height="518" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 207 207 208 208 Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti: 209 209 ... ... @@ -219,25 +219,26 @@ 219 219 220 220 //Scheda Motore TTS// 221 221 222 -[[image:STT_skMotoreTTS.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]217 +[[image:STT_skMotoreTTS.png||height="517" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 223 223 224 224 Impostare il campo seguente: 225 225 226 226 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 227 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 222 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 228 228 |**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR. 229 229 230 230 //Scheda Motore STT// 231 231 232 -[[image: attach:SpeechToText.png||alt="STT_skMotoreSST.png"height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"width="400"]]227 +[[image:STT_skMotoreSST.png||height="518" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 233 233 229 + 234 234 Impostare i campi seguenti: 235 235 236 236 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 237 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 233 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 238 238 |**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//. 239 239 |**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//. 240 -|**Termina riconoscimento su ricezione digits dopo**|Selezionareperabilitarel'interruzione della play del messaggodi invito a parlare,sia riprodotto da fileche tramite //TextToSpeech//. il tempo,espresso inmillisecondi,indica dopo quantodeve essere terminata la fase di riconoscimentoin seguitoalla pressione di un digit dda parte dell'utente.236 +|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante. 241 241 |**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento. 242 242 |**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione. 243 243 |**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative. ... ... @@ -246,15 +246,16 @@ 246 246 |**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70. 247 247 |**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//. 248 248 |**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//. 245 +| | 249 249 250 250 //Scheda Salvataggio scelta// 251 251 252 -[[image:WAV_skSalva.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]249 +[[image:WAV_skSalva.png||height="517" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 253 253 254 254 Impostare i campi seguenti: 255 255 256 256 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 257 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 254 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 258 258 |//Salva frase riconosciuta in//| 259 259 |(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 260 260 |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. ... ... @@ -261,6 +261,7 @@ 261 261 |//Salva confidence in//| 262 262 |**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza. 263 263 |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza. 261 +|(% style="text-align:right" %) | 264 264 265 265 ==== Port di Uscita ==== 266 266 ... ... @@ -269,7 +269,7 @@ 269 269 Le funzionalità dei //Port di Uscita// del blocchetto sono le seguenti : 270 270 271 271 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 272 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 270 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 273 273 |**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit. 274 274 |**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit. 275 275 |**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo. ... ... @@ -279,10 +279,10 @@ 279 279 Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi: 280 280 281 281 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 282 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 280 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 283 283 |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento. 284 284 |**_ASR_Source**|((( 285 -Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono: 283 +Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel Call Data definiti in configurazione. I valori possibili sono: 286 286 287 287 * **“”** (stringa vuota): nel caso in cui non sia riconosciuto l'audio e non sia rilevato alcun digit. 288 288 * **“DTMF”**: nel caso sia rilevato un digit che interrompe la fase di riconoscimento. La Transfer Property e il Call Data, eventualmente configurati come variabili di uscita, conterranno il digit ricevuto. ... ... @@ -289,6 +289,10 @@ 289 289 * **“STT”**: nel caso il motore di riconoscimento restituisca un qualsiasi valore. La Transfer Property e il Call Data, eventualmente configurati come variabili di uscita, conterranno il testo riconosciuto. 290 290 ))) 291 291 290 + 291 + 292 + 293 + 292 292 == VoiceMenu (CVoiceMenu) == 293 293 294 294 Presenta un menu di opzioni e, in base alla scelta del chiamante, effettuata tramite il riconoscimento vocale, attiva il servizio associato. Permette di configurare la sequenza di messaggi (file wav/avi, numeri, date, ecc.) da riprodurre all'utente per invitarlo a segnalare al sistema la sua scelta.
- STT_skGenerale.jpg
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -42.6 KB - Content
- SpeechToText.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -25.8 KB - Content