Changes for page 10 - Riconoscimento vocale
Last modified by administrator BDP on 2024/10/21 14:52
From version 52.1
edited by administrator BDP
on 2023/12/11 16:32
on 2023/12/11 16:32
Change comment:
There is no comment for this version
To version 50.5
edited by administrator BDP
on 2021/02/23 16:12
on 2021/02/23 16:12
Change comment:
There is no comment for this version
Summary
-
Page properties (1 modified, 0 added, 0 removed)
-
Attachments (0 modified, 0 added, 1 removed)
Details
- Page properties
-
- Content
-
... ... @@ -15,8 +15,7 @@ 15 15 16 16 **Parametri di Configurazione** 17 17 18 -(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 19 -(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Parametri**|**Descrizione** 18 +|=(% style="width: 200px;" %)**Parametri**|**Descrizione** 20 20 |**Tipo di motore di sintesi vocale**|((( 21 21 Selezionare il tipo di motore tra i seguenti: 22 22 ... ... @@ -40,8 +40,7 @@ 40 40 41 41 **Messaggi Disponibili** 42 42 43 -(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 44 -(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Nome File**|**Messaggio** 42 +|=(% style="width: 200px;" %)**Nome File**|**Messaggio** 45 45 |**IntroMessage.wav**|Messaggio di accoglienza con istruzioni per l'inserimento del proprio codice. 46 46 |**CharNotRecognized.wav**|Comunica che il riconoscimento del carattere corrente non è andato a buon fine. 47 47 |**RecognizedCodeIs.wav**|Messaggio del tipo: //"Il codice riconosciuto è...".// ... ... @@ -150,27 +150,23 @@ 150 150 (% class="small" style="font-family:Courier New,Courier,monospace" %)Cancel=annulla 151 151 ))) 152 152 151 + 152 + 153 153 == SpeechToText (CSpeechToText) == 154 154 155 155 Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (//Google Speech API//). Le sue principali funzionalità sono le seguenti: 156 156 157 -* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento) .158 -* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV) .159 -* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto . Nella scheda //Salvataggio scelta// è possibile salvare l'accuratezza (definita anche //confidence//) in una //transfer property// o in un //calldata.//157 +* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento) 158 +* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV) 159 +* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto 160 160 * Abilitare il riconoscimento di espressione singola (//single utterance//). Nel caso ci si aspetti che l’utente pronunci una singola parola breve, ad esempio un //si// o un //no//, abilitare questo parametro migliora la capacità di riconoscimento del motore stesso. 161 161 * Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//. 162 162 * In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine. 163 -* Il testo può essere salvato in una //transferproperty//o in un//calldata//, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata.163 +* Il testo può essere salvato in una Transfer Property o in un CallData, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata. 164 164 165 -(% class="box errormessage" %) 166 -((( 167 -**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi), dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// (vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi. In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe alcun valore. Quindi è raccomandabile di non impostare il parametro //Single Utterance// contemporaneamente al parametro //BargeIn// se il messaggio di invito dura più di due secondi. 168 -))) 165 +Il servizio è disponibile anche in //compatibility mode.// 169 169 170 170 171 -Il servizio è disponibile anche in //compatibility mode//. 172 - 173 - 174 174 === **Parametri di Configurazione** === 175 175 176 176 ==== **Proprietà** ==== ... ... @@ -179,33 +179,35 @@ 179 179 180 180 //Scheda Generale// 181 181 182 -[[image:WAV_skGenerale.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]176 +[[image:WAV_skGenerale.png||height="517" width="400"]] 183 183 178 + 184 184 Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento. 185 185 186 186 L'elenco dei campi visualizzati è il seguente: 187 187 188 188 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 189 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 184 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 190 190 |**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. 191 191 |**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2. 192 192 193 193 //Scheda Messaggi per TTS// 194 194 195 -[[image:STT_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]190 +[[image:STT_skMess.png||height="518" width="400"]] 196 196 197 197 198 198 L'elenco dei campi visualizzati è il seguente: 199 199 200 200 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 201 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 196 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 202 202 |**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo. 203 203 |**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento. 204 204 205 205 //Scheda Messaggi per WAV// 206 206 207 -[[image:WAV_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]202 +//[[image:WAV_skMess.png||height="518" width="400"]]// 208 208 204 + 209 209 Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti: 210 210 211 211 * File ... ... @@ -218,27 +218,30 @@ 218 218 * Data/Ora del file 219 219 * Ordinale 220 220 217 + 221 221 //Scheda Motore TTS// 222 222 223 -[[image:STT_skMotoreTTS.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]220 +[[image:STT_skMotoreTTS.png||height="517" width="400"]] 224 224 222 + 225 225 Impostare il campo seguente: 226 226 227 227 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 228 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 226 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 229 229 |**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR. 230 230 231 231 //Scheda Motore STT// 232 232 233 -[[image: attach:SpeechToText.png||alt="STT_skMotoreSST.png"height="518"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]231 +[[image:STT_skMotoreSST.png||height="518" width="400"]] 234 234 233 + 235 235 Impostare i campi seguenti: 236 236 237 237 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 238 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 237 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 239 239 |**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//. 240 240 |**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//. 241 -|**Termina riconoscimento su ricezione digits dopo**|Selezionareperabilitarel'interruzione della play del messaggodi invito a parlare,sia riprodotto da fileche tramite //TextToSpeech//. il tempo,espresso inmillisecondi,indica dopo quantodeve essere terminata la fase di riconoscimentoin seguitoalla pressione di un digit dda parte dell'utente.240 +|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante. 242 242 |**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento. 243 243 |**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione. 244 244 |**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative. ... ... @@ -247,15 +247,19 @@ 247 247 |**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70. 248 248 |**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//. 249 249 |**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//. 249 +| | 250 250 251 + 252 + 251 251 //Scheda Salvataggio scelta// 252 252 253 -[[image:WAV_skSalva.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]255 +[[image:WAV_skSalva.png||height="517" width="400"]] 254 254 257 + 255 255 Impostare i campi seguenti: 256 256 257 257 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 258 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 261 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 259 259 |//Salva frase riconosciuta in//| 260 260 |(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 261 261 |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. ... ... @@ -262,6 +262,7 @@ 262 262 |//Salva confidence in//| 263 263 |**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza. 264 264 |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza. 268 +|(% style="text-align:right" %) | 265 265 266 266 ==== Port di Uscita ==== 267 267 ... ... @@ -270,7 +270,7 @@ 270 270 Le funzionalità dei //Port di Uscita// del blocchetto sono le seguenti : 271 271 272 272 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 273 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 277 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 274 274 |**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit. 275 275 |**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit. 276 276 |**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo. ... ... @@ -280,10 +280,10 @@ 280 280 Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi: 281 281 282 282 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 283 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 287 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 284 284 |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento. 285 285 |**_ASR_Source**|((( 286 -Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono: 290 +Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel Call Data definiti in configurazione. I valori possibili sono: 287 287 288 288 * **“”** (stringa vuota): nel caso in cui non sia riconosciuto l'audio e non sia rilevato alcun digit. 289 289 * **“DTMF”**: nel caso sia rilevato un digit che interrompe la fase di riconoscimento. La Transfer Property e il Call Data, eventualmente configurati come variabili di uscita, conterranno il digit ricevuto.
- SpeechToText.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -25.8 KB - Content