Changes for page 10 - Riconoscimento vocale
Last modified by administrator BDP on 2024/10/21 14:52
From version 50.9
edited by administrator BDP
on 2021/02/25 12:36
on 2021/02/25 12:36
Change comment:
There is no comment for this version
To version 64.3
edited by administrator BDP
on 2024/10/14 11:24
on 2024/10/14 11:24
Change comment:
There is no comment for this version
Summary
-
Page properties (1 modified, 0 added, 0 removed)
-
Attachments (2 modified, 7 added, 0 removed)
Details
- Page properties
-
- Content
-
... ... @@ -3,8 +3,8 @@ 3 3 [[image:acrobat-logo.png]] [[Scarica la pagina come pdf>>https://wiki.ifmgroup.it/bin/export/ifmhelpplatform/MessengerServiziBase/VoiceRecognition/?format=pdf||rel="noopener noreferrer" target="new"]] 4 4 ))) 5 5 6 -{{box cssClass="floatinginfobox" title="**Sommario**" width="300px"}}7 -{{toc start=2 depth="3"/}} 6 +{{box cssClass="floatinginfobox" width="300px" title="**Sommario**"}} 7 +{{toc start="2" depth="3"/}} 8 8 {{/box}} 9 9 10 10 ... ... @@ -15,7 +15,8 @@ 15 15 16 16 **Parametri di Configurazione** 17 17 18 -|=(% style="width: 200px;" %)**Parametri**|**Descrizione** 18 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 19 +(% style="background-color:#f0f0f0" %)|=(% style="width: 200px;" %)**Parametri**|**Descrizione** 19 19 |**Tipo di motore di sintesi vocale**|((( 20 20 Selezionare il tipo di motore tra i seguenti: 21 21 ... ... @@ -39,7 +39,8 @@ 39 39 40 40 **Messaggi Disponibili** 41 41 42 -|=(% style="width: 200px;" %)**Nome File**|**Messaggio** 43 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 44 +(% style="background-color:#f0f0f0" %)|=(% style="width: 200px;" %)**Nome File**|**Messaggio** 43 43 |**IntroMessage.wav**|Messaggio di accoglienza con istruzioni per l'inserimento del proprio codice. 44 44 |**CharNotRecognized.wav**|Comunica che il riconoscimento del carattere corrente non è andato a buon fine. 45 45 |**RecognizedCodeIs.wav**|Messaggio del tipo: //"Il codice riconosciuto è...".// ... ... @@ -148,8 +148,6 @@ 148 148 (% class="small" style="font-family:Courier New,Courier,monospace" %)Cancel=annulla 149 149 ))) 150 150 151 - 152 - 153 153 == SpeechToText (CSpeechToText) == 154 154 155 155 Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (//Google Speech API//). Le sue principali funzionalità sono le seguenti: ... ... @@ -161,17 +161,15 @@ 161 161 * Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//. 162 162 * In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine. 163 163 * Il testo può essere salvato in una //transfer property// o in un //calldata//, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata. 164 +* È stata aggiunta la scheda //Parametri aggiuntivi// per permettere la definizione dei parametri addizionali relativi al passaggio delle API Google dalla versione 1 alla 2. 165 + 164 164 165 - 166 166 (% class="box errormessage" %) 167 167 ((( 168 -**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi), dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// (vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi. In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe alcun valore. Quindi è raccomandabile di non impostare il parametro //Single Utterance// contemporaneamente al parametro //B urgeIn// se il messaggio di invito dura più di due secondi.169 +**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi), dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// (vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi. In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe alcun valore. Quindi è raccomandabile di non impostare il parametro //Single Utterance// contemporaneamente al parametro //BargeIn// se il messaggio di invito dura più di due secondi. 169 169 ))) 170 170 171 171 172 -Il servizio è disponibile anche in //compatibility mode//. 173 - 174 - 175 175 === **Parametri di Configurazione** === 176 176 177 177 ==== **Proprietà** ==== ... ... @@ -180,7 +180,7 @@ 180 180 181 181 //Scheda Generale// 182 182 183 -[[image: WAV_skGenerale.png||height="517"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"width="400"]]181 +[[image:STT_skGenerale.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 184 184 185 185 Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento. 186 186 ... ... @@ -187,25 +187,25 @@ 187 187 L'elenco dei campi visualizzati è il seguente: 188 188 189 189 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 190 -(% style="background-color:#f0f0f0 ;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**188 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 191 191 |**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. 192 192 |**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2. 193 193 194 194 //Scheda Messaggi per TTS// 195 195 196 -[[image:STT_skMess.p ng||height="518"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"width="400"]]194 +[[image:STT_skMessaggiTTS.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 197 197 198 198 199 199 L'elenco dei campi visualizzati è il seguente: 200 200 201 201 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 202 -(% style="background-color:#f0f0f0 ;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**200 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 203 203 |**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo. 204 204 |**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento. 205 205 206 206 //Scheda Messaggi per WAV// 207 207 208 -[[image: WAV_skMess.png||height="518"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"width="400"]]206 +[[image:STT_skMessaggiWav.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 209 209 210 210 Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti: 211 211 ... ... @@ -218,37 +218,37 @@ 218 218 * Data/Ora attuale 219 219 * Data/Ora del file 220 220 * Ordinale 219 +\\ 221 221 222 222 //Scheda Motore TTS// 223 223 224 -[[image:STT_skMotoreTTS.p ng||height="517"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"width="400"]]223 +[[image:STT_skMotoreTTS.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 225 225 226 226 Impostare il campo seguente: 227 227 228 228 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 229 -(% style="background-color:#f0f0f0 ;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**228 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 230 230 |**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR. 231 231 232 232 //Scheda Motore STT// 233 233 234 -[[image:STT_skMotoreS ST.png||height="518"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"width="400"]]233 +[[image:STT_skMotoreSTT.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 235 235 236 - 237 237 Impostare i campi seguenti: 238 238 239 239 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 240 -(% style="background-color:#f0f0f0 ;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**238 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 241 241 |**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//. 242 242 |**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//. 243 -|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento puòessere terminatodalla pressione di un digit da parte delchiamante.241 +|**Termina riconoscimento su ricezione digits dopo**|Selezionare per abilitare l'interruzione della play del messaggo di invito a parlare, sia riprodotto da file che tramite //TextToSpeech//. il tempo, espresso in millisecondi, indica dopo quanto deve essere terminata la fase di riconoscimento in seguito alla pressione di un digit dda parte dell'utente. 244 244 |**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento. 245 245 |**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione. 246 246 |**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative. 247 247 |**Abilita riconoscimento espressione singola**|Selezionare si si vuole migliorare la modalità di riconoscimento di singoli comandi o parole, oppure di frasi brevi e concise, ad esempio //sì// o //no//. 248 -|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.246 +|**Tempo massimo di attesa**|Indicare il tempo massimo, espresso in secondi, consentito al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi. 249 249 |**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70. 250 250 |**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//. 251 -|**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.249 +|**Valore Parametri**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//. 252 252 253 253 //Scheda Salvataggio scelta// 254 254 ... ... @@ -257,7 +257,7 @@ 257 257 Impostare i campi seguenti: 258 258 259 259 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 260 -(% style="background-color:#f0f0f0 ;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**258 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 261 261 |//Salva frase riconosciuta in//| 262 262 |(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 263 263 |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. ... ... @@ -272,7 +272,7 @@ 272 272 Le funzionalità dei //Port di Uscita// del blocchetto sono le seguenti : 273 273 274 274 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 275 -(% style="background-color:#f0f0f0 ;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**273 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 276 276 |**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit. 277 277 |**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit. 278 278 |**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo. ... ... @@ -282,7 +282,7 @@ 282 282 Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi: 283 283 284 284 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 285 -(% style="background-color:#f0f0f0 ;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**283 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 286 286 |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento. 287 287 |**_ASR_Source**|((( 288 288 Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono:
- STT_skMessaggi.jpg
-
- Size
-
... ... @@ -1,1 +1,1 @@ 1 - 45.2KB1 +51.6 KB - Content
- STT_skSalvataggio.jpg
-
- Size
-
... ... @@ -1,1 +1,1 @@ 1 -3 7.7KB1 +53.3 KB - Content
- STT_skGenerale.jpg
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.administrator - Size
-
... ... @@ -1,0 +1,1 @@ 1 +42.6 KB - Content
- STT_skMessaggiTTS.jpg
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.administrator - Size
-
... ... @@ -1,0 +1,1 @@ 1 +43.6 KB - Content
- STT_skMessaggiWav.jpg
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.administrator - Size
-
... ... @@ -1,0 +1,1 @@ 1 +51.7 KB - Content
- STT_skMotoreSTT.jpg
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.administrator - Size
-
... ... @@ -1,0 +1,1 @@ 1 +75.6 KB - Content
- STT_skMotoreTTS.jpg
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.administrator - Size
-
... ... @@ -1,0 +1,1 @@ 1 +35.7 KB - Content
- STT_skParAgg.jpg
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.administrator - Size
-
... ... @@ -1,0 +1,1 @@ 1 +58.9 KB - Content
- SpeechToText.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.administrator - Size
-
... ... @@ -1,0 +1,1 @@ 1 +25.8 KB - Content