Last modified by administrator BDP on 2024/10/21 14:52

From version 50.9
edited by administrator BDP
on 2021/02/25 12:36
Change comment: There is no comment for this version
To version 68.1
edited by administrator BDP
on 2024/10/14 15:22
Change comment: There is no comment for this version

Summary

Details

Page properties
Content
... ... @@ -3,8 +3,8 @@
3 3  [[image:acrobat-logo.png]] [[Scarica la pagina come pdf>>https://wiki.ifmgroup.it/bin/export/ifmhelpplatform/MessengerServiziBase/VoiceRecognition/?format=pdf||rel="noopener noreferrer" target="new"]]
4 4  )))
5 5  
6 -{{box cssClass="floatinginfobox" title="**Sommario**" width="300px"}}
7 -{{toc start=2 depth="3"/}}
6 +{{box cssClass="floatinginfobox" width="300px" title="**Sommario**"}}
7 +{{toc start="2" depth="3"/}}
8 8  {{/box}}
9 9  
10 10  
... ... @@ -15,7 +15,8 @@
15 15  
16 16  **Parametri di Configurazione**
17 17  
18 -|=(% style="width: 200px;" %)**Parametri**|**Descrizione**
18 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
19 +(% style="background-color:#f0f0f0" %)|=(% style="width: 200px;" %)**Parametri**|**Descrizione**
19 19  |**Tipo di motore di sintesi vocale**|(((
20 20  Selezionare il tipo di motore tra i seguenti:
21 21  
... ... @@ -39,7 +39,8 @@
39 39  
40 40  **Messaggi Disponibili**
41 41  
42 -|=(% style="width: 200px;" %)**Nome File**|**Messaggio**
43 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
44 +(% style="background-color:#f0f0f0" %)|=(% style="width: 200px;" %)**Nome File**|**Messaggio**
43 43  |**IntroMessage.wav**|Messaggio di accoglienza con istruzioni per l'inserimento del proprio codice.
44 44  |**CharNotRecognized.wav**|Comunica che il riconoscimento del carattere corrente non è andato a buon fine.
45 45  |**RecognizedCodeIs.wav**|Messaggio del tipo: //"Il codice riconosciuto è...".//
... ... @@ -148,8 +148,6 @@
148 148  (% class="small" style="font-family:Courier New,Courier,monospace" %)Cancel=annulla
149 149  )))
150 150  
151 -
152 -
153 153  == SpeechToText (CSpeechToText) ==
154 154  
155 155  Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (//Google Speech API//). Le sue principali funzionalità sono le seguenti:
... ... @@ -161,17 +161,15 @@
161 161  * Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//.
162 162  * In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine.
163 163  * Il testo può essere salvato in una //transfer property// o in un //calldata//, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata.
164 +* È stata aggiunta la scheda //Parametri aggiuntivi// per permettere la definizione dei parametri addizionali relativi al passaggio delle API Google dalla versione 1 alla 2.
165 +
164 164  
165 -
166 166  (% class="box errormessage" %)
167 167  (((
168 -**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi), dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// (vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi. In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe alcun valore. Quindi è raccomandabile di non impostare il parametro //Single Utterance// contemporaneamente al parametro //BurgeIn// se il messaggio di invito dura più di due secondi.
169 +**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi), dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// (vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi. In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe alcun valore. Quindi è raccomandabile di non impostare il parametro //Single Utterance// contemporaneamente al parametro //BargeIn// se il messaggio di invito dura più di due secondi.
169 169  )))
170 170  
171 171  
172 -Il servizio è disponibile anche in //compatibility mode//.
173 -
174 -
175 175  === **Parametri di Configurazione** ===
176 176  
177 177  ==== **Proprietà** ====
... ... @@ -180,7 +180,7 @@
180 180  
181 181  //Scheda Generale//
182 182  
183 -[[image:WAV_skGenerale.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
181 +[[image:STT_skGenerale.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
184 184  
185 185  Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento.
186 186  
... ... @@ -187,25 +187,25 @@
187 187  L'elenco dei campi visualizzati è il seguente:
188 188  
189 189  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
190 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
188 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
191 191  |**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore.
192 192  |**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2.
193 193  
194 194  //Scheda Messaggi per TTS//
195 195  
196 -[[image:STT_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
194 +[[image:STT_skMessaggiTTS.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
197 197  
198 198  
199 199  L'elenco dei campi visualizzati è il seguente:
200 200  
201 201  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
202 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
200 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
203 203  |**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo.
204 204  |**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento.
205 205  
206 206  //Scheda Messaggi per WAV//
207 207  
208 -[[image:WAV_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
206 +[[image:STT_skMessaggiWav.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
209 209  
210 210  Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti:
211 211  
... ... @@ -218,38 +218,61 @@
218 218  * Data/Ora attuale
219 219  * Data/Ora del file
220 220  * Ordinale
219 +\\
221 221  
222 222  //Scheda Motore TTS//
223 223  
224 -[[image:STT_skMotoreTTS.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
223 +[[image:STT_skMotoreTTS.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
225 225  
226 226  Impostare il campo seguente:
227 227  
228 228  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
229 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
228 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
230 230  |**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR.
231 231  
232 232  //Scheda Motore STT//
233 233  
234 -[[image:STT_skMotoreSST.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
233 +[[image:STT_skMotoreSTT.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
235 235  
236 -
237 237  Impostare i campi seguenti:
238 238  
239 239  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
240 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
238 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
241 241  |**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//.
242 242  |**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//.
243 -|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante.
241 +|**Termina riconoscimento su ricezione digit dopo**|Selezionare per abilitare l'interruzione della play del messaggo di invito a parlare, sia riprodotto da file che tramite //TextToSpeech//. il tempo, espresso in millisecondi, indica dopo quanto deve essere terminata la fase di riconoscimento in seguito alla pressione di un digit dda parte dell'utente.
244 244  |**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento.
245 245  |**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione.
246 246  |**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative.
247 247  |**Abilita riconoscimento espressione singola**|Selezionare si si vuole migliorare la modalità di riconoscimento di singoli comandi o parole, oppure di frasi brevi e concise, ad esempio //sì// o //no//.
248 -|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.
246 +|**Tempo massimo di attesa**|(((
247 +Indicare il tempo massimo, espresso in secondi, consentito al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.
248 +
249 +**NOTA BENE**: questo valore ha SEMPRE la precedenza sui parametri aggiuntivi (//SpeechEndTimeout// e //SpeechStartTimeout//), quindi la fase di riconoscimento termina dopo il numero di secondi impostato in tale parametro anche se l’utente sta ancora parlando. Questo valore deve essere sempre  superiore ai valori indicati nei parametri aggiuntivi.
250 +)))
249 249  |**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70.
250 250  |**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//.
251 -|**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.
253 +|**Valore Parametri**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.
252 252  
255 +//Scheda Parametri aggiuntivi//
256 +
257 +In questa scheda è possibile indicare alcuni parametri aggiuntivi relativi all'aggiornamento di versione delle API Google di riconoscimento vocale (da V1 a V2).
258 +
259 +[[image:STT_skParAgg.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
260 +
261 +I parametri aggiuntivi predefiniti sono i seguenti:
262 +
263 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
264 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
265 +|**Model**|Indicare il modello di apprendimento automatico interessato. Il modello consigliato è //telephony// (modello più accurato per trascrivere l'audio telefonico).
266 +|**SpeechEndTimeout**|Indicare il //timeout//, espresso in secondi, che interrompe la comunicazione con l'utente se l'audio vocale non inizia entro il periodo stabilito, cioè se la pausa iniziale supera la durata del timeout.
267 +|**SpeechStartTimeout**|Indicare il //timeout//, espresso in secondi, che interrompe la comunicazione con l'utente se l'audio vocale non riprende entro il periodo stabilito, cioè se c'è un pausa tra due frase che supera la durata del timeout.
268 +|**StopAsFirstIsFinal**|Indicare se dopo il primo riconoscimento parziale l’engine si deve fermare dal riconoscimento (//true//) o continuare fino al timeout impostato (default: //false//). Questo parametro, se presente, sovrascrive il valore impostato nella opzione //Abilita riconoscimento espressione singola// presente sulla vecchia scheda.
269 +|**EnableAutomaticPunctuation**|Se si abilita questa impostazione (//true//), l'applicazione deduce automaticamente la presenza di punti, virgole e punti interrogativi nella trascrizione dei dati audio e li aggiunge alla trascrizione.
270 +|**ProfanityFilter**|Se si abilita questa impostazione (//true//), l'engine tenterà di rilevare le parole volgari e, nel caso, restituire solo la prima lettera seguita da asterischi nella trascrizione dei dati audio (ad esempio, c~*~**). Se questo campo viene impostato //false //o non viene configurato, l'engine non effettuerà il filtraggio dell'audio.
271 +
272 +==== ====
273 +
253 253  //Scheda Salvataggio scelta//
254 254  
255 255  [[image:WAV_skSalva.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
... ... @@ -257,13 +257,13 @@
257 257  Impostare i campi seguenti:
258 258  
259 259  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
260 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
281 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
261 261  |//Salva frase riconosciuta in//|
262 262  |(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
263 263  |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
264 264  |//Salva confidence in//|
265 -|**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza.
266 -|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza.
286 +|**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza (confidence).
287 +|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza (confidence).
267 267  
268 268  ==== Port di Uscita ====
269 269  
... ... @@ -272,7 +272,7 @@
272 272  Le funzionalità dei //Port di Uscita// del blocchetto sono le seguenti :
273 273  
274 274  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
275 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
296 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
276 276  |**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit.
277 277  |**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit.
278 278  |**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo.
... ... @@ -282,7 +282,7 @@
282 282  Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi:
283 283  
284 284  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
285 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
306 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
286 286  |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento.
287 287  |**_ASR_Source**|(((
288 288  Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono:
STT_skMessaggi.jpg
Size
... ... @@ -1,1 +1,1 @@
1 -45.2 KB
1 +51.6 KB
Content
STT_skSalvataggio.jpg
Size
... ... @@ -1,1 +1,1 @@
1 -37.7 KB
1 +53.3 KB
Content
STT_skGenerale.jpg
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +42.6 KB
Content
STT_skMessaggiTTS.jpg
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +43.6 KB
Content
STT_skMessaggiWav.jpg
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +51.7 KB
Content
STT_skMotoreSTT.jpg
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +75.6 KB
Content
STT_skMotoreTTS.jpg
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +35.7 KB
Content
STT_skParAgg.jpg
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +58.9 KB
Content
SpeechToText.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +25.8 KB
Content