Last modified by administrator BDP on 2024/10/21 14:52

From version 56.1
edited by administrator BDP
on 2024/10/11 16:05
Change comment: Upload new image "STT_skMotoreTTS.jpg", version 1.1
To version 71.1
edited by administrator BDP
on 2024/10/21 14:51
Change comment: There is no comment for this version

Summary

Details

Page properties
Content
... ... @@ -3,11 +3,16 @@
3 3  [[image:acrobat-logo.png]] [[Scarica la pagina come pdf>>https://wiki.ifmgroup.it/bin/export/ifmhelpplatform/MessengerServiziBase/VoiceRecognition/?format=pdf||rel="noopener noreferrer" target="new"]]
4 4  )))
5 5  
6 -{{box cssClass="floatinginfobox" title="**Sommario**" width="300px"}}
7 -{{toc start=2 depth="3"/}}
6 +{{box cssClass="floatinginfobox" width="300px" title="**Sommario**"}}
7 +{{toc start="2" depth="3"/}}
8 8  {{/box}}
9 9  
10 +(% class="box errormessage" %)
11 +(((
12 +**ATTENZIONE**: i caratteri **cancelletto** (#) e **dollaro** ($) sono considerati caratteri speciali in quanto definiscono i calldata e le transfer property. Se è necessario inserire uno di questi caratteri, in un qualsiasi campo, occorre specificarli in coppia, ad esempio "~#~#" oppure "$$".
13 +)))
10 10  
15 +
11 11  == GetAlfaNumCode (CGetAlfaNumCode) ==
12 12  
13 13  Richiede al chiamante, tramite riconoscimento vocale, il codice di identificazione alfanumerico, eseguendo un riconoscimento vocale per ogni carattere del codice. In alternativa è in grado di riconoscere anche i [[toni DTMF>>doc:Glossario.WebHome]]. E' necessario che sul sistema sia stato installato un motore di riconoscimento vocale SAPI compatibile, con relative licenze, non fornito con il Messenger oppure un motore integrato (disponibile solamente utilizzando [[LightHouse>>doc:Glossario.WebHome]]).
... ... @@ -16,7 +16,7 @@
16 16  **Parametri di Configurazione**
17 17  
18 18  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
19 -(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Parametri**|**Descrizione**
24 +(% style="background-color:#f0f0f0" %)|=(% style="width: 200px;" %)**Parametri**|**Descrizione**
20 20  |**Tipo di motore di sintesi vocale**|(((
21 21  Selezionare il tipo di motore tra i seguenti:
22 22  
... ... @@ -26,22 +26,22 @@
26 26  |**Directory contenente i file wav/avi**|Indicare la directory, o selezionare dalla lista, tramite il pulsante //Browse//, in cui sono contenuti i messaggi che il sistema deve riprodurre al chiamante. La tabella sotto //Messaggi Disponibili //riporta l'elenco dei messaggi utilizzabili.
27 27  |**Motore**|Selezionare il motore di riconoscimento vocale da utilizzare dal sistema. **Nota**: il suo valore dipende dai motori installati nel sistema.
28 28  |**Abilita Beep di avviso ad inizio riconoscimento**|Indicare se deve essere emesso un breve segnale acustico prima di ogni fase di riconoscimento vocale.
29 -|**Termina riconoscimento su ricezione Digit**|Indicare se la fase di riconoscimento può essere interrotta dalla pressione di un tasto dal parte dell'utente. Se abilitato, i tasti numerici entrano a far parte del codice, mentre * e # concludono l'acquisizione dei caratteri (fine del codice).
34 +|**Termina riconoscimento su ricezione Digit**|Indicare se la fase di riconoscimento può essere interrotta dalla pressione di un tasto dal parte dell'utente. Se abilitato, i tasti numerici entrano a far parte del codice, mentre //asterisco// (*) e //cancelletto// (#) concludono l'acquisizione dei caratteri (fine del codice).
30 30  |**Tempo massimo di attesa (secondi)**|Se è stato selezionato un motore SAPI, specificare il tempo massimo, in secondi, di ogni fase di riconoscimento vocale. Valore predefinito: 20 secondi.
31 31  |**Massimo silenzio iniziale (secondi)**|Se è stato selezionato un motore integrato, specificare il periodo massimo di silenzio, in secondi, che il riconoscimento attende, prima che l'utente cominci a parlare, prima di uscire per fallimento. Valore predefinito: 20 secondi.
32 -|**Soglia di affidabilità (0-100)**|Indicare un valore tra 1 e 100 che indica il grado di sicurezza con cui un carattere deve essere riconosciuto per poter essere considerato valido. Valori alti indicano maggiore precisione e, quindi, maggior probabilità di nessun riconoscimento. Valore predefinito: 70.
37 +|**Soglia di affidabilità
38 +(0-100)**|Indicare un valore tra 1 e 100 che indica il grado di sicurezza con cui un carattere deve essere riconosciuto per poter essere considerato valido. Valori alti indicano maggiore precisione e, quindi, maggior probabilità di nessun riconoscimento. Valore predefinito: 70.
33 33  |**Numero massimo tentativi**|Numero massimo di tentativi in caso di codice non valido (nessuna digitazione).
34 34  |**Lunghezza massima dei codici**|Numero massimo di digit del codice utente. Il tasto //Assegna Valore// consente di salvare il valore indicato in una costante, oppure recuperarlo da una Transfer Property o un Call Data.
35 35  |**File Grammatica da utilizzare**|Nome del file contenente la [[grammatica>>||anchor="HGrammatica"]] da utilizzare. Il tasto //Assegna Valore// consente di salvare il valore indicato in una costante, oppure recuperarlo da una Transfer Property o un Call Data.
36 -|**Nome Transfer Property**|Selezionare la [[Transfer Property>>doc:ifmhelpplatform.MessengerConfigurator.TransferProperty.WebHome]] in cui viene salvati il codice acquisito.
42 +|**Nome Transfer Property**|Selezionare la [[Transfer Property>>doc:ifmhelpplatform.MessengerConfigurator.TransferProperty.WebHome]] in cui viene salvato il codice acquisito.
37 37  |**Servizio successivo se riconoscimento valido**|//Solamente configurando il Servizio tramite Messenger Configurator//. Selezionare dall'elenco il servizio da attivare nel caso di codice riconosciuto e confermato dall'utente.
38 38  |**Servizio successivo per mancato riconoscimento**|//Solamente configurando il Servizio tramite Messenger Configurator//. Selezionare dall'elenco il servizio da attivare nel caso di codice NON riconosciuto o NON confermato dall'utente.
39 -| |
40 40  
41 41  **Messaggi Disponibili**
42 42  
43 43  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
44 -(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Nome File**|**Messaggio**
49 +(% style="background-color:#f0f0f0" %)|=(% style="width: 200px;" %)**Nome File**|**Messaggio**
45 45  |**IntroMessage.wav**|Messaggio di accoglienza con istruzioni per l'inserimento del proprio codice.
46 46  |**CharNotRecognized.wav**|Comunica che il riconoscimento del carattere corrente non è andato a buon fine.
47 47  |**RecognizedCodeIs.wav**|Messaggio del tipo: //"Il codice riconosciuto è...".//
... ... @@ -178,7 +178,7 @@
178 178  
179 179  //Scheda Generale//
180 180  
181 -[[image:WAV_skGenerale.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
186 +[[image:STT_skGenerale.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
182 182  
183 183  Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento.
184 184  
... ... @@ -191,7 +191,7 @@
191 191  
192 192  //Scheda Messaggi per TTS//
193 193  
194 -[[image:STT_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
199 +[[image:STT_skMessaggiTTS.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
195 195  
196 196  
197 197  L'elenco dei campi visualizzati è il seguente:
... ... @@ -203,7 +203,7 @@
203 203  
204 204  //Scheda Messaggi per WAV//
205 205  
206 -[[image:WAV_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
211 +[[image:STT_skMessaggiWav.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
207 207  
208 208  Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti:
209 209  
... ... @@ -216,51 +216,75 @@
216 216  * Data/Ora attuale
217 217  * Data/Ora del file
218 218  * Ordinale
224 +\\
219 219  
220 220  //Scheda Motore TTS//
221 221  
222 -[[image:STT_skMotoreTTS.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
228 +[[image:STT_skMotoreTTS.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
223 223  
224 224  Impostare il campo seguente:
225 225  
226 226  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
227 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
233 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
228 228  |**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR.
229 229  
230 230  //Scheda Motore STT//
231 231  
232 -[[image:attach:SpeechToText.png||alt="STT_skMotoreSST.png" height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
238 +[[image:STT_skMotoreSTT.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
233 233  
234 234  Impostare i campi seguenti:
235 235  
236 236  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
237 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
243 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
238 238  |**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//.
239 239  |**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//.
240 -|**Termina riconoscimento su ricezione digits dopo**|Selezionare per abilitare l'interruzione della play del messaggo di invito a parlare, sia riprodotto da file che tramite //TextToSpeech//. il tempo, espresso in millisecondi, indica dopo quanto deve essere terminata la fase di riconoscimento in seguito alla pressione di un digit dda parte dell'utente.
246 +|**Termina riconoscimento su ricezione digit dopo**|Selezionare per abilitare l'interruzione della play del messaggo di invito a parlare, sia riprodotto da file che tramite //TextToSpeech//. il tempo, espresso in millisecondi, indica dopo quanto deve essere terminata la fase di riconoscimento in seguito alla pressione di un digit dda parte dell'utente.
241 241  |**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento.
242 242  |**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione.
243 243  |**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative.
244 244  |**Abilita riconoscimento espressione singola**|Selezionare si si vuole migliorare la modalità di riconoscimento di singoli comandi o parole, oppure di frasi brevi e concise, ad esempio //sì// o //no//.
245 -|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.
251 +|**Tempo massimo di attesa**|(((
252 +Indicare il tempo massimo, espresso in secondi, consentito al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.
253 +
254 +**NOTA BENE**: questo valore ha SEMPRE la precedenza sui parametri aggiuntivi (//SpeechEndTimeout// e //SpeechStartTimeout//), quindi la fase di riconoscimento termina dopo il numero di secondi impostato in tale parametro anche se l’utente sta ancora parlando. Questo valore deve essere sempre  superiore ai valori indicati nei parametri aggiuntivi.
255 +)))
246 246  |**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70.
247 247  |**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//.
248 -|**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.
258 +|**Valore Parametri**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.
249 249  
260 +//Scheda Parametri aggiuntivi//
261 +
262 +In questa scheda è possibile indicare alcuni parametri aggiuntivi relativi all'aggiornamento di versione delle API Google di riconoscimento vocale (da V1 a V2).
263 +
264 +[[image:STT_skParAgg.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
265 +
266 +I parametri aggiuntivi predefiniti sono i seguenti:
267 +
268 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
269 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
270 +|**Model**|Indicare il modello di apprendimento automatico interessato. Il modello consigliato è //telephony// (modello più accurato per trascrivere l'audio telefonico).
271 +|**SpeechEndTimeout**|Indicare il //timeout//, espresso in secondi, che interrompe la comunicazione con l'utente se l'audio vocale non inizia entro il periodo stabilito, cioè se la pausa iniziale supera la durata del timeout.
272 +|**SpeechStartTimeout**|Indicare il //timeout//, espresso in secondi, che interrompe la comunicazione con l'utente se l'audio vocale non riprende entro il periodo stabilito, cioè se c'è un pausa tra due frase che supera la durata del timeout.
273 +|**StopAsFirstIsFinal**|Indicare se dopo il primo riconoscimento parziale l’engine si deve fermare dal riconoscimento (//true//) o continuare fino al timeout impostato (default: //false//). Questo parametro, se presente, sovrascrive il valore impostato nella opzione //Abilita riconoscimento espressione singola// presente sulla vecchia scheda.
274 +|**EnableAutomaticPunctuation**|Se si abilita questa impostazione (//true//), l'applicazione deduce automaticamente la presenza di punti, virgole e punti interrogativi nella trascrizione dei dati audio e li aggiunge alla trascrizione.
275 +|**ProfanityFilter**|Se si abilita questa impostazione (//true//), l'engine tenterà di rilevare le parole volgari e, nel caso, restituire solo la prima lettera seguita da asterischi nella trascrizione dei dati audio (ad esempio, c~*~**). Se questo campo viene impostato //false //o non viene configurato, l'engine non effettuerà il filtraggio dell'audio.
276 +
277 +==== ====
278 +
250 250  //Scheda Salvataggio scelta//
251 251  
252 -[[image:WAV_skSalva.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
281 +[[image:WAV_skSalva.png||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
253 253  
254 254  Impostare i campi seguenti:
255 255  
256 256  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
257 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
286 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
258 258  |//Salva frase riconosciuta in//|
259 259  |(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
260 260  |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
261 261  |//Salva confidence in//|
262 -|**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza.
263 -|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza.
291 +|**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza (confidence).
292 +|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza (confidence).
264 264  
265 265  ==== Port di Uscita ====
266 266  
... ... @@ -269,7 +269,7 @@
269 269  Le funzionalità dei //Port di Uscita// del blocchetto sono le seguenti :
270 270  
271 271  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
272 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
301 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
273 273  |**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit.
274 274  |**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit.
275 275  |**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo.
... ... @@ -279,7 +279,7 @@
279 279  Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi:
280 280  
281 281  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
282 -(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
311 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
283 283  |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento.
284 284  |**_ASR_Source**|(((
285 285  Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono:
STT_skSalvataggio.jpg
Size
... ... @@ -1,1 +1,1 @@
1 -37.7 KB
1 +53.3 KB
Content
STT_skMessaggiTTS.jpg
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +43.6 KB
Content
STT_skMessaggiWav.jpg
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +51.7 KB
Content
STT_skParAgg.jpg
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +58.9 KB
Content