Last modified by administrator BDP on 2024/10/21 14:52

From version 50.5
edited by administrator BDP
on 2021/02/23 16:12
Change comment: There is no comment for this version
To version 53.1
edited by administrator BDP
on 2024/10/11 15:51
Change comment: Upload new image "STT_skGenerale.jpg", version 1.1

Summary

Details

Page properties
Content
... ... @@ -15,7 +15,8 @@
15 15  
16 16  **Parametri di Configurazione**
17 17  
18 -|=(% style="width: 200px;" %)**Parametri**|**Descrizione**
18 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
19 +(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Parametri**|**Descrizione**
19 19  |**Tipo di motore di sintesi vocale**|(((
20 20  Selezionare il tipo di motore tra i seguenti:
21 21  
... ... @@ -39,7 +39,8 @@
39 39  
40 40  **Messaggi Disponibili**
41 41  
42 -|=(% style="width: 200px;" %)**Nome File**|**Messaggio**
43 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
44 +(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Nome File**|**Messaggio**
43 43  |**IntroMessage.wav**|Messaggio di accoglienza con istruzioni per l'inserimento del proprio codice.
44 44  |**CharNotRecognized.wav**|Comunica che il riconoscimento del carattere corrente non è andato a buon fine.
45 45  |**RecognizedCodeIs.wav**|Messaggio del tipo: //"Il codice riconosciuto è...".//
... ... @@ -148,21 +148,24 @@
148 148  (% class="small" style="font-family:Courier New,Courier,monospace" %)Cancel=annulla
149 149  )))
150 150  
151 -
152 -
153 153  == SpeechToText (CSpeechToText) ==
154 154  
155 155  Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (//Google Speech API//). Le sue principali funzionalità sono le seguenti:
156 156  
157 -* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento)
158 -* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV)
159 -* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto
157 +* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento).
158 +* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV).
159 +* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto. Nella scheda //Salvataggio scelta// è possibile salvare l'accuratezza (definita anche //confidence//) in una //transfer property// o in un //calldata.//
160 160  * Abilitare il riconoscimento di espressione singola (//single utterance//). Nel caso ci si aspetti che l’utente pronunci una singola parola breve, ad esempio un //si// o un //no//, abilitare questo parametro migliora la capacità di riconoscimento del motore stesso.
161 161  * Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//.
162 162  * In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine.
163 -* Il testo può essere salvato in una Transfer Property o in un CallData, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata.
163 +* Il testo può essere salvato in una //transfer property// o in un //calldata//, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata.
164 +* È stata aggiunta la scheda //Parametri aggiuntivi// per permettere la definizione dei parametri addizionali relativi al passaggio delle API Google dalla versione 1 alla 2.
165 +
164 164  
165 -Il servizio è disponibile anche in //compatibility mode.//
167 +(% class="box errormessage" %)
168 +(((
169 +**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi), dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// (vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi. In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe alcun valore. Quindi è raccomandabile di non impostare il parametro //Single Utterance// contemporaneamente al parametro //BargeIn// se il messaggio di invito dura più di due secondi.
170 +)))
166 166  
167 167  
168 168  === **Parametri di Configurazione** ===
... ... @@ -173,35 +173,33 @@
173 173  
174 174  //Scheda Generale//
175 175  
176 -[[image:WAV_skGenerale.png||height="517" width="400"]]
181 +[[image:WAV_skGenerale.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
177 177  
178 -
179 179  Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento.
180 180  
181 181  L'elenco dei campi visualizzati è il seguente:
182 182  
183 183  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
184 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
188 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
185 185  |**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore.
186 186  |**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2.
187 187  
188 188  //Scheda Messaggi per TTS//
189 189  
190 -[[image:STT_skMess.png||height="518" width="400"]]
194 +[[image:STT_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
191 191  
192 192  
193 193  L'elenco dei campi visualizzati è il seguente:
194 194  
195 195  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
196 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
200 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
197 197  |**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo.
198 198  |**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento.
199 199  
200 200  //Scheda Messaggi per WAV//
201 201  
202 -//[[image:WAV_skMess.png||height="518" width="400"]]//
206 +[[image:WAV_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
203 203  
204 -
205 205  Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti:
206 206  
207 207  * File
... ... @@ -214,30 +214,27 @@
214 214  * Data/Ora del file
215 215  * Ordinale
216 216  
217 -
218 218  //Scheda Motore TTS//
219 219  
220 -[[image:STT_skMotoreTTS.png||height="517" width="400"]]
222 +[[image:STT_skMotoreTTS.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
221 221  
222 -
223 223  Impostare il campo seguente:
224 224  
225 225  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
226 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
227 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
227 227  |**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR.
228 228  
229 229  //Scheda Motore STT//
230 230  
231 -[[image:STT_skMotoreSST.png||height="518" width="400"]]
232 +[[image:attach:SpeechToText.png||alt="STT_skMotoreSST.png" height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
232 232  
233 -
234 234  Impostare i campi seguenti:
235 235  
236 236  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
237 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
237 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
238 238  |**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//.
239 239  |**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//.
240 -|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante.
240 +|**Termina riconoscimento su ricezione digits dopo**|Selezionare per abilitare l'interruzione della play del messaggo di invito a parlare, sia riprodotto da file che tramite //TextToSpeech//. il tempo, espresso in millisecondi, indica dopo quanto deve essere terminata la fase di riconoscimento in seguito alla pressione di un digit dda parte dell'utente.
241 241  |**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento.
242 242  |**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione.
243 243  |**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative.
... ... @@ -246,19 +246,15 @@
246 246  |**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70.
247 247  |**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//.
248 248  |**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.
249 -| |
250 250  
251 -
252 -
253 253  //Scheda Salvataggio scelta//
254 254  
255 -[[image:WAV_skSalva.png||height="517" width="400"]]
252 +[[image:WAV_skSalva.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
256 256  
257 -
258 258  Impostare i campi seguenti:
259 259  
260 260  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
261 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
257 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
262 262  |//Salva frase riconosciuta in//|
263 263  |(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
264 264  |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
... ... @@ -265,7 +265,6 @@
265 265  |//Salva confidence in//|
266 266  |**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza.
267 267  |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza.
268 -|(% style="text-align:right" %) |
269 269  
270 270  ==== Port di Uscita ====
271 271  
... ... @@ -274,7 +274,7 @@
274 274  Le funzionalità dei //Port di Uscita// del blocchetto sono le seguenti :
275 275  
276 276  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
277 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
272 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
278 278  |**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit.
279 279  |**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit.
280 280  |**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo.
... ... @@ -284,10 +284,10 @@
284 284  Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi:
285 285  
286 286  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
287 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
282 +(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
288 288  |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento.
289 289  |**_ASR_Source**|(((
290 -Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel Call Data definiti in configurazione. I valori possibili sono:
285 +Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono:
291 291  
292 292  * **“”** (stringa vuota): nel caso in cui non sia riconosciuto l'audio e non sia rilevato alcun digit.
293 293  * **“DTMF”**: nel caso sia rilevato un digit che interrompe la fase di riconoscimento. La Transfer Property e il Call Data, eventualmente configurati come variabili di uscita, conterranno il digit ricevuto.
STT_skGenerale.jpg
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +42.6 KB
Content
SpeechToText.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +25.8 KB
Content