Last modified by administrator BDP on 2024/10/21 14:52

From version 46.4
edited by administrator BDP
on 2021/02/22 18:39
Change comment: (Autosaved)
To version 50.8
edited by administrator BDP
on 2021/02/25 12:16
Change comment: There is no comment for this version

Summary

Details

Page properties
Content
... ... @@ -154,17 +154,28 @@
154 154  
155 155  Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (//Google Speech API//). Le sue principali funzionalità sono le seguenti:
156 156  
157 -* Utilizzare TTS e WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento)
158 -* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV)
159 -* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto;
157 +* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento).
158 +* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV).
159 +* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto. Nella scheda //Salvataggio scelta// è possibile salvare l'accuratezza (definita anche //confidence//) in una //transfer property// o in un //calldata.//
160 160  * Abilitare il riconoscimento di espressione singola (//single utterance//). Nel caso ci si aspetti che l’utente pronunci una singola parola breve, ad esempio un //si// o un //no//, abilitare questo parametro migliora la capacità di riconoscimento del motore stesso.
161 161  * Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//.
162 162  * In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine.
163 163  * Il testo può essere salvato in una Transfer Property o in un CallData, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata.
164 164  
165 -Il servizio è disponibile anche in //compatibility mode.//
165 +(% class="box errormessage" %)
166 +(((
167 +**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi), dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// ((vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi. In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe nessun valore. Quindi il parametro che abilita la single_utterance NON andrebbe usato con BurgeIn abilitato e messaggio di invito che dura più di un paio di secondi.
168 +)))
166 166  
167 167  
171 +
172 +
173 +
174 +
175 +
176 +Il servizio è disponibile anche in //compatibility mode//.
177 +
178 +
168 168  === **Parametri di Configurazione** ===
169 169  
170 170  ==== **Proprietà** ====
... ... @@ -173,22 +173,35 @@
173 173  
174 174  //Scheda Generale//
175 175  
176 -[[image:WAV_skGenerale.png||height="517" width="400"]]
187 +[[image:WAV_skGenerale.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
177 177  
189 +Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento.
178 178  
191 +L'elenco dei campi visualizzati è il seguente:
179 179  
193 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
194 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
195 +|**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore.
196 +|**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2.
180 180  
198 +//Scheda Messaggi per TTS//
181 181  
182 -//Scheda Messaggi//
200 +[[image:STT_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
183 183  
202 +
184 184  L'elenco dei campi visualizzati è il seguente:
185 185  
186 186  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
187 187  (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
188 -|**Lista messaggi**|Lista dei messaggi da riprodurre al chiamante come invito e istruzioni per ciò che deve dire.
207 +|**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo.
208 +|**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento.
189 189  
190 -Utilizzare i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre tra i seguenti:
210 +//Scheda Messaggi per WAV//
191 191  
212 +[[image:WAV_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
213 +
214 +Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti:
215 +
192 192  * File
193 193  * Numero
194 194  * Importo
... ... @@ -199,41 +199,51 @@
199 199  * Data/Ora del file
200 200  * Ordinale
201 201  
202 -//Scheda Motore//
226 +//Scheda Motore TTS//
203 203  
204 -[[image:STT_skMotore.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]]
228 +[[image:STT_skMotoreTTS.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
205 205  
206 -Impostare i campi seguenti:
230 +Impostare il campo seguente:
207 207  
208 208  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
209 209  (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
210 -|**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//.
211 -|**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//.
212 -|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante.
213 -|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.
214 -|**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70.
234 +|**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR.
215 215  
216 -//Scheda Messaggi errore//
236 +//Scheda Motore STT//
217 217  
218 -[[image:STT_skMessaggiErr.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]]
238 +[[image:STT_skMotoreSST.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
219 219  
240 +
220 220  Impostare i campi seguenti:
221 221  
222 222  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
223 223  (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
224 -|**Numero massimo di tentativi**|Indicare il numero massimo di tentativi di riconoscimento. Se la fase di riconoscimento non avesse successo, indica il numero di tentativi consentiti al chiamante. Valore predefinito: 2.
225 -|**Messaggio di errore con invito a ripetere**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento.
245 +|**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//.
246 +|**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//.
247 +|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante.
248 +|**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento.
249 +|**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione.
250 +|**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative.
251 +|**Abilita riconoscimento espressione singola**|Selezionare si si vuole migliorare la modalità di riconoscimento di singoli comandi o parole, oppure di frasi brevi e concise, ad esempio //sì// o //no//.
252 +|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.
253 +|**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70.
254 +|**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//.
255 +|**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.
226 226  
227 227  //Scheda Salvataggio scelta//
228 228  
229 -[[image:STT_skSalvataggio.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]]
259 +[[image:WAV_skSalva.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
230 230  
231 231  Impostare i campi seguenti:
232 232  
233 233  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
234 234  (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
235 -|**Nome Transfer Property**|Selezionare la Transfer Property in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
236 -|**CallData**|Indicare il CallData in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
265 +|//Salva frase riconosciuta in//|
266 +|(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
267 +|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
268 +|//Salva confidence in//|
269 +|**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza.
270 +|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza.
237 237  
238 238  ==== Port di Uscita ====
239 239  
... ... @@ -255,7 +255,7 @@
255 255  (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
256 256  |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento.
257 257  |**_ASR_Source**|(((
258 -Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel Call Data definiti in configurazione. I valori possibili sono:
292 +Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono:
259 259  
260 260  * **“”** (stringa vuota): nel caso in cui non sia riconosciuto l'audio e non sia rilevato alcun digit.
261 261  * **“DTMF”**: nel caso sia rilevato un digit che interrompe la fase di riconoscimento. La Transfer Property e il Call Data, eventualmente configurati come variabili di uscita, conterranno il digit ricevuto.
STT_skMotoreSST.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +150.6 KB
Content
STT_skMotoreTTS.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +56.1 KB
Content
WAV_skMess.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +76.0 KB
Content
WAV_skSalva.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.administrator
Size
... ... @@ -1,0 +1,1 @@
1 +16.7 KB
Content