Changes for page 10 - Riconoscimento vocale
Last modified by administrator BDP on 2024/10/21 14:52
From version 50.8
edited by administrator BDP
on 2021/02/25 12:16
on 2021/02/25 12:16
Change comment:
There is no comment for this version
To version 36.3
edited by administrator BDP
on 2019/03/25 15:00
on 2019/03/25 15:00
Change comment:
There is no comment for this version
Summary
-
Page properties (1 modified, 0 added, 0 removed)
-
Attachments (0 modified, 0 added, 7 removed)
Details
- Page properties
-
- Content
-
... ... @@ -148,71 +148,29 @@ 148 148 (% class="small" style="font-family:Courier New,Courier,monospace" %)Cancel=annulla 149 149 ))) 150 150 151 - 152 - 153 153 == SpeechToText (CSpeechToText) == 154 154 155 -Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google ( //Google Speech API//).Le sue principalifunzionalitàsono le seguenti:153 +Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (Google Speech API). Il testo può essere salvato in una Transfer Property o in un CallData, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata. 156 156 157 -* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento). 158 -* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV). 159 -* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto. Nella scheda //Salvataggio scelta// è possibile salvare l'accuratezza (definita anche //confidence//) in una //transfer property// o in un //calldata.// 160 -* Abilitare il riconoscimento di espressione singola (//single utterance//). Nel caso ci si aspetti che l’utente pronunci una singola parola breve, ad esempio un //si// o un //no//, abilitare questo parametro migliora la capacità di riconoscimento del motore stesso. 161 -* Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//. 162 -* In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine. 163 -* Il testo può essere salvato in una Transfer Property o in un CallData, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata. 155 +Il servizio è disponibile anche in //compatibility mode.// 164 164 165 -(% class="box errormessage" %) 166 -((( 167 -**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi), dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// ((vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi. In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe nessun valore. Quindi il parametro che abilita la single_utterance NON andrebbe usato con BurgeIn abilitato e messaggio di invito che dura più di un paio di secondi. 168 -))) 169 169 158 +**Parametri di Configurazione** 170 170 160 +Dalla finestra //Proprietà// del blocchetto sono visualizzate le seguenti schede: 171 171 162 +//Scheda Messaggi// 172 172 164 +[[image:STT_skMessaggi.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]] 173 173 174 - 175 - 176 -Il servizio è disponibile anche in //compatibility mode//. 177 - 178 - 179 -=== **Parametri di Configurazione** === 180 - 181 -==== **Proprietà** ==== 182 - 183 -Cliccando sulla funzionalità //Proprietà// del blocchetto sono visualizzate le seguenti schede, che sono differenti rispetto alla scelta di utilizzare il TTS piuttosto che il file WAV nella scheda //Generale//: 184 - 185 -//Scheda Generale// 186 - 187 -[[image:WAV_skGenerale.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] 188 - 189 -Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento. 190 - 191 191 L'elenco dei campi visualizzati è il seguente: 192 192 193 193 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 194 194 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 195 -|**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. 196 -|**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2. 170 +|**Lista messaggi**|Lista dei messaggi da riprodurre al chiamante come invito e istruzioni per ciò che deve dire. 197 197 198 - //Scheda Messaggi perTTS//172 +Utilizzare i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre tra i seguenti: 199 199 200 -[[image:STT_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] 201 - 202 - 203 -L'elenco dei campi visualizzati è il seguente: 204 - 205 -(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 206 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 207 -|**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo. 208 -|**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento. 209 - 210 -//Scheda Messaggi per WAV// 211 - 212 -[[image:WAV_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] 213 - 214 -Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti: 215 - 216 216 * File 217 217 * Numero 218 218 * Importo ... ... @@ -223,21 +223,10 @@ 223 223 * Data/Ora del file 224 224 * Ordinale 225 225 226 -//Scheda Motore TTS//184 +//Scheda Motore// 227 227 228 -[[image:STT_skMotore TTS.png||height="517"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px20px"width="400"]]186 +[[image:STT_skMotore.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]] 229 229 230 -Impostare il campo seguente: 231 - 232 -(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 233 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 234 -|**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR. 235 - 236 -//Scheda Motore STT// 237 - 238 -[[image:STT_skMotoreSST.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]] 239 - 240 - 241 241 Impostare i campi seguenti: 242 242 243 243 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) ... ... @@ -245,44 +245,39 @@ 245 245 |**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//. 246 246 |**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//. 247 247 |**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante. 248 -|**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento. 249 -|**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione. 250 -|**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative. 251 -|**Abilita riconoscimento espressione singola**|Selezionare si si vuole migliorare la modalità di riconoscimento di singoli comandi o parole, oppure di frasi brevi e concise, ad esempio //sì// o //no//. 252 252 |**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi. 253 253 |**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70. 254 -|**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//. 255 -|**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//. 256 256 257 -//Scheda Salvataggioscelta//198 +//Scheda Messaggi errore// 258 258 259 -[[image: WAV_skSalva.png||height="517"style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px20px"width="400"]]200 +[[image:STT_skMessaggiErr.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]] 260 260 261 261 Impostare i campi seguenti: 262 262 263 263 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 264 264 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 265 -|//Salva frase riconosciuta in//| 266 -|(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 267 -|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 268 -|//Salva confidence in//| 269 -|**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza. 270 -|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza. 206 +|**Numero massimo di tentativi**|Indicare il numero massimo di tentativi di riconoscimento. Se la fase di riconoscimento non avesse successo, indica il numero di tentativi consentiti al chiamante. Valore predefinito: 2. 207 +|**Messaggio di errore con invito a ripetere**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento. 271 271 272 - ====PortdiUscita====209 +//Scheda Salvataggio scelta// 273 273 274 -[[image: output_port.jpg||style="margin-bottom:20px; margin-top:20px"]]211 +[[image:STT_skSalvataggio.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]] 275 275 276 - Le funzionalità dei//Port diUscita//del blocchettosono leseguenti213 +Impostare i campi seguenti: 277 277 278 278 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 279 279 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 280 -|**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit. 281 -|**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit. 282 -|**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo. 217 +|**Nome Transfer Property**|Selezionare la Transfer Property in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 218 +|**CallData**|Indicare il CallData in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 283 283 284 -=== **Transfer Property** === 220 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 221 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 222 +|**NextServiceFailure**|Nome del servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit. 223 +|**NextServiceDigitDetected**|Nome del servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit. 224 +|**NextServiceRecognized**|Nome del servizio successivo da attivare nel caso il riconoscimento abbia successo. 285 285 226 +**Transfer Property** 227 + 286 286 Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi: 287 287 288 288 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) ... ... @@ -289,7 +289,7 @@ 289 289 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 290 290 |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento. 291 291 |**_ASR_Source**|((( 292 -Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono: 234 +Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel Call Data definiti in configurazione. I valori possibili sono: 293 293 294 294 * **“”** (stringa vuota): nel caso in cui non sia riconosciuto l'audio e non sia rilevato alcun digit. 295 295 * **“DTMF”**: nel caso sia rilevato un digit che interrompe la fase di riconoscimento. La Transfer Property e il Call Data, eventualmente configurati come variabili di uscita, conterranno il digit ricevuto.
- STT_skMess.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -58.8 KB - Content
- STT_skMotoreSST.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -150.6 KB - Content
- STT_skMotoreTTS.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -56.1 KB - Content
- WAV_skGenerale.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -15.4 KB - Content
- WAV_skMess.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -76.0 KB - Content
- WAV_skSalva.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -16.7 KB - Content
- output_port.jpg
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -29.1 KB - Content