Changes for page 10 - Riconoscimento vocale
Last modified by administrator BDP on 2024/10/21 14:52
From version 47.8
edited by administrator BDP
on 2021/02/22 19:04
on 2021/02/22 19:04
Change comment:
There is no comment for this version
To version 33.1
edited by administrator BDP
on 2019/03/25 12:46
on 2019/03/25 12:46
Change comment:
There is no comment for this version
Summary
-
Page properties (1 modified, 0 added, 0 removed)
-
Attachments (0 modified, 0 added, 5 removed)
Details
- Page properties
-
- Content
-
... ... @@ -148,62 +148,29 @@ 148 148 (% class="small" style="font-family:Courier New,Courier,monospace" %)Cancel=annulla 149 149 ))) 150 150 151 - 152 - 153 153 == SpeechToText (CSpeechToText) == 154 154 155 -Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google ( //Google Speech API//).Le sue principalifunzionalitàsono le seguenti:153 +Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (Google Speech API). Il testo può essere salvato in una Transfer Property o in un CallData, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata. 156 156 157 -* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento) 158 -* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV) 159 -* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto 160 -* Abilitare il riconoscimento di espressione singola (//single utterance//). Nel caso ci si aspetti che l’utente pronunci una singola parola breve, ad esempio un //si// o un //no//, abilitare questo parametro migliora la capacità di riconoscimento del motore stesso. 161 -* Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//. 162 -* In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine. 163 -* Il testo può essere salvato in una Transfer Property o in un CallData, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata. 164 - 165 165 Il servizio è disponibile anche in //compatibility mode.// 166 166 167 167 168 - ===**Parametri di Configurazione**===158 +**Parametri di Configurazione** 169 169 170 - ====**Proprietà**====160 +Dalla finestra //Proprietà// del blocchetto sono visualizzate le seguenti schede: 171 171 172 - Cliccando sulla funzionalità//Proprietà// del blocchetto sono visualizzate le seguenti schede, che sono differenti rispettoallascelta di utilizzare il TTS piuttosto che il file WAV nellaschedaGenerale//:162 +//Scheda Messaggi// 173 173 174 - //SchedaGenerale//164 +[[image:STT_skMessaggi.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]] 175 175 176 -[[image:WAV_skGenerale.png||height="517" width="400"]] 177 - 178 - 179 -Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento. 180 - 181 181 L'elenco dei campi visualizzati è il seguente: 182 182 183 183 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 184 184 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 185 -|**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. 186 -|**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2. 170 +|**Lista messaggi**|Lista dei messaggi da riprodurre al chiamante come invito e istruzioni per ciò che deve dire. 187 187 188 - //Scheda Messaggi perTTS//172 +Utilizzare i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre tra i seguenti: 189 189 190 -[[image:STT_skMess.png||height="518" width="400"]] 191 - 192 - 193 -L'elenco dei campi visualizzati è il seguente: 194 - 195 -(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 196 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 197 -|**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo. 198 -|**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento. 199 - 200 -//Scheda Messaggi per WAV// 201 - 202 -//[[image:WAV_skMess.png||height="518" width="400"]]// 203 - 204 - 205 -Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti: 206 - 207 207 * File 208 208 * Numero 209 209 * Importo ... ... @@ -214,57 +214,41 @@ 214 214 * Data/Ora del file 215 215 * Ordinale 216 216 217 - 218 218 //Scheda Motore// 219 219 220 220 [[image:STT_skMotore.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]] 221 221 222 -Impostare i campi seguenti: 223 - 224 224 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 225 225 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 226 -|**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//. 227 -|**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//. 228 -|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante. 229 -|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi. 230 -|**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70. 190 +|**ConfidenceLevel**|Valore numerico compreso tra 0 e 100 che indica il livello di affidabilità da raggiungere per considerare il riconoscimento valido. 191 +|**RecognitionTimeout**|Tempo massimo consentito al chiamante per effettuare la sua scelta vocale. 192 +|**EngineName**|Nome del motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//. 193 +|**EngineLanguage**|Codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. 194 +|**StopOnDigit**|Flag che indica se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante. 195 +|**TransferProperty**|Nome della Transfer Property in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 196 +|**CallData**|Nome del CallData in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 197 +|**NextServiceFailure**|Nome del servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit. 231 231 232 -//Scheda Messaggi errore// 233 233 234 -[[image:STT_skMessaggiErr.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]] 235 235 236 -Impostare i campi seguenti: 237 - 238 238 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 239 239 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 240 -|**Numero massimo di tentativi**|Indicare il numero massimo di tentativi di riconoscimento. Se la fase di riconoscimento non avesse successo, indica il numero di tentativi consentiti al chiamante. Valore predefinito: 2. 241 -|**Messaggio di errore con invito a ripetere**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento. 203 +|**Lista messaggi**|Lista dei messaggi da riprodurre al chiamante come invito e istruzioni per ciò che deve dire. 204 +|**ConfidenceLevel**|Valore numerico compreso tra 0 e 100 che indica il livello di affidabilità da raggiungere per considerare il riconoscimento valido. 205 +|**RecognitionTimeout**|Tempo massimo consentito al chiamante per effettuare la sua scelta vocale. 206 +|**EngineName**|Nome del motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//. 207 +|**EngineLanguage**|Codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. 208 +|**StopOnDigit**|Flag che indica se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante. 209 +|**NotRecognizedMessage**|Messaggio riprodotto in caso di mancato riconoscimento. 210 +|**MaxRetries**|Numero massimo dei tentativi di riconoscimento. Se la fase di riconoscimento non avesse successo, indica il numero di tentativi consentiti al chiamante. 211 +|**TransferProperty**|Nome della Transfer Property in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 212 +|**CallData**|Nome del CallData in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 213 +|**NextServiceFailure**|Nome del servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit. 214 +|**NextServiceDigitDetected**|Nome del servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit. 215 +|**NextServiceRecognized**|Nome del servizio successivo da attivare nel caso il riconoscimento abbia successo. 242 242 243 - //SchedaSalvataggioscelta//217 +**Transfer Property** 244 244 245 -[[image:STT_skSalvataggio.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]] 246 - 247 -Impostare i campi seguenti: 248 - 249 -(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 250 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 251 -|**Nome Transfer Property**|Selezionare la Transfer Property in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 252 -|**CallData**|Indicare il CallData in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 253 - 254 -==== Port di Uscita ==== 255 - 256 -[[image:output_port.jpg||style="margin-bottom:20px; margin-top:20px"]] 257 - 258 -Le funzionalità dei //Port di Uscita// del blocchetto sono le seguenti : 259 - 260 -(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 261 -(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 262 -|**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit. 263 -|**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit. 264 -|**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo. 265 - 266 -=== **Transfer Property** === 267 - 268 268 Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi: 269 269 270 270 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
- STT_skMess.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -58.8 KB - Content
- STT_skSalvataggio.jpg
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -37.7 KB - Content
- WAV_skGenerale.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -15.4 KB - Content
- WAV_skMess.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -76.0 KB - Content
- output_port.jpg
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.administrator - Size
-
... ... @@ -1,1 +1,0 @@ 1 -29.1 KB - Content