Changes for page 10 - Riconoscimento vocale
Last modified by administrator BDP on 2024/10/21 14:52
From version 47.1
edited by administrator BDP
on 2021/02/22 18:41
on 2021/02/22 18:41
Change comment:
Uploaded new attachment "WAV_skMess.png", version {1}
To version 50.6
edited by administrator BDP
on 2021/02/23 16:24
on 2021/02/23 16:24
Change comment:
There is no comment for this version
Summary
-
Page properties (1 modified, 0 added, 0 removed)
-
Attachments (0 modified, 3 added, 0 removed)
Details
- Page properties
-
- Content
-
... ... @@ -154,9 +154,9 @@ 154 154 155 155 Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (//Google Speech API//). Le sue principali funzionalità sono le seguenti: 156 156 157 -* Utilizzare TTS eWAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento)157 +* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento) 158 158 * Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV) 159 -* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto ;159 +* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto 160 160 * Abilitare il riconoscimento di espressione singola (//single utterance//). Nel caso ci si aspetti che l’utente pronunci una singola parola breve, ad esempio un //si// o un //no//, abilitare questo parametro migliora la capacità di riconoscimento del motore stesso. 161 161 * Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//. 162 162 * In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine. ... ... @@ -173,22 +173,35 @@ 173 173 174 174 //Scheda Generale// 175 175 176 -[[image:WAV_skGenerale.png||height="517" width="400"]] 176 +[[image:WAV_skGenerale.png||height="517" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 177 177 178 +Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento. 178 178 180 +L'elenco dei campi visualizzati è il seguente: 179 179 182 +(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 183 +(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 184 +|**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. 185 +|**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2. 180 180 187 +//Scheda Messaggi per TTS// 181 181 182 - //SchedaMessaggi//189 +[[image:STT_skMess.png||height="518" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 183 183 191 + 184 184 L'elenco dei campi visualizzati è il seguente: 185 185 186 186 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 187 187 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 188 -|**Lista messaggi**|Lista dei messaggi da riprodurre al chiamante come invito e istruzioni per ciò che deve dire. 196 +|**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo. 197 +|**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento. 189 189 190 - Utilizzarei tasti **Nuovo**, **Modifica**e**Cancella** perselezionare e impostare il tipo di messaggioda riprodurretrai seguenti:199 +//Scheda Messaggi per WAV// 191 191 201 +[[image:WAV_skMess.png||height="518" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 202 + 203 +Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti: 204 + 192 192 * File 193 193 * Numero 194 194 * Importo ... ... @@ -199,41 +199,53 @@ 199 199 * Data/Ora del file 200 200 * Ordinale 201 201 202 -//Scheda Motore// 215 +//Scheda Motore TTS// 203 203 204 -[[image:STT_skMotore. jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px10px"]]217 +[[image:STT_skMotoreTTS.png||height="517" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 205 205 206 -Impostare i camp iseguenti:219 +Impostare il campo seguente: 207 207 208 208 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 209 209 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 210 -|**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//. 211 -|**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//. 212 -|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante. 213 -|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi. 214 -|**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70. 223 +|**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR. 215 215 216 -//Scheda M essaggi errore//225 +//Scheda Motore STT// 217 217 218 -[[image:STT_skM essaggiErr.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px10px"]]227 +[[image:STT_skMotoreSST.png||height="518" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 219 219 229 + 220 220 Impostare i campi seguenti: 221 221 222 222 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 223 223 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 224 -|**Numero massimo di tentativi**|Indicare il numero massimo di tentativi di riconoscimento. Se la fase di riconoscimento non avesse successo, indica il numero di tentativi consentiti al chiamante. Valore predefinito: 2. 225 -|**Messaggio di errore con invito a ripetere**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento. 234 +|**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//. 235 +|**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//. 236 +|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante. 237 +|**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento. 238 +|**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione. 239 +|**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative. 240 +|**Abilita riconoscimento espressione singola**|Selezionare si si vuole migliorare la modalità di riconoscimento di singoli comandi o parole, oppure di frasi brevi e concise, ad esempio //sì// o //no//. 241 +|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi. 242 +|**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70. 243 +|**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//. 244 +|**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//. 245 +| | 226 226 227 227 //Scheda Salvataggio scelta// 228 228 229 -[[image: STT_skSalvataggio.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px10px"]]249 +[[image:WAV_skSalva.png||height="517" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]] 230 230 231 231 Impostare i campi seguenti: 232 232 233 233 (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %) 234 234 (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione** 235 -|**Nome Transfer Property**|Selezionare la Transfer Property in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 236 -|**CallData**|Indicare il CallData in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 255 +|//Salva frase riconosciuta in//| 256 +|(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 257 +|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto. 258 +|//Salva confidence in//| 259 +|**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza. 260 +|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza. 261 +|(% style="text-align:right" %) | 237 237 238 238 ==== Port di Uscita ==== 239 239 ... ... @@ -262,6 +262,10 @@ 262 262 * **“STT”**: nel caso il motore di riconoscimento restituisca un qualsiasi valore. La Transfer Property e il Call Data, eventualmente configurati come variabili di uscita, conterranno il testo riconosciuto. 263 263 ))) 264 264 290 + 291 + 292 + 293 + 265 265 == VoiceMenu (CVoiceMenu) == 266 266 267 267 Presenta un menu di opzioni e, in base alla scelta del chiamante, effettuata tramite il riconoscimento vocale, attiva il servizio associato. Permette di configurare la sequenza di messaggi (file wav/avi, numeri, date, ecc.) da riprodurre all'utente per invitarlo a segnalare al sistema la sua scelta.
- STT_skMotoreSST.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.administrator - Size
-
... ... @@ -1,0 +1,1 @@ 1 +150.6 KB - Content
- STT_skMotoreTTS.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.administrator - Size
-
... ... @@ -1,0 +1,1 @@ 1 +56.1 KB - Content
- WAV_skSalva.png
-
- Author
-
... ... @@ -1,0 +1,1 @@ 1 +XWiki.administrator - Size
-
... ... @@ -1,0 +1,1 @@ 1 +16.7 KB - Content