Changes for page 10 - Riconoscimento vocale

Last modified by administrator BDP on 2024/10/21 14:52

From 43.3 to 43.4 From 50.6 to 50.7

From version 43.4

edited by administrator BDP
on 2021/02/22 17:14

Change comment: (Autosaved)

To version 50.6

edited by administrator BDP
on 2021/02/23 16:24

Change comment: There is no comment for this version

Raw
Rendered

Summary

Page properties (1 modified, 0 added, 0 removed)
Attachments (0 modified, 6 added, 0 removed)

Details

Page properties

Content

@@ -154,9 +154,9 @@
  Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (//Google Speech API//). Le sue principali funzionalità sono le seguenti:
--* Utilizzare TTS e WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento)
++* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento)
  * Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV)
--* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto;
++* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto
  * Abilitare il riconoscimento di espressione singola (//single utterance//). Nel caso ci si aspetti che l’utente pronunci una singola parola breve, ad esempio un //si// o un //no//, abilitare questo parametro migliora la capacità di riconoscimento del motore stesso.
  * Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//.
  * In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine.
@@ -169,20 +169,39 @@
  ==== **Proprietà** ====
--Cliccando sulla funzionalità //Proprietà// del blocchetto sono visualizzate le seguenti schede:
++Cliccando sulla funzionalità //Proprietà// del blocchetto sono visualizzate le seguenti schede, che sono differenti rispetto alla scelta di utilizzare il TTS piuttosto che il file WAV nella scheda //Generale//:
--//Scheda Messaggi//
++//Scheda Generale//
--[[image:STT_skMessaggi.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]]
++[[image:WAV_skGenerale.png||height="517" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
++Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento.
++
  L'elenco dei campi visualizzati è il seguente:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
  (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
--|**Lista messaggi**|Lista dei messaggi da riprodurre al chiamante come invito e istruzioni per ciò che deve dire.
++|**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore.
++|**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2.
--Utilizzare i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre tra i seguenti:
++//Scheda Messaggi per TTS//
++[[image:STT_skMess.png||height="518" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
++
++
++L'elenco dei campi visualizzati è il seguente:
++
++(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
++(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++|**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo.
++|**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento.
++
++//Scheda Messaggi per WAV//
++
++[[image:WAV_skMess.png||height="518" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
++
++Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti:
++
  * File
  * Numero
  * Importo
@@ -193,41 +193,53 @@
  * Data/Ora del file
  * Ordinale
--//Scheda Motore//
++//Scheda Motore TTS//
--[[image:STT_skMotore.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]]
++[[image:STT_skMotoreTTS.png||height="517" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
--Impostare i campi seguenti:
++Impostare il campo seguente:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
  (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
--|**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//.
--|**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//.
--|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante.
--|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.
--|**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70.
++|**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR.
--//Scheda Messaggi errore//
++//Scheda Motore STT//
--[[image:STT_skMessaggiErr.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]]
++[[image:STT_skMotoreSST.png||height="518" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
++
  Impostare i campi seguenti:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
  (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
--|**Numero massimo di tentativi**|Indicare  il numero massimo di tentativi di riconoscimento. Se la fase di riconoscimento non avesse successo, indica il numero di tentativi consentiti al chiamante. Valore predefinito: 2.
--|**Messaggio di errore con invito a ripetere**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento.
++|**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//.
++|**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//.
++|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante.
++|**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento.
++|**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione.
++|**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative.
++|**Abilita riconoscimento espressione singola**|Selezionare si si vuole migliorare la modalità di riconoscimento di singoli comandi o parole, oppure di frasi brevi e concise, ad esempio //sì// o //no//.
++|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.
++|**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70.
++|**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//.
++|**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.
++| |
  //Scheda Salvataggio scelta//
--[[image:STT_skSalvataggio.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 10px"]]
++[[image:WAV_skSalva.png||height="517" width="400" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px"]]
  Impostare i campi seguenti:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
  (% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
--|**Nome Transfer Property**|Selezionare la Transfer Property in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
--|**CallData**|Indicare il CallData in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
++|//Salva frase riconosciuta in//|
++|(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
++|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
++|//Salva confidence in//|
++|**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza.
++|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza.
++|(% style="text-align:right" %) |
  ==== Port di Uscita ====
@@ -256,6 +256,10 @@
  * **“STT”**: nel caso il motore di riconoscimento restituisca un qualsiasi valore. La Transfer Property e il Call Data, eventualmente configurati come variabili di uscita, conterranno il testo riconosciuto.
  )))
++
++
++
++
  == VoiceMenu (CVoiceMenu) ==
  Presenta un menu di opzioni e, in base alla scelta del chiamante, effettuata tramite il riconoscimento vocale, attiva il servizio associato. Permette di configurare la sequenza di messaggi (file wav/avi, numeri, date, ecc.) da riprodurre all'utente per invitarlo a segnalare al sistema la sua scelta.

STT_skMess.png

Author

...	...	@@ -1,0 +1,1 @@
	1	+XWiki.administrator

Size

...	...	@@ -1,0 +1,1 @@
	1	+58.8 KB

Content

STT_skMotoreSST.png

Author

...	...	@@ -1,0 +1,1 @@
	1	+XWiki.administrator

Size

...	...	@@ -1,0 +1,1 @@
	1	+150.6 KB

Content

STT_skMotoreTTS.png

Author

...	...	@@ -1,0 +1,1 @@
	1	+XWiki.administrator

Size

...	...	@@ -1,0 +1,1 @@
	1	+56.1 KB

Content

WAV_skGenerale.png

Author

...	...	@@ -1,0 +1,1 @@
	1	+XWiki.administrator

Size

...	...	@@ -1,0 +1,1 @@
	1	+15.4 KB

Content

WAV_skMess.png

Author

...	...	@@ -1,0 +1,1 @@
	1	+XWiki.administrator

Size

...	...	@@ -1,0 +1,1 @@
	1	+76.0 KB

Content

WAV_skSalva.png

Author

...	...	@@ -1,0 +1,1 @@
	1	+XWiki.administrator

Size

...	...	@@ -1,0 +1,1 @@
	1	+16.7 KB

Content

Changes for page 10 - Riconoscimento vocale

Summary

Details

Navigation

Collegamenti rapidi

Serve aiuto?

Changes for page 10 - Riconoscimento vocale

Summary

Details

Collegamenti rapidi

Serve aiuto?

Tag Cloud