Changes for page 10 - Riconoscimento vocale

Last modified by administrator BDP on 2024/10/21 14:52

From 50.7 to 50.6 From 55.1 to 54.1

From version 54.1

edited by administrator BDP
on 2024/10/11 16:04

Change comment: Upload new image "STT_skMessaggi.jpg", version 1.6

To version 50.7

edited by administrator BDP
on 2021/02/23 16:25

Change comment: There is no comment for this version

Raw
Rendered

Summary

Page properties (1 modified, 0 added, 0 removed)
Attachments (1 modified, 0 added, 2 removed)

Details

Page properties

Content

@@ -15,8 +15,7 @@
  **Parametri di Configurazione**
--(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Parametri**|**Descrizione**
++|=(% style="width: 200px;" %)**Parametri**|**Descrizione**
  |**Tipo di motore di sintesi vocale**|(((
  Selezionare il tipo di motore tra i seguenti:
@@ -40,8 +40,7 @@
  **Messaggi Disponibili**
--(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Nome File**|**Messaggio**
++|=(% style="width: 200px;" %)**Nome File**|**Messaggio**
  |**IntroMessage.wav**|Messaggio di accoglienza con istruzioni per l'inserimento del proprio codice.
  |**CharNotRecognized.wav**|Comunica che il riconoscimento del carattere corrente non è andato a buon fine.
  |**RecognizedCodeIs.wav**|Messaggio del tipo: //"Il codice riconosciuto è...".//
@@ -150,24 +150,21 @@
  (% class="small" style="font-family:Courier New,Courier,monospace" %)Cancel=annulla
  )))
++
++
  == SpeechToText (CSpeechToText) ==
  Questo blocchetto permette di convertire l'audio del chiamante (parlato) in testo tramite il motore di riconoscimento vocale di Google (//Google Speech API//). Le sue principali funzionalità sono le seguenti:
--* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento).
--* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV).
--* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto. Nella scheda //Salvataggio scelta// è possibile salvare l'accuratezza (definita anche //confidence//) in una //transfer property// o in un //calldata.//
++* Utilizzare TTS o WAV per i messaggi (sia per quelli di invito a pronunciare la propria scelta sia per quello di mancato riconoscimento)
++* Abilitare la funzionalità di //bargeIn//, cioè far partire il riconoscimento durante il play del messaggio (indipendentemente se si usa TTS o WAV)
++* Restituire l’accuratezza del riconoscimento. Il motore di STT ritorna, insieme alla stringa riconosciuta anche un valore tra 0 e 100 che rappresenta la percentuale di sicurezza con cui il testo è stato riconosciuto
  * Abilitare il riconoscimento di espressione singola (//single utterance//). Nel caso ci si aspetti che l’utente pronunci una singola parola breve, ad esempio un //si// o un //no//, abilitare questo parametro migliora la capacità di riconoscimento del motore stesso.
  * Passare al motore di STT una serie di parole attese, tramite una stringa in cui i vari vocaboli sono separati da "|" (pipe). Il motore non si limita a riconoscere solo le parole contenute nella lista, ma vengono usate per migliorare la capacità di riconoscimento. Ad esempio: //“si|no|abbastanza|poco|…..”//.
  * In caso di errore di riconoscimento il blocchetto salva in una Transfer Property (//~_~_RecognizeErrorCode~_~_//) il codice di errore ritornato dall’engine.
--* Il testo può essere salvato in una //transfer property// o in un //calldata//, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata.
--* È stata aggiunta la scheda //Parametri aggiuntivi// per permettere la definizione dei parametri addizionali relativi al passaggio delle API Google dalla versione 1 alla 2.
--
++* Il testo può essere salvato in una Transfer Property o in un CallData, per potere essere analizzato/elaborato successivamente da ulteriori blocchetti impostati nel flusso della chiamata.
--(% class="box errormessage" %)
--(((
--**NOTA BENE**: quando si abilita il parametro //Single Utterance// (vedere casella //Abilita riconoscimento espressione singola// nella scheda //Motore STT//), l’engine Google prevede di ricevere l’audio in un tempo relativamente breve (massimo 10/15 secondi),  dopodichè termina la fase di riconoscimento. Questo può essere un problema se si abilita anche la modalità //BargeIn// (vedere casella //Abilita riconoscimento durante la play// nella scheda //Motore STT//) con un messaggio di invito con un tempo che si avvicina o supera i 10 secondi.  In questo caso se l’utente aspettasse la fine del messaggio prima di pronunciare la sua scelta, l’engine Google sarebbe già uscito dalla fase di riconoscimento e non restituirebbe alcun valore. Quindi è raccomandabile di non impostare il parametro //Single Utterance// contemporaneamente al parametro //BargeIn// se il messaggio di invito dura più di due secondi.
--)))
++Il servizio è disponibile anche in //compatibility mode.//
  === **Parametri di Configurazione** ===
@@ -185,7 +185,7 @@
  L'elenco dei campi visualizzati è il seguente:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
  |**Utilizzare TTS invece che messaggi WAV**|Selezionare la casella per indicare che si vuole usare il TTS (//Text-To-Speech//). In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore.
  |**Numero massimo di tentativi**|Indicare il numero di tentativi consentiti al chiamante, se la fase di riconoscimento non avesse successo. Valore predefinito: 2.
@@ -197,7 +197,7 @@
  L'elenco dei campi visualizzati è il seguente:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
  |**Testo messaggio iniziale**|Indicare nel campo il testo del messaggio introduttivo.
  |**Testo messaggio di errore**|Indicare il messaggio da riprodurre in caso di mancato riconoscimento.
@@ -224,20 +224,21 @@
  Impostare il campo seguente:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
  |**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR.
  //Scheda Motore STT//
--[[image:attach:SpeechToText.png||alt="STT_skMotoreSST.png" height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
++[[image:STT_skMotoreSST.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
++
  Impostare i campi seguenti:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
  |**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//.
  |**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//.
--|**Termina riconoscimento su ricezione digits dopo**|Selezionare per abilitare l'interruzione della play del messaggo di invito a parlare, sia riprodotto da file che tramite //TextToSpeech//. il tempo, espresso in millisecondi, indica dopo quanto deve essere terminata la fase di riconoscimento in seguito alla pressione di un digit dda parte dell'utente.
++|**Termina riconoscimento su ricezione digits**|Selezionare se il riconoscimento può essere terminato dalla pressione di un digit da parte del chiamante.
  |**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento.
  |**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione.
  |**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative.
@@ -254,7 +254,7 @@
  Impostare i campi seguenti:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
  |//Salva frase riconosciuta in//|
  |(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
  |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
@@ -269,7 +269,7 @@
  Le funzionalità dei //Port di Uscita// del blocchetto sono le seguenti :
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
  |**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit.
  |**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit.
  |**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo.
@@ -279,7 +279,7 @@
  Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0;" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
  |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento.
  |**_ASR_Source**|(((
  Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono:

STT_skGenerale.jpg

Author

...	...	@@ -1,1 +1,0 @@
1		-XWiki.administrator

Size

...	...	@@ -1,1 +1,0 @@
1		-42.6 KB

Content

STT_skMessaggi.jpg

Size

@@ -1,1 +1,1 @@
--51.6 KB
++45.2 KB

Content

SpeechToText.png

Author

...	...	@@ -1,1 +1,0 @@
1		-XWiki.administrator

Size

...	...	@@ -1,1 +1,0 @@
1		-25.8 KB

Content

Changes for page 10 - Riconoscimento vocale

Summary

Details

Navigation

Collegamenti rapidi

Serve aiuto?

Changes for page 10 - Riconoscimento vocale

Summary

Details

Collegamenti rapidi

Serve aiuto?

Tag Cloud