Changes for page 10 - Riconoscimento vocale

Last modified by administrator BDP on 2024/10/21 14:52

From 55.1 to 56.1 From 71.1 to 72.1

From version 56.1

edited by administrator BDP
on 2024/10/11 16:05

Change comment: Upload new image "STT_skMotoreTTS.jpg", version 1.1

To version 71.1

edited by administrator BDP
on 2024/10/21 14:51

Change comment: There is no comment for this version

Raw
Rendered

Summary

Page properties (1 modified, 0 added, 0 removed)
Attachments (1 modified, 3 added, 0 removed)

Details

Page properties

Content

@@ -3,11 +3,16 @@
  [[image:acrobat-logo.png]]  [[Scarica la pagina come pdf>>https://wiki.ifmgroup.it/bin/export/ifmhelpplatform/MessengerServiziBase/VoiceRecognition/?format=pdf||rel="noopener noreferrer" target="new"]]
  )))
--{{box cssClass="floatinginfobox" title="**Sommario**" width="300px"}}
--{{toc start=2 depth="3"/}}
++{{box cssClass="floatinginfobox" width="300px" title="**Sommario**"}}
++{{toc start="2" depth="3"/}}
  {{/box}}
++(% class="box errormessage" %)
++(((
++**ATTENZIONE**: i caratteri **cancelletto** (#) e **dollaro** ($) sono considerati caratteri speciali in quanto definiscono i calldata e le transfer property. Se è necessario inserire uno di questi caratteri, in un qualsiasi campo, occorre specificarli in coppia, ad esempio "~#~#" oppure "$$".
++)))
++
  == GetAlfaNumCode (CGetAlfaNumCode) ==
  Richiede al chiamante, tramite riconoscimento vocale, il codice di identificazione alfanumerico, eseguendo un riconoscimento vocale per ogni carattere del codice. In alternativa è in grado di riconoscere anche i [[toni DTMF>>doc:Glossario.WebHome]]. E' necessario che sul sistema sia stato installato un motore di riconoscimento vocale SAPI compatibile, con relative licenze, non fornito con il Messenger oppure un motore integrato (disponibile solamente utilizzando [[LightHouse>>doc:Glossario.WebHome]]).
@@ -16,7 +16,7 @@
  **Parametri di Configurazione**
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0" %)|=(% style="width: 200px;" %)**Parametri**|**Descrizione**
  |**Tipo di motore di sintesi vocale**|(((
  Selezionare il tipo di motore tra i seguenti:
@@ -26,22 +26,22 @@
  |**Directory contenente i file wav/avi**|Indicare la directory, o selezionare dalla lista, tramite il pulsante //Browse//, in cui sono contenuti i messaggi che il sistema deve riprodurre al chiamante. La tabella sotto //Messaggi Disponibili //riporta l'elenco dei messaggi utilizzabili.
  |**Motore**|Selezionare il motore di riconoscimento vocale da utilizzare dal sistema. **Nota**: il suo valore dipende dai motori installati nel sistema.
  |**Abilita Beep di avviso ad inizio riconoscimento**|Indicare se deve essere emesso un breve segnale acustico prima di ogni fase di riconoscimento vocale.
--|**Termina riconoscimento su ricezione Digit**|Indicare se la fase di riconoscimento può essere interrotta dalla pressione di un tasto dal parte dell'utente. Se abilitato, i tasti numerici entrano a far parte del codice, mentre * e # concludono l'acquisizione dei caratteri (fine del codice).
++|**Termina riconoscimento su ricezione Digit**|Indicare se la fase di riconoscimento può essere interrotta dalla pressione di un tasto dal parte dell'utente. Se abilitato, i tasti numerici entrano a far parte del codice, mentre //asterisco// (*) e //cancelletto// (#) concludono l'acquisizione dei caratteri (fine del codice).
  |**Tempo massimo di attesa (secondi)**|Se è stato selezionato un motore SAPI, specificare il tempo massimo, in secondi, di ogni fase di riconoscimento vocale. Valore predefinito: 20 secondi.
  |**Massimo silenzio iniziale (secondi)**|Se è stato selezionato un motore integrato, specificare il periodo massimo di silenzio, in secondi, che il riconoscimento attende, prima che l'utente cominci a parlare, prima di uscire per fallimento.  Valore predefinito: 20 secondi.
--|**Soglia di affidabilità (0-100)**|Indicare un valore tra 1 e 100 che indica il grado di sicurezza con cui un carattere deve essere riconosciuto per poter essere considerato valido. Valori alti indicano maggiore precisione e, quindi, maggior probabilità di nessun riconoscimento. Valore predefinito: 70.
++|**Soglia di affidabilità
++(0-100)**|Indicare un valore tra 1 e 100 che indica il grado di sicurezza con cui un carattere deve essere riconosciuto per poter essere considerato valido. Valori alti indicano maggiore precisione e, quindi, maggior probabilità di nessun riconoscimento. Valore predefinito: 70.
  |**Numero massimo tentativi**|Numero massimo di tentativi in caso di codice non valido (nessuna digitazione).
  |**Lunghezza massima dei codici**|Numero massimo di digit del codice utente. Il tasto //Assegna Valore// consente di salvare il valore indicato in una costante, oppure recuperarlo da una Transfer Property o un Call Data.
  |**File Grammatica da utilizzare**|Nome del file contenente la [[grammatica>>||anchor="HGrammatica"]] da utilizzare. Il tasto //Assegna Valore// consente di salvare il valore indicato in una costante, oppure recuperarlo da una Transfer Property o un Call Data.
--|**Nome Transfer Property**|Selezionare la [[Transfer Property>>doc:ifmhelpplatform.MessengerConfigurator.TransferProperty.WebHome]] in cui viene salvati il codice acquisito.
++|**Nome Transfer Property**|Selezionare la [[Transfer Property>>doc:ifmhelpplatform.MessengerConfigurator.TransferProperty.WebHome]] in cui viene salvato il codice acquisito.
  |**Servizio successivo se riconoscimento valido**|//Solamente configurando il Servizio tramite Messenger Configurator//. Selezionare dall'elenco il servizio da attivare nel caso di codice riconosciuto e confermato dall'utente.
  |**Servizio successivo per mancato riconoscimento**|//Solamente configurando il Servizio tramite Messenger Configurator//. Selezionare dall'elenco il servizio da attivare nel caso di codice NON riconosciuto o NON confermato dall'utente.
--| |
  **Messaggi Disponibili**
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0;" %)|=(% style="width: 200px;" %)**Nome File**|**Messaggio**
++(% style="background-color:#f0f0f0" %)|=(% style="width: 200px;" %)**Nome File**|**Messaggio**
  |**IntroMessage.wav**|Messaggio di accoglienza con istruzioni per l'inserimento del proprio codice.
  |**CharNotRecognized.wav**|Comunica che il riconoscimento del carattere corrente non è andato a buon fine.
  |**RecognizedCodeIs.wav**|Messaggio del tipo: //"Il codice riconosciuto è...".//
@@ -178,7 +178,7 @@
  //Scheda Generale//
--[[image:WAV_skGenerale.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
++[[image:STT_skGenerale.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
  Selezionare la casella **Utilizzare TTS invece che messaggi WAV** per indicare che si vuole usare il TTS. In questo caso viene visualizzata anche la scheda //Motore TTS// per l'impostazione dei parametri del relativo motore. Inoltre occorre indicare anche il numero massimo di tentativi disponibili in caso di mancato riconoscimento.
@@ -191,7 +191,7 @@
  //Scheda Messaggi per TTS//
--[[image:STT_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
++[[image:STT_skMessaggiTTS.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
  L'elenco dei campi visualizzati è il seguente:
@@ -203,7 +203,7 @@
  //Scheda Messaggi per WAV//
--[[image:WAV_skMess.png||height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
++[[image:STT_skMessaggiWav.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
  Caricare e selezionare dalla lista i messaggi audio da riprodurre all'utente, utilizzando i tasti **Nuovo**, **Modifica** e **Cancella** per selezionare e impostare il tipo di messaggio da riprodurre all'utente tra i seguenti:
@@ -216,51 +216,75 @@
  * Data/Ora attuale
  * Data/Ora del file
  * Ordinale
++\\
  //Scheda Motore TTS//
--[[image:STT_skMotoreTTS.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
++[[image:STT_skMotoreTTS.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
  Impostare il campo seguente:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
  |**Engine Name**|Selezionare il motore di sintesi da utilizzare. L'elenco dei motori disponibili corrisponde a quelli definiti nel server TTSASR.
  //Scheda Motore STT//
--[[image:attach:SpeechToText.png||alt="STT_skMotoreSST.png" height="518" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
++[[image:STT_skMotoreSTT.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
  Impostare i campi seguenti:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
  |**Motore di riconoscimento vocale da utilizzare**|Selezionare il motore di riconoscimento da utilizzare. Al momento l’unico motore disponibile e configurabile è //Google Speech API//.
  |**Codice Lingua**|Indicare il codice della lingua, in formato [[BCP-47>>https://it.wikipedia.org/wiki/Codice_di_lingua_IETF||rel="noopener noreferrer" target="_blank"]], da utilizzare per il riconoscimento. Valore predefinito: //it-IT//.
--|**Termina riconoscimento su ricezione digits dopo**|Selezionare per abilitare l'interruzione della play del messaggo di invito a parlare, sia riprodotto da file che tramite //TextToSpeech//. il tempo, espresso in millisecondi, indica dopo quanto deve essere terminata la fase di riconoscimento in seguito alla pressione di un digit dda parte dell'utente.
++|**Termina riconoscimento su ricezione digit dopo**|Selezionare per abilitare l'interruzione della play del messaggo di invito a parlare, sia riprodotto da file che tramite //TextToSpeech//. il tempo, espresso in millisecondi, indica dopo quanto deve essere terminata la fase di riconoscimento in seguito alla pressione di un digit dda parte dell'utente.
  |**Abilita beep di avviso ad inizio riconoscimento**|Selezionare per abilitare il suono di avviso nel momento di inizo del riconoscimento.
  |**Abilita riconoscimento durante la play (BargeIn)**|Selezionare se si vuole far partire il riconoscimento dell'audio già durante la riproduzione.
  |**Restituisce l'accuratezza del riconoscimento**|Selezionare se si vuole restituire al Messenger iI punteggio di confidenza del riconoscimento per confrontare l'accuratezza relativa di più alternative.
  |**Abilita riconoscimento espressione singola**|Selezionare si si vuole migliorare la modalità di riconoscimento di singoli comandi o parole, oppure di frasi brevi e concise, ad esempio //sì// o //no//.
--|**Tempo massimo di attesa**|Indicare il tempo massimo consentito, espresso in secondi, al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.
++|**Tempo massimo di attesa**|(((
++Indicare il tempo massimo, espresso in secondi, consentito al chiamante per effettuare la sua scelta vocale. Valore predefinito: 30 secondi.
++
++**NOTA BENE**: questo valore ha SEMPRE la precedenza sui parametri aggiuntivi (//SpeechEndTimeout// e //SpeechStartTimeout//), quindi la fase di riconoscimento termina dopo il numero di secondi impostato in tale parametro anche se l’utente sta ancora parlando. Questo valore deve essere sempre  superiore ai valori indicati nei parametri aggiuntivi.
++)))
  |**Soglia di affidabilità**|Indicare il livello di affidabilità, tra 0 e 100, da raggiungere per considerare il riconoscimento valido. Valore predefinito: 70.
  |**Suggerimenti**|Da utilizzare per migliorare la capacità di riconoscimento di parole attese. Indicare una serie di parole separate dal carattere "~|" (pipe), ad esempio //si~|no~|abbastanza~|poco~|//.
--|**Parametri avanzati**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.
++|**Valore Parametri**|Opzionale. È possibile indicare un valore numerico dato dalla combinazione dei valori del BargeIn (1) , accuratezza (2), espressione singola (4), che corrispondono alle caselle sopra visualizzate. Espressi in questo modo possono essere configurati tramite una //transfer property// creata da blocchetti precedenti. Il valore di questo campo e i checkbox sono combinati, quindi se come parametro avanzato si imposta, ad esempio, il valore //4// (abilita espressione singola) e poi si selezionano le caselle //Abilitazione BargeIn// e //Restituisci accuratezza,// il valore finale che verrà inviato al motore di STT sarà //7//.
++//Scheda Parametri aggiuntivi//
++
++In questa scheda è possibile indicare alcuni parametri aggiuntivi relativi all'aggiornamento di versione delle API Google di riconoscimento vocale (da V1 a V2).
++
++[[image:STT_skParAgg.jpg||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
++
++I parametri aggiuntivi predefiniti sono i seguenti:
++
++(% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
++(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
++|**Model**|Indicare il modello di apprendimento automatico interessato. Il modello consigliato è //telephony// (modello più accurato per trascrivere l'audio telefonico).
++|**SpeechEndTimeout**|Indicare il //timeout//, espresso in secondi, che interrompe la comunicazione con l'utente se l'audio vocale non inizia entro il periodo stabilito, cioè se la pausa iniziale supera la durata del timeout.
++|**SpeechStartTimeout**|Indicare il //timeout//, espresso in secondi, che interrompe la comunicazione con l'utente se l'audio vocale non riprende entro il periodo stabilito, cioè se c'è un pausa tra due frase che supera la durata del timeout.
++|**StopAsFirstIsFinal**|Indicare se dopo il primo riconoscimento parziale l’engine si deve fermare dal riconoscimento (//true//) o continuare fino al timeout impostato (default: //false//). Questo parametro, se presente, sovrascrive il valore impostato nella opzione //Abilita riconoscimento espressione singola// presente sulla vecchia scheda.
++|**EnableAutomaticPunctuation**|Se si abilita questa impostazione (//true//), l'applicazione deduce automaticamente la presenza di punti, virgole e punti interrogativi nella trascrizione dei dati audio e li aggiunge alla trascrizione.
++|**ProfanityFilter**|Se si abilita questa impostazione (//true//), l'engine tenterà di rilevare le parole volgari e, nel caso, restituire solo la prima lettera seguita da asterischi nella trascrizione dei dati audio (ad esempio, c~*~**). Se questo campo viene impostato //false //o non viene configurato, l'engine non effettuerà il filtraggio dell'audio.
++
++====  ====
++
  //Scheda Salvataggio scelta//
--[[image:WAV_skSalva.png||height="517" style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
++[[image:WAV_skSalva.png||style="-moz-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); -webkit-box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); box-shadow:5px 5px 10px 0px rgba(204,204,204,0.8); margin:20px 20px" width="400"]]
  Impostare i campi seguenti:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
  |//Salva frase riconosciuta in//|
  |(% style="text-align:right" %)**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
  |(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il testo convertito (in caso di riconoscimento con successo) o il digit premuto.
  |//Salva confidence in//|
--|**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza.
--|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza.
++|**Nome Transfer Property**|Selezionare dall'elenco la //transfer property// in cui salvare il valore del livello di accuratezza (confidence).
++|(% style="text-align:right" %)**CallData**|Indicare il //CallData// in cui salvare il valore del livello di accuratezza (confidence).
  ==== Port di Uscita ====
@@ -269,7 +269,7 @@
  Le funzionalità dei //Port di Uscita// del blocchetto sono le seguenti :
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
  |**Failure**|Indicare il servizio successivo da attivare nel caso in cui il motore non riconosca l'audio e non sia premuto dal chiamante alcun digit.
  |**Digit Detected**|Indicare il servizio successivo da attivare nel caso in cui il riconoscimento sia interrotto dalla pressione di un digit.
  |**Success**|Indicare il servizio successivo da attivare nel caso il riconoscimento abbia successo.
@@ -279,7 +279,7 @@
  Oltre alla Transfer Property definita in fase di configurazione, il blocchetto crea le due seguenti Transfer Property di sistema che possono essere eventualmente usate dai blocchetti successivi:
  (% border="1" style="border:1px solid #cccccc; margin-bottom:50px" %)
--(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametri**|**Descrizione**
++(% style="background-color:#f0f0f0" %)|(% style="width:200px" %)**Parametro**|**Descrizione**
  |**~_~_RecognizeResult~_~_**|Contiene l’esito della richiesta di riconoscimento.
  |**_ASR_Source**|(((
  Contiene la sorgente dell’informazione contenuta nella Transfer Property e nel CallData definiti in configurazione. I valori possibili sono:

STT_skSalvataggio.jpg

Size

@@ -1,1 +1,1 @@
--37.7 KB
++53.3 KB

Content

STT_skMessaggiTTS.jpg

Author

...	...	@@ -1,0 +1,1 @@
	1	+XWiki.administrator

Size

...	...	@@ -1,0 +1,1 @@
	1	+43.6 KB

Content

STT_skMessaggiWav.jpg

Author

...	...	@@ -1,0 +1,1 @@
	1	+XWiki.administrator

Size

...	...	@@ -1,0 +1,1 @@
	1	+51.7 KB

Content

STT_skParAgg.jpg

Author

...	...	@@ -1,0 +1,1 @@
	1	+XWiki.administrator

Size

...	...	@@ -1,0 +1,1 @@
	1	+58.9 KB

Content

Changes for page 10 - Riconoscimento vocale

Summary

Details

Navigation

Collegamenti rapidi

Serve aiuto?

Changes for page 10 - Riconoscimento vocale

Summary

Details

Collegamenti rapidi

Serve aiuto?

Tag Cloud