Quali sono e come funzionano i text to speech

Qualcuno che parli al posto nostro? Ecco quali sono e come funzionano i text to speech.

Col termine text to speech si intende una tecnologia in grado di applicare una sintesi vocale, quindi in grado di leggere sfruttando una voce umana sintetizzata un qualsiasi testo scritto. Si trova molto spesso abbreviato in TTS.

Il sistema funziona grazie ad una perfetta gestione di parole base registrate in precedenza e contenute all’interno di un database. Il fatto che questi database debbano contenere una gran quantità di dati dice che questi possono avere dimensioni esagerate; nell’ordine di qualche Gigabyte.

I text to speech possono leggere a diverse velocità.

Decisamente interessante è il fatto che, almeno per quanto riguarda i software per tradurre da testo a voce, con una qualità migliore verrà rispettata anche una punteggiatura con pause che seguono a punti o virgole.

Inoltre la qualità dei text to speech migliora quando la voce riprodotta si avvicina a quella umana, e quindi viene compresa con più facilità.

I software text to speech possiedono una parte di tipo front-end e una di back-end. La prima converte il testo in simboli fonetici mentre la seconda li trasforma e li legge utilizzando proprio la voce artificiale.

L’approccio text-to-phoneme tuttavia può essere di due tipi: o basato sull’utilizzo di uno specifico dizionario che contiene le parole nella lingua desiderata, oppure sulle regole di pronuncia applicata alle parole.

Esistono molte piattaforme e software di text to speech.

Tra i software di text to speech più interessanti ci sono:

Il primo permette di utilizzare molte utili funzionalità, anche il secondo si pone su un buon, pari, livello. Si tratta di software utili per ottenere ad esempio degli audio-libri ben fatti.

In ogni caso si tratta di software molto semplici da utilizzare e utilizzabili davvero da chiunque.

Fra i molti software troviamo in Rete anche DSpeech.

Si tratta di un programma di Text to Speech, ma anche di “Automatic Speech Recognition”.

Cosa significa? Semplice é può leggere un testo pronuncia le frasi seguendo le risposte vocali dell’utente. Anche in questo caso le funzionalità sono molte.

Dettagli a favore :

  • non si installa
  • occupa poca memoria
  • salvare i file in formato : Wav, Mp3, Aac, Wma o Ogg.
  • Combina voci diverse anche per creare dialoghi fra più voci.
  • Varia e voci in modo dinamico, inserendo pause, enfasi, e altro ancora.

 

Condividi il contenuto su...Share on Facebook
Facebook
Tweet about this on Twitter
Twitter
Pin on Pinterest
Pinterest
Share on LinkedIn
Linkedin
Email this to someone
email
Print this page
Print

Potrebbero interessarti anche...