La sintesi vocale (TTS) è una forma di sintesi vocale che converte il testo su una pagina, come un file della guida o una pagina Web, in un output vocale parlato. La sintesi vocale può essere utilizzata per cose come leggere un messaggio di testo a qualcuno che sta guidando o leggere le informazioni sul display del computer per una persona ipovedente. Può prendere qualsiasi messaggio di testo e trasformarlo in un messaggio verbale di facile comprensione. Sebbene la sintesi vocale possa mancare dell'espressione emotiva prodotta naturalmente da una voce umana, la sintesi vocale è in genere molto accurata. I sistemi TTS possono essere utilizzati da:
- Studenti con dislessia
- Lettori in movimento
- Multitasking, come un fornaio, che vuole che la ricetta sia letta ad alta voce
- Lettori anziani
- Lettori visivamente impauriti
- Studenti di lingue straniere
TTS vs. sistemi di risposta vocale
La sintesi vocale non deve essere confusa con i sistemi di risposta vocale (VRS). Un sistema di risposta vocale, noto anche come risposta vocale interattiva, sintetizza il parlato concatenando frasi da un database di parole preregistrate e viene utilizzato per uno scopo diverso rispetto a un sistema TTS, che forma frasi e / o frasi in base ai grafemi e ai fonemi di una lingua.
I sistemi di risposta vocale si limitano a sintetizzare frasi che contengono solo parole che sono state predeterminate dal sistema. I sistemi TTS, al contrario, sono teoricamente in grado di "leggere" qualsiasi stringa di caratteri di testo per formare frasi originali.
In poche parole, un VRS è una voce registrata che viene riprodotta quando un chiamante squilla. Suona come una voce umana e quella voce offre al chiamante opzioni, come la pressione di un determinato numero sulla tastiera del telefono per eseguire una determinata azione . Ad esempio, un VRS potrebbe dire: "Se desideri parlare con il reparto fatturazione, premi due". Dopo aver premuto due, attiva l'azione di trasferimento della chiamata al reparto fatturazione.
Tuttavia, VRS non sarebbe disponibile se non fosse per i sistemi TTS. TTS è responsabile di dare voce a tutto il testo scritto da un servizio VRS. Per le aziende, è vantaggioso disporre sia di un sistema TTS che di VRS. Avere un sistema di sintesi vocale consente a un'azienda di raggiungere una nuova fascia demografica della società che include coloro che sono ipovedenti o hanno problemi di lettura. La chiamata può essere preregistrata in qualsiasi lingua, il che significa che le barriere linguistiche vengono rimosse. Con la combinazione di un sistema TTS e VRS, un'azienda può inviare ai clienti messaggi sia in formato audio che di testo, consentendo una migliore connettività e comunicazioni più veloci.