C’era una volta l’uomo, un essere evoluto, bipede, col pollice verde, ehmm… col pollice verso e una presunta intelligenza superiore al resto degli esseri viventi.
L’intelligenza è presunta, visto quello che stiamo combinando e visto il nostro modo di gestire certe circostanze, ma una cosa è certa: l’uomo è in grado di esprimersi e parlare come nessun altro essere vivente sul pianeta terra può fare.
Proprio perché l’intelligenza è presunta, in nome del denaro e del progresso tecnologico… stiamo facendo in modo che anche la nostra voce possa essere clonata con un discreto successo. Non che ci sia niente di male, realizzare delle voci sintetiche ma naturali può essere utile in uno svariato numero di contesti (è utile in caso di disabilità ad esempio), ma si sta superando un po’ il confine.
Da un po’ di tempo seguo assiduamente il canale YouTube Booth Junkie, dello speaker americano Mike DelGaudio. Mike usa Reaper e sul suo canale da diversi consigli su come personalizzare il programma per le esigenze di un voice talent, oltre a fornire suggerimenti pratici a chi inizia ma anche a chi fa questo lavoro da un bel po’.
Come tutti noi speaker Mike partecipa a diversi casting, vale a dire che registra parti di script che poi valgono come provini per i clienti. Questi casting possono arrivare dal suo sito, dalle varie agenzie di produzione audio o da portali per freelance creativi, come ad esempio Upwork.
Mike nel video racconta che in uno di questi casting ha letto una frase magica grazie alla quale ha implicitamente dato l’autorizzazione ai committenti a creare un TTS, quindi una sintesi vocale a partire dalla sua voce.
Non mi è molto chiaro di quanto audio si abbia bisogno per creare una sintesi vocale, una tecnologia presentata da Adobe parlava però di appena 20 minuti. Di questa tecnologia non se ne è più parlato, ma se è veramente bastato il testo di un casting per creare una voce di qualità tutto sommato accettabile, forse è il caso di cominciare a registrare demo con la musica di sottofondo, o per lo meno a fare più attenzione rispetto a cosa si legge.
Nel video sotto potrete ascoltare la voce sintetizzata di Mike.
Pare che quelli di questo script non siano gli unici a fare uso di metodi un po’ truffaldini: voices.com, infatti, un sito per i voice talent discretamente famoso nel nostro settore ha preso un accordo con Vocal ID (brand creatore di voci) e, anche se di fatto non ammette direttamente di vendere il proprio parco voci a questa società, in un punto del contratto è chiaramente spiegato che qualsiasi diritto sui file prodotti attraverso voices.com va, appunto, a voices.com, e l’utente non potrà pretendere nulla in proposito.
Occhi aperti dunque, già una volta un cliente mi ha chiesto se una sintesi vocale non fosse la mia voce… e non è stata una bella sensazione.