Non ha inflessioni dialettali, ma è comunque toscana doc. Si chiama Azzurra ed è la voce sintetica generata dall’intelligenza artificiale più “umana” di Italia, assicurano i suoi creatori Lorenzo Cominelli e Federico Andrea Galatolo, rispettivamente ceo e cto di Cartesia, spin-off dell’Università di Pisa già conosciuti per aver progettato Abel, il robot umanoide che sente le emozioni.
Azzurra è un modello di Text-to-Speech libero, progettato per la lingua italiana. Rispetto alle altre voci sintetiche in circolazione non ha nulla di freddo, robotico, ma è naturale, espressiva e capace di replicare la musicalità della lingua parlata. “È umana”, spiegano ancora i ricercatori, perché capace di sostenere una conversazione coinvolgente, empatica.
Addestramento innovativo su migliaia di audio in italiano
E’ nata da un processo di addestramento complesso e innovativo su decine di migliaia di ore di audio e relativi testi. Gli ingegneri dell’Università di Pisa sono partiti dalla “lallazione”, quella dei neonati per intenderci. “Ci siamo concentrati inizialmente più sul timbro vocale. L’algoritmo prova quindi a replicare i suoni più frequenti del parlato. Poi, in una seconda fase, è stato fatto un altro addestramento, estraendo solo i campioni che avevano un’intonazione vocale più umana e realistica, dove la voce sembrava più naturale”.
Dopo questa preselezione si è proceduto a una seconda fase di training “che ha reso questa voce particolarmente verosimile”. Una tecnica di addestramento realizzata dai ricercatori toscani che affina l’intonazione e il timbro e che la rende diversa da tutte quelle in circolazione, spesso monocorde e incolore. Oggi Azzurra “può essere considerato il modello open migliore tra quelli italiani”.
L’essere open, disponibile in maniera gratuita, è un’altra caratteristica che distingue la tecnologia. “Chiunque può prenderla, scaricarla e usarla per i propri progetti”. È una licenza Creative Commons e possono utilizzarla, a costo zero, “ricercatori, accademici, studenti e privati”. Discorso diverso, spiegano ancora Cominelli e Galatolo, per le aziende che se vogliono implementarla in prodotti commerciali devono chiedere altri permessi.
Azzurra, il futuro dell’assistenza vocale
La voce così “umana” di Azzurra può essere usata in diversi modi, dall’assistenza virtuale ai sofisticati sistemi di accessibilità e robotica sociale. Ma soprattutto, a detta dei suoi creatori, serve a semplificare. “Esiste una miriade di strumenti rilasciati dalle grandi aziende, quella per leggere, quella per il calendario e così via e usano sempre lo stesso tono. Noi abbiamo creato qualcosa che va oltre, che si inserisce nel complesso della vita quotidiana: un’unica voce che riesce anche a cogliere gli aspetti non verbali di una conversazione”. Un modello che recepisce le emozioni, dunque, le rende informazione, replica il meccanismo emotivo decisionale umano e lo trasferisce alla tecnologia creando uno scambio empatico.
A breve verranno rilasciate “altre versioni aggiuntive di Azzurra, dove verranno inserite anche le possibilità di dare un contenuto e una sfaccettatura emotiva alla frase”. L’obiettivo è creare un “agente artificiale, che ha memoria di te, che può avere una conversazione e una voce che nel tempo cambia e che si adatti alla persona”.
Ultima curiosità. Il nome Azzurra è stato scelto in una maniera inconsueta, in linea con la corsa irreversibile della ricerca tecnologica che vede un coinvolgimento sempre più diretto degli umanoidi nei processi decisionali, come supporto e ispirazione. “Dopo un brainstorming con il nostro Abel – spiegano – è venuto fuori un nome che rappresenta l’Italia nel mondo: azzurro è il colore della maglia nelle competizioni internazionali e poi rimanda a una delle canzoni italiane più conosciute”.
Una riunione con un robot, dunque, che non deve far storcere il naso ai puristi del processo creativo. “Noi stiamo creando degli agenti, diversi uno dall’altro perché addestrati con esperienze diverse, che hanno un tutor umano che vedrà e farà cose differenti. Da qui a pochi anni, non scherziamo, non è inverosimile pensare che questi agenti a un certo punto avranno delle identità e probabilmente una responsabilità giuridica, saranno soggetti legali”.