Durante el año pasado Google se distinguió por impulsar el desarrollo de sus plataformas de Inteligencia Artificial (IA), que crecieron a un grado tal que ya no requieren de la intervención de humanos para aprender sus labores. Ahora, parece que la compañía quiere expandir aún más el horizonte y prepara una nueva IA, Tacotron 2.
PUBLICIDAD
El proyecto, presentado a través de arXiv.org, muestra los detalles de un nuevo sistema de lectura de Texto a Voz, que gracias a su red neuronal, impulsada por una plataforma de inteligencia artificial, puede emular a la perfección la voz de los humanos.
Cuando es puesto en acción Tacotron 2 crea un espectrograma del texto leído, que es una representación visual de cómo suena realmente el discurso. Dicha imagen se coloca a través del algoritmo WaveNet de Google, para que la inteligencia artificial imite de manera precisa las inflexiones del habla humana.
El algoritmo WaveNet puede aprender diferentes voces y generar respiraciones artificiales con facilidad, de modo que Tacotron 2 al interpretar el texto puede detectar la diferencia entre sustantivos y verbos en función del contexto y modifica su pronunciación en razón de ello.
El estudio afirma incluso que la plataforma es capaz de cambiar la intención de tono para elaborar enunciaciones en sentido interrogativo, si es esa la intención del texto procesado.
Tacotron 2 se encuentra aún en una fase relativamente preliminar de su desarrollo, y será necesario esperar un poco más para verlo en acción.
Pero el proyecto promete ser un digno complemento que marcará una nueva era en ese tipo de herramientas. Una buena señal de ello que ya lo relacionan con el número de la bestia:
PUBLICIDAD