El MIT desarrolla un algoritmo que reproduce el rostro con la voz

Un equipo de investigadores del MIT ha sido capaz crear una red neuronal qué logra crear una imagen aproximada del rostro de una persona gracias exclusivamente al sonido de la voz.

Para ello han utilizado el algoritmo Speech2Face, qué costa de un sistema que funciona en varias etapas, en la primera se crea lo que han denominado ” expresión facial neuronal del individuo”, en la segunda se realiza un espectrograma del audio para determinar las peculiaridades vocales y físicas del rostro y por último con esos datos se genera la imagen aproximada del rostro.

Para la realización del total de las pruebas los investigadores del Instituto de Tecnología de Massachusetts sometieron a prueba en este sistema más de un millón de audiciones, entrenando hasta inteligencia artificial para ser capaz de detectar la edad, la pertenencia étnica y el sexo de los individuos analizados.

Los científicos seguirán perfeccionando este algoritmo puesto que su precisión ha resultado ser relativamente pobre, con un margen de error bastante evidente, en el caso de la edad fue de hasta 10 años.

Los investigadores han manifestado que se centrarán en intentar educar a la IA para extraer los datos con los menores errores posibles y añadir la detección de nuevas características a la inteligencia artificial.




Leave a Reply

Your email address will not be published.


Comment


Name

Email

Url