La revolución del reconocimiento de voz

Bookmark and Share

Emiliano Pontoriero

 

Uno de los mayores desafíos en las ciencias informáticas ha sido desde siempre el hacer que los ordenadores entiendan el lenguaje humano.

Este problema es algo en lo que se trabaja desde hace décadas, pero ha sido en estos últimos años cuando se han comenzado a lograr avances de gran importancia.

Sobre este tema, un equipo de investigadores de Microsoft ha logrado crear un sistema de reconocimiento de voz que transcribe palabras casi al nivel de los transcriptores profesionales. Los investigadores han reportado una tasa de error por palabra (WER) del sistema de 5,9% por debajo del 6,3% en promedio cometido por personas.

Este hito significa que, por primera vez, un ordenador puede reconocer las palabras en una conversación de la misma forma en la que lo haría una persona, y se trata de un objetivo que se ha logrado alcanzar al menos cinco años antes de lo que se tenía previsto.

La causa de este avance ha sido la evolución acelerada de la inteligencia artificial, la cual ha permitido crear modelos de lenguaje neural en los que las palabras se representan como vectores y se organizan agrupando aquellas que suenan de forma similar.

Esta tecnología será próximamente integrada en dispositivos de entretenimiento como Xbox, herramientas de accesibilidad como la transcripción instantánea de voz a texto y asistentes digitales personales como Cortana en Windows 10. Además, se podrá integrar dentro de los sistemas que desarrollamos, abriendo la puerta a una nueva generación de aplicaciones con las que las personas podrán interactuar de manera mucho más natural.

Habiéndose alcanzado este objetivo, los investigadores ya trabajan en el siguiente gran paso, el cual consiste en dotar a los sistemas de la comprensión real del lenguaje que han reconocido. Y aunque en este sentido ya se hayan logrado muchos avances, el camino será mucho más largo, pero igualmente fascinante.

¡Hasta el próximo post!

 

 

Grupo Finsi | NM formación y consultoría | Davinchi