Ann, una mujer de 47 años que sufrió cuadriplejía tras un derrame cerebral en 2005, recuperó la capacidad de hablar gracias a un nuevo dispositivo y los últimos avances en inteligencia artificial (IA).
Un equipo de investigadores de la Universidad de California en Berkeley y la Universidad de California San Francisco logró implantar una neuroprótesis con 253 electrodos directamente en el cerebro de Ann, la cual registra su actividad cerebral y la envía a una computadora. Esta, a su vez, traduce los pensamientos de Ann en palabras pronunciadas con una voz idéntica a la que tenía antes del derrame.
El dispositivo, descrito en la revista Nature Neuroscience, marca un avance significativo en el campo de las interfaces cerebro-computadora. A diferencia de los métodos anteriores, que generaban sonidos únicamente después de que los usuarios completaran una frase entera, este nuevo sistema permite detectar y transformar palabras en voz en solo tres segundos, de forma simultánea al pensamiento.
Los investigadores lograron este avance gracias a la integración de algoritmos de IA que decodifican las frases mientras la paciente las piensa y las reproducen en voz alta a través de una voz sintética. Esta tecnología es similar a la utilizada por dispositivos como Alexa y Siri.
«Nuestro enfoque de streaming incorpora la misma capacidad de decodificación rápida de voz de dispositivos como Alexa y Siri a las neuroprótesis», explicó Gopala Anumanchipalli, profesor adjunto de Ingeniería Eléctrica y Ciencias de la Computación en UC Berkeley y coinvestigador principal del estudio.
El dispositivo, que registra la actividad de miles de neuronas al mismo tiempo, fue entrenado con grabaciones de la boda de Ann para crear una voz sintética que reproduce su tono original.
El sistema logró generar entre 47 y 90 palabras por minuto, un avance considerable respecto a la versión previa de la tecnología y al dispositivo de comunicación asistida que Ann utilizaba anteriormente, el cual requería más de 20 segundos para emitir una sola frase.
Los investigadores continúan trabajando para mejorar la expresividad de la voz sintetizada, con el objetivo de reproducir variaciones en el tono, timbre o volumen que se producen durante el habla natural.
Este avance abre nuevas esperanzas para las personas con parálisis que han perdido la capacidad de hablar, permitiéndoles recuperar una forma de comunicación más natural y fluida.
