Un descodificador lee los pensamientos grabados por un escáner cerebral

El sistema capta el sentido de las frases más que su literalidad gracias a la inteligencia artificial

A tres sujetos les hicieron oír un podcast del New York Times y monólogos de un popular programa anglosajón mientras les escaneaban el cerebro. Con un descodificador diseñado por ellos, científicos estadounidenses lograron convertir las gráficas del escáner cerebral no solo en frases completas, sino en textos que reproducían con gran fidelidad lo que habían oído. Según sus resultados, publicados hoy en la revista científica Nature Neuroscience, este descodificador que han llamado “semántico” fue capaz también de verbalizar lo que pensaban y, aún más, lo que les pasaba por la cabeza mientras veían cine mudo.

Desde comienzos de siglo, y en especial en la última década, se han producido grandes avances en el diseño de interfaces cerebro-máquina (ICB). La mayoría buscaban que personas incapaces de hablar o de mover incluso todos sus músculos pudieran comunicarse. Pero la mayor parte de estos sistemas necesitan abrir el cráneo y colocar una serie de electrodos directamente en el cerebro. Otro enfoque, menos invasivo, se apoya en la técnica de imagen por resonancia magnética funcional (fMRI). Aquí, la interfaz acaba en un gorro lleno de electrodos que se coloca sobre la cabeza. Este gorro no registra la actividad neuronal directa, sino los cambios en el nivel de oxígeno en sangre que esta provoca. Esto planteaba problemas de resolución. Por un lado, por el acceso desde fuera y, por el otro, los cambios en aquel nivel se producen en intervalos de hasta 10 segundos y en ese lapso se pueden decir muchas palabras.

Para solventar estos problemas, un grupo de investigadores de la Universidad de Texas (Estados Unidos) se han apoyado en un sistema de inteligencia artificial que sonará familiar a muchos: GPT, el mismo en el que se apoya el bot ChatGPT. Este modelo de lenguaje, desarrollado por el laboratorio de inteligencia artificial OpenAI, usa aprendizaje profundo para generar texto. En esta investigación, lo entrenaron con las imágenes fMRI del cerebro de tres personas a las que hicieron oír 16 horas de audios de un consultorio del New York Times y del programa The Moth Radio Hour. De esta manera pudieron hacer corresponder lo que veían con su representación en la cabeza. La idea es que, cuando volvieran a oír otro texto, el sistema pudiera ir anticipándolo basándose en los patrones de lo ya aprendido. “Se trata del GPT original, no como el nuevo [ChatGPT se apoya en la última versión de GPT, la 4]. Recopilamos una tonelada de datos y luego construimos este modelo, que predice las respuestas cerebrales a las historias”, dijo en una conferencia vía web la pasada semana Alexander Huth, neurocientífico de la universidad tejana. Con este procedimiento, el descodificador propone secuencias de palabras “y para cada una de esas palabras que pensamos que podrían venir a continuación, podemos medir lo bien que suena esa nueva secuencia y, al final, vemos si coincide con la actividad cerebral que observamos”, detalla.

A este descodificador lo han llamado semántico y con acierto. Anteriores interfaces registraban la actividad cerebral en las áreas motoras que controlan la base mecánica del habla, es decir, los movimientos de boca, laringe o lengua. “Lo que pueden descodificar es cómo la persona está tratando de mover la boca para decir algo. Nuestro sistema funciona en un nivel muy diferente. En lugar de fijarnos en el ámbito motor de bajo nivel, trabaja en el nivel de las ideas, de la semántica, del significado. Por eso no registra las palabras exactas que alguien escuchó o pronunció, sino su sentido”, explica Huth. Para esto, aunque las resonancias registraban la actividad de varias zonas cerebrales, se centraron más en las relacionadas con la audición y el lenguaje.

Una vez entrenado el modelo, los científicos lo probaron con media docena de personas que tuvieron que oír textos diferentes a los usados en el entrenamiento del sistema. La máquina descodificó las imágenes fMRI con una gran aproximación a lo que contaban las historias. Para confirmar que el ingenio operaba en el nivel semántico más que en el motor, repitieron los experimentos, pero esta vez pidiendo a los participantes que imaginaran ellos una historia y después la escribieran. Encontraron una gran correspondencia entre lo descodificado por la máquina y lo escrito por los humanos. Aún más difícil todavía, en una tercera tanda, los sujetos tuvieron que ver escenas de cine mudo. Aunque aquí el descodificador semántico falló más en las palabras concretas, seguía captando el sentido de las escenas.

El neurocientífico Christian Herff lidera la investigación en interfaces cerebro máquina en la Universidad de Maastricht (Países Bajos) y hace casi una década creó una ICB que permitió convertir en texto, letra a letra, las ondas cerebrales. Herff, que no ha participado en este nuevo ingenio, destaca la incorporación del predictor de lenguaje GPT. “Esto es realmente genial, ya que las aportaciones de GPT contienen la semántica del habla, no las propiedades articulatorias o acústicas, como se hacía en anteriores ICB”, dice.

Esta pieza fue elaborada por Miguel Ángel Criado.

Puedes seguir leyendo aquí este artículo completo en El País:

https://elpais.com/ciencia/2023-05-01/un-descodificador-lee-los-pensamientos-grabados-por-un-escaner-cerebral.html