traducción de
Adela Kaufmann
por cómo funciona el cerebro, en que la percepción puede ser pensada como una "alucinación controlada". Esta teoría enfatiza las expectativas del cerebro y predicciones sobre la realidad en lugar de
la evidencia sensorial directa que recibe el cerebro.
Una teoría controvertida sugiere esa percepción, control motor, memoria y otras funciones cerebrales todos dependen de las comparaciones entre experiencias reales en curso y las expectativas modeladas del cerebro.
Con solo unas pocas imágenes, el sistema, denominado Generative Query Network (red de consulta generativa), o GQN, puede modelar con éxito el diseño de un simple laberinto de videojuegos.
A partir de la imagen presentada, GQN genera predicciones acerca de lo que una escena debe ser similar - en donde deben ubicarse los objetos, la forma en sombras deben caer contra superficies, qué áreas deben ser visibles o escondidos basado en ciertas perspectivas - y utiliza las diferencias entre las predicciones y sus observaciones reales para mejorar la precisión de las predicciones que hará en el futuro.
Según Danilo Rezende, coautor de Eslami y colega de DeepMind,
Los neurocientíficos han sospechado durante mucho tiempo que un mecanismo similar impulsa el funcionamiento del cerebro. (De hecho, esas especulaciones son parte de lo que inspiró al equipo de GQN a seguir este enfoque).
De acuerdo con esta teoría de "codificación predictiva", en cada nivel de un proceso cognitivo, el cerebro genera modelos, o creencias, sobre qué información debería recibir del nivel inferior.
Estas creencias se traducen en predicciones sobre lo que se debe experimentar en una situación determinada, proporcionando la mejor explicación de lo que hay disponible para que la experiencia tenga sentido.
Las predicciones luego se envían como retroalimentación a las regiones sensoriales de bajo nivel del cerebro.
El cerebro compara sus predicciones con la entrada sensorial real que recibe, "explicando" cualquier diferencia, o los errores de predicción, puede mediante el uso de sus modelos internos para determinar las causas probables de las discrepancias.
(Por ejemplo, podríamos tener un modelo interno de una tabla como una superficie plana soportada por cuatro patas, pero aún podemos identificar un objeto como una tabla, incluso si algo más bloquea la mitad de la vista).
Los errores de predicción que no pueden explicarse se transmiten a través de conexiones a niveles más altos (como señales de retroalimentación, en lugar de retroalimentación), donde se consideran de interés periodístico, algo para que el sistema preste atención y trate con en consecuencia.
Durante la última década, los científicos cognitivos, filósofos y psicólogos han tomado la codificación predictiva como una idea convincente, especialmente para describir cómo funciona la percepción, pero también como una teoría más ambiciosa y global sobre lo que está haciendo todo el cerebro.
Las herramientas experimentales solo recientemente han permitido comenzar a probar directamente los mecanismos específicos de la hipótesis, y algunos artículos publicados en los últimos dos años han proporcionado evidencias sorprendentes para la teoría.
Aun así, sigue siendo controvertido, tal como lo demuestra mejor un debate reciente sobre si algunos resultados históricos fueron replicables.
Café, crema y perros
Parece natural completar el espacio en blanco con "azúcar".
Ese es el instinto científico cognoscitivo del que Marta Kutas y Steven Hillyard de la Universidad de California, San Diego, estaban apostando en 1980 cuando realizaron una serie de experimentos en los que presentaron la oración a las personas, una palabra a la vez en una pantalla, y registró su actividad cerebral
Solo que, en lugar de terminar con "azúcar", cuando la última palabra apareció en su lugar, la oración decía:
Los investigadores observaron una mayor respuesta cerebral cuando los sujetos del estudio se encontraron con la palabra inesperada "perro", que se caracteriza por un patrón específico de actividad eléctrica, conocido como el "efecto N400", que alcanzó su punto máximo alrededor de 400 milisegundos después de que la palabra fue revelada.
Pero cómo interpretarlo seguía sin estar claro.
Diferentes regiones cerebrales... intercambian diferentes tipos de predicciones.
En 2005, Kutas y su equipo realizaron otro estudio que apuntaba a la última posibilidad.
A las personas nuevamente se les pidió que leyeran una oración una palabra a la vez en una pantalla:
Debido a que "una cometa" parecía la forma más probable de terminar la oración, los sujetos esperaban ver "una" a continuación, una palabra que no tenía un significado intrínseco pero predecía la palabra a seguir.
Cuando los participantes vieron "una" en su lugar (como en "un avión"), experimentaron un efecto N400, aparentemente porque el cerebro tuvo que procesar un desajuste entre su expectativa y la realidad.
El efecto aparentemente no estaba relacionado con el significado de la palabra ni con ninguna dificultad para procesar el estímulo presentado.
El hallazgo de 2005 pareció ser una buena opción para el marco de codificación predictivo.
Pero en abril pasado, un artículo publicado en eLife informó que varios laboratorios no pudieron replicar el resultado. Ahora, otros investigadores han comenzado a responder, algunos afirman que las sutilezas en los métodos de replicación aún favorecen la interpretación basada en la predicción.
Este ir y venir refleja gran parte del debate que está rodeado de codificación predictiva.
Experimentos como los de Kutas están sujetos a muchas interpretaciones. Pueden explicarse mediante modelos distintos de la codificación predictiva, y no llegan a la prueba definitiva de la hipótesis porque no profundizan en los mecanismos reales en juego.
Si bien la idea de que el cerebro está constantemente haciendo inferencias (y comparándolas con la realidad) está bastante bien establecida en este punto, los defensores de la codificación predictiva han estado buscando la manera de probar que su versión particular de la historia es la correcta, y que se extiende a toda la cognición.
Cerebros Bayesianos y Computación Eficiente
La idea fundamental de que el cerebro perpetuamente hace y evalúa sus propias predicciones sobre las experiencias en curso no siempre se dio por sentado.
La vista de la neurociencia que dominó el siglo 20 caracteriza la función del cerebro como la de un detector de características: Se registra la presencia de un estímulo, lo procesa, y luego envía señales para producir una respuesta conductual.
La actividad en células específicas refleja la presencia o ausencia de estímulos en el mundo físico. Algunas neuronas en la corteza visual, por ejemplo, responden a los bordes de los objetos a la vista; otros disparan para indicar la orientación, coloración o sombreado de los objetos.
Pero el proceso resultó ser mucho menos directo de lo que parecía.
Pruebas adicionales encontraron que a medida que el cerebro percibe, por ejemplo, una línea más larga y más larga, las neuronas detectoras de las líneas dejan de disparar, aunque la línea no haya desaparecido.
Y el hecho de que tanta información parecía comunicarse a través de misteriosas conexiones de retroalimentación sugería que algo más estaba sucediendo.
La idea es que si el cerebro es una máquina de inferencia, un órgano de estadística, luego cuando sale mal, hará el mismo tipo de errores que haría un estadístico. Karl Friston University College London
Ahí es donde entra en juego el "cerebro Bayesiano", un marco general con raíces que datan de la década de 1860 y que da la vuelta al modelo tradicional.
La teoría propone que el cerebro hace inferencias probabilísticas sobre el mundo basadas en un modelo interno, calculando esencialmente una "mejor conjetura" sobre cómo interpretar lo que está percibiendo (de acuerdo con las reglas de las estadísticas Bayesianas, que cuantifica la probabilidad de un evento basado en información relevante obtenida de experiencias anteriores).
En lugar de esperar a que la información sensorial impulse la cognición, el cerebro siempre está construyendo activamente hipótesis sobre cómo funciona el mundo y usándolos para explicar experiencias y completar datos faltantes.
Es por eso que, según algunos expertos, podríamos pensar en la percepción como "alucinación controlada".
En esa línea, el cerebro Bayesiano también explica por qué funcionan las ilusiones visuales:
Comprender cómo se mueven los objetos es un tipo de conocimiento de nivel superior, pero fundamentalmente influye en cómo percibimos.
El cerebro simplemente está llenando los vacíos de información, en este caso, sobre el movimiento, para pintar una imagen que no es del todo precisa.
Introduzca la teoría de codificación predictiva, que ofrece formulaciones específicas de cómo los cerebros pueden ser Bayesianos.
La codificación predictiva recibe su nombre de una técnica para transmitir señales de telecomunicaciones de manera más eficiente: como los archivos de video contienen mucha redundancia de un cuadro al siguiente, es ineficaz codificar cada píxel en cada imagen al comprimir los datos.
En cambio, tiene más sentido codificar las diferencias entre cuadros adyacentes y luego retroceder para interpretar el video completo.
En 1982, los científicos encontraron que esta idea tiene una aplicación clara en la neurociencia, ya que parece explicar cómo las neuronas en la retina codifican información sobre un estímulo visual y lo transmiten a lo largo del nervio óptico.
También se ha cimentado como un principio de cómo funciona el sistema de recompensa del cerebro: las neuronas de dopamina codifican la magnitud de la falta de correspondencia entre una recompensa esperada y la recompensa real que se recibe.
Estos errores de predicción, dicen los investigadores, ayudan a los animales a actualizar sus expectativas futuras e impulsar la toma de decisiones.
Pero a pesar de estos ejemplos, los científicos en su mayoría vieron la codificación predictiva como un proceso específico para ciertas redes.
Las pruebas de resonancia magnética funcional y otros tipos de experimentos han comenzado a cambiar eso.
Un marco universal
Parte de lo que hace que la hipótesis de codificación predictiva sea tan convincente es su increíble poder explicativo.
En primer lugar, unifica la percepción y el control motor en un único proceso computacional.
Los dos son esencialmente lados opuestos de la misma moneda:
Con la percepción, es el modelo interno el que se ajusta; con control de motor, es el entorno real.
(Para este último, imagina que quieres levantar la mano. Si tu mano aún no está levantada, esa discrepancia genera un gran error de predicción, que se puede minimizar si simplemente mueves la mano).
Lucy Reading-Ikkanda Revista Quanta
Los experimentos de percepción y control motor han proporcionado la evidencia más sólida para la teoría de codificación predictiva.
En un artículo publicado el mes pasado en el Journal of Neuroscience, por ejemplo, los experimentadores hicieron que los sujetos leyeran la palabra "kick" (patada) en una pantalla, y luego les hicieron escuchar una grabación distorsionada de la palabra "pick" (escoger o recoger) que sonó como un fuerte susurro.
Muchos escucharon en su lugar "kick" (patada) y las imágenes fMRI revelaron que el cerebro representaba el sonido inicial "k" o "p" con mayor fuerza: el sonido que se correlacionaba con un error de predicción.
Si el cerebro simplemente representara su experiencia perceptiva, la señal más fuerte debería haber correspondido a "ick" (porque eso fue reproducido tanto en la pantalla como en el audio).
Pero también se están realizando esfuerzos para ampliar la relevancia de la codificación predictiva más allá de la percepción y el movimiento, para establecerla como la moneda común de todo lo que sucede en el cerebro.
Diferentes regiones del cerebro simplemente comercian en diferentes tipos de predicción.
Friston, entre otros, afirma que esto se aplica a los procesos cognitivos superiores, incluida la atención y la toma de decisiones.
El trabajo computacional reciente sobre la corteza prefrontal ha implicado la codificación predictiva en la memoria de trabajo y las conductas dirigidas a objetivos.
Algunos investigadores teorizan que las emociones y los estados de ánimo se pueden formular en términos de codificación predictiva:
Si el cerebro reconoce que está agitado, por ejemplo, entonces sabe que todos esos factores están subiendo. Quizás también sea así como puede surgir el concepto de individualidad.
La mayor parte del trabajo que se realiza en este sentido se centra en cómo la codificación predictiva podría explicar los trastornos neuro-psiquiátricos y del desarrollo.
Es decir, hará las inferencias equivocadas al poner demasiado o muy poco énfasis en las predicciones o los errores de predicción.
Los aspectos del autismo, por ejemplo, pueden caracterizarse por la incapacidad de ignorar los errores de predicción relacionados con las señales sensoriales en los niveles más bajos de la jerarquía de procesamiento del cerebro. Eso podría llevar a una preocupación por las sensaciones, la necesidad de repetición y previsibilidad, la sensibilidad a ciertas ilusiones y otros efectos.
Lo contrario podría ser cierto en condiciones que están asociadas con alucinaciones, como la esquizofrenia:
(Los expertos son rápidos en advertir, sin embargo, que el autismo y la esquizofrenia son demasiado complicados para ser reducidos a una única explicación o mecanismo).
Los experimentos en el laboratorio de Corlett establecen nuevas "creencias" en sujetos sanos que los alientan a alucinar los estímulos que experimentaron previamente.
(Por ejemplo, en un experimento, los científicos condicionaron a los participantes a asociar un tono con un patrón visual. Los sujetos continuaron escuchando el tono cuando veían el patrón, incluso cuando no había sonido).
Los investigadores intentan descifrar cómo esas creencias se traducen en percepción.
A través de estos estudios,
Pero esa evidencia no se ha aproximado a ofrecer pruebas, hasta ahora.
Acercarse para una mejor visión
La teoría es ampliamente aceptada en las ciencias cognitivas, pero,
Su laboratorio está tratando de cambiar esto con evidencia más dura.
En un estudio publicado el año pasado en Neuron, Keller y sus colegas observaron la aparición de neuronas en el sistema visual de ratones que se volvieron predictivas a lo largo del tiempo.
Comenzó con un accidente, cuando se dispusieron a entrenar a los ratones en un videojuego, solo para descubrir que el mundo virtual había mezclado sus direcciones.
Normalmente, y hasta el momento del experimento, los ratones vieron que su campo de visión se movía hacia la derecha cada vez que giraban hacia la izquierda, y viceversa.
Pero alguien había volteado involuntariamente el mundo virtual que utilizaron los investigadores en el estudio, invirtiendo la izquierda y la derecha, de modo que girar hacia la izquierda significaba que los ratones también tenían la visión hacia la izquierda.
Los investigadores se dieron cuenta de que podían sacar provecho del accidente.
Monitorearon las señales cerebrales que representaban este flujo visual y descubrieron que las señales cambiaban lentamente a medida que los ratones aprendían las reglas del entorno invertido.
Si las señales hubieran sido simplemente representaciones sensoriales de la experiencia visual del mouse, se habrían lanzado inmediatamente al mundo virtual.
I Si hubieran sido señales motoras, no habrían dado la vuelta en absoluto. En su lugar,
La parte más profunda de esto es que nos muestra cuán vulnerable es nuestra función mental. Philip Corlett Escuela de Medicina de Yale
Hallazgos similares en las partes del cerebro que los macacos usan para procesar las caras se informaron al mismo tiempo.
El trabajo anterior ya había demostrado que las neuronas en los niveles inferiores de la red codifican los aspectos de una cara basados en la orientación, disparando, por ejemplo, a cualquier cara de perfil.
En niveles más altos, las neuronas representan la cara más abstracta, prestando atención a su identidad en lugar de a su posición.
En el estudio de los macacos, los investigadores entrenaron monos a reconocer pares de rostros en los que una cara, que aparecía primero, siempre predecía algo sobre la segunda.
Más tarde, los experimentadores interfirieron con esas expectativas de maneras específicas, mostrando la misma cara desde un ángulo diferente, o una cara completamente diferente.
Encontraron errores de predicción en áreas de menor nivel de la red de procesamiento facial, pero estos errores no se asociaron con predicciones sobre la orientación, sino con predicciones sobre la identidad.
Es decir, los errores se derivaron de lo que estaba ocurriendo en los niveles superiores del sistema, lo que sugiere que los niveles inferiores construyen la señal de error al comparar las percepciones entrantes con las predicciones que descienden de los niveles superiores.
Según Lucia Melloni, investigadora del Instituto Max Planck para Estética Empírica en Frankfurt, Alemania, su grupo está empezando a ver que los resultados son compatibles con una explicación del error de predicción en los datos neuronales que se están recopilando actualmente en seres humanos.
Una carrera para encontrar más máquinas predictivas
No todos están de acuerdo en que el caso de la codificación predictiva en el cerebro se está fortaleciendo.
Algunos científicos aceptan que la teoría puede explicar ciertos aspectos de la cognición, pero rechazan la idea de que podría explicarlo todo. Otros no conceden ni siquiera eso.
Para David Heeger , profesor de psicología en la Universidad de Nueva York, es importante hacer una distinción entre "codificación predictiva", que dice que se trata de transmitir información de manera eficiente, y "procesamiento predictivo", que él define como la generación de predicciones a lo largo del tiempo.
Otros tipos de modelos Bayesianos, por ejemplo, podrían proporcionar una descripción más precisa de la función cerebral en determinadas circunstancias.
El trabajo proporciona un tipo de evidencia eso no existía antes Una demostración muy local, célula por célula, capa por capa ese es el modelo más adecuado para lo que está pasando es una codificación predictiva. Andy Clark Universidad de Edimburgo
Sin embargo, en lo que sí coinciden muchos expertos en el campo es que esta investigación tiene el potencial de interesantes aplicaciones en el aprendizaje automático.
En la actualidad, la gran mayoría de la investigación de inteligencia artificial no incluye codificación predictiva, sino que se centra en otros tipos de algoritmos.
Pero la formulación de una arquitectura de codificación predictiva en un contexto de aprendizaje profundo podría acercar a las máquinas a la inteligencia, sostiene Friston.
El GQN de DeepMind sirve como un buen ejemplo de ese potencial.
Y el año pasado, los investigadores de la Universidad de Sussex incluso utilizaron tecnologías de realidad virtual e inteligencia artificial que incluían funciones de codificación predictiva para crear lo que llamaron la "Hallucination Machine", una herramienta capaz de imitar los estados alucinatorios alterados causados típicamente por drogas psicodélicas.
Los avances en el aprendizaje automático podrían usarse para proporcionar nuevos conocimientos sobre lo que está sucediendo en el cerebro al comparar qué tan bien funcionan los modelos de codificación predictiva frente a otras técnicas.
Por lo menos, la introducción de codificación predictiva en sistemas artificiales podría mejorar significativamente la inteligencia de esas máquinas.
Pero antes de que eso pueda suceder, queda mucho trabajo por delante. Los científicos deben continuar el tipo de investigación que Keller, Schwiedrzik y otros realizan para determinar exactamente dónde residen, por ejemplo, las representaciones internas del cerebro.
Y queda por ver si experimentos similares pueden justificar los reclamos de codificación predictiva en procesos cognitivos superiores.
Codificación predictiva,
Pero por ahora, señaló Sprevak,
|