En la lucha de la vida, la evolución recompensa a los animales que dominan sus circunstancias, especialmente cuando el entorno cambia rápidamente. Si hay una receta para el éxito, no lo es: saborea tus victorias cuando tienes la suerte de tenerlas. Más bien es:gane en grande y gane a menudo.
Para tomar decisiones ganadoras, los animales no pueden consultar un libro de jugadas cableado o recibir consejos útiles. En cambio, el éxito depende de su capacidad de aprender, de los triunfos y de los errores.
Hoy en el diario Biología actual , un equipo dirigido por el profesor Adam Kepecs del Laboratorio Cold Spring Harbor CSHL agrega una nueva dimensión importante a nuestra comprensión de cómo aprende el cerebro, centrándose específicamente en situaciones en las que se utiliza información perceptivamente ambigua para hacer predicciones.
¿Qué pasa si se empaña y apenas podemos ver el letrero adelante, o si el anuncio por el altavoz es confuso? En circunstancias como estas, ¿cómo ajusta el cerebro las predicciones que informan las decisiones?
Kepecs y sus colegas describen cómo las neuronas liberadoras de dopamina, que se cree que producen señales de enseñanza críticas para el cerebro, sopesan la ambigüedad de la información sensorial cuando evalúan con qué éxito las experiencias pasadas han guiado una nueva decisión. Sus hallazgos indican que estas neuronas sonincluso más sofisticado de lo que se pensaba.
"Las neuronas de dopamina no son cualquier neurona en el cerebro", dice Kepecs. "Son neuronas que se sientan en el mesencéfalo y envían conexiones a grandes extensiones del cerebro. Las neuronas de dopamina comparan los resultados pronosticados con los resultados reales, y envían eldiscrepancia entre estos como retroalimentación de error a otras partes del cerebro. Esto es exactamente lo que querría que hicieran las señales de aprendizaje. Y hemos descubierto que lo que hacen las neuronas de dopamina está en perfecto acuerdo con lo que en teoría se requiere para un algoritmo de aprendizaje poderoso"
Esta es una forma tan efectiva de aprender que la misma estrategia, llamada aprendizaje de refuerzo, se ha incorporado en muchos tipos de inteligencia artificial, permitiendo a las computadoras descubrir cómo hacer las cosas sin las instrucciones de un programador.
Kepecs y su equipo agregaron lo que los científicos informáticos llaman un estado de creencia una variable de distribución de probabilidad a un modelo matemático de aprendizaje por refuerzo. El modelo utilizado anteriormente es bueno para explicar cómo un animal aprende de la experiencia, pero solo cuando los estímulos sensorialesdisponibles para el animal son sencillos, fáciles de interpretar. "No está claro si las neuronas de dopamina tienen en cuenta la ambigüedad perceptiva en su señal de enseñanza", dice Kepecs. "Nuestro modelo revisado genera una estimación de la probabilidad de que una elección dada sea correcta.este es el grado de confianza sobre la decisión "
"Si puede evaluar su proceso de decisión, el ruido y todo lo demás que contribuyó a él, y además de hacer una elección binaria, asigne un nivel gradual de confianza a la decisión, es esencialmente una predicción sobre su precisión".él dice: "Es un cálculo completamente diferente que simplemente usar las señales para recordar experiencias pasadas y hacer predicciones".
Armin Lak, un investigador postdoctoral británico iraní que trabaja con Kepecs, desarrolló un modelo de computadora que predijo cómo se comportarían las neuronas si realizaran este cálculo. Luego compararon esas predicciones con la actividad de las neuronas de dopamina en el cerebro de los monos mientras realizabanuna tarea en la que tomaron una decisión informada por señales visuales que a veces eran claras y otras no.
La actividad de las neuronas fue registrada por los colaboradores de Kepecs, Kensaku Nomoto y Masamichi Sakagami, neurocientíficos de la Universidad Tamagawa en Tokio, que estudiaban cómo el cerebro usa la información sensorial para tomar decisiones. En la tarea, los monos observaron una pantalla llena de movimientopuntos, y tuve que decidir si más puntos se movían hacia la izquierda o hacia la derecha, recibiendo una recompensa de jugo cuando obtuvieron la respuesta correcta.
Cuando Kepecs y Lak analizaron los datos, descubrieron que la actividad de las neuronas de dopamina se ajustaba estrechamente a las predicciones de su nuevo modelo, lo que indica que estas neuronas probablemente estaban evaluando la confiabilidad de la información utilizada durante cada decisión. Aplicación del modelo computacionalfue como mirar los datos a través de un nuevo microscopio, dice Kepecs. "Al mirarlos de esta manera, puedes ver cosas que antes no podías ver en los datos. De repente, tenía sentido. Este sistema es mucho más inteligente que nosotrospensado antes "
Sorprendentemente, dice Kepecs, las neuronas de señalización de confianza se activaron una fracción de segundo antes de que los monos tomaran una decisión. Esta actividad temprana sugiere que las neuronas pueden influir en el proceso inmediato de toma de decisiones, un papel que el equipo explorará eninvestigación futura.
Fuente de la historia :
Materiales proporcionado por Laboratorio Cold Spring Harbor . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :