Cephalópodos aprueban la prueba del marshmallow: esperan la recompensa mayor por hasta 130 segundos, a costa de su seguridad
Un estudio publicado en 2021 llevó a las sepias comunes (Sepia officinalis) a una versión del clásico marshmallow test. La pregunta era si podrían resistir la tentación para obtener, más tarde, una recompensa mayor. Las sepias mostraron que hay más en su cerebro de lo que imaginamos. Los resultados sugieren que pueden aprender, anticipar recompensas futuras y adaptar su comportamiento, habilidades que podrían haber evolucionado para darles una ventaja en un mundo marino donde comer o ser comido está en juego. Investigadores señalan que este tipo de autocontrol podría estar ligado a su estilo de vida de forrajeo y a la exposición constante a depredadores, no a la socialidad o al uso de herramientas como ocurre en otros vertebrados. Este hallazgo desafía la idea de que la inteligencia marina es simple o limitada.
El diseño del experimento: dos cámaras, símbolos y recompensas
El experimento se desarrolló en un tanque con dos cámaras cerradas por puertas transparentes. En cada cámara había comida: un trozo de gamba cruda menos deseada y, detrás de la otra, una gamba viva mucho más atractiva. Las puertas llevaban símbolos: un círculo abría la puerta de inmediato; un triángulo la abría tras un intervalo entre 10 y 130 segundos; un cuadrado mantenía la puerta cerrada en el grupo de control. En la condición de prueba, la gamba menos deseada estaba detrás de la puerta que se abría de inmediato, mientras que la gamba más atractiva solo era accesible si esperaban. Si optaban por la gamba menor, la recompensa superior era retirada.
Resultados clave y la conexión entre paciencia y aprendizaje
En la condición de prueba, todas las sepias eligieron esperar por la recompensa mejor, tolerando retrasos de entre 50 y 130 segundos, un rango comparable a lo que se observa en chimpancés, cuervos y loros. Como comentó Schnell en 2021: “Las sepias de este estudio fueron capaces de esperar por la recompensa mejor y toleraron retrasos de hasta 50–130 segundos, lo cual es comparable a lo que vemos en vertebrados grandes con cerebro desarrollado.” Un segundo objetivo fue evaluar la capacidad de aprendizaje. Se les mostraron dos señales visuales, un cuadrado gris y otro blanco. Si se acercaban al símbolo correcto, el otro se retiraba; si acertaban, recibían una recompensa. Después se invirtieron las señales para ver quién se adaptaba más rápido. Los espectadores que aprendían más rápido eran también los que aguantarían más tiempo para la recompensa, lo que sugiere un vínculo entre aprendizaje flexible y autocontrol.