En muchas situaciones de la vida cotidiana, la toma de decisiones va acompañada de una retroalimentación sobre las consecuencias de las elecciones, o "feedback", relacionado con su resultado: ganancia o pérdida financiera, éxito o fracaso, información sobre lo que podría haber pasado si se hubiera tomado otra decisión... Las teorías dominantes en economía, psicología y neurociencias suponen que esta retroalimentación permite ajustar progresivamente las creencias y aprender a tomar mejores decisiones, especialmente en el marco de una toma de decisiones repetida.
Para probar esta hipótesis, un equipo de investigación del Laboratorio de Neurociencias Cognitivas Computacionales (Inserm/ENS) dirigido por Stefano Palminteri, director de investigación del Inserm, en colaboración con la Paris School of Economics, llevó a cabo experimentos conductuales que involucraron a más de 500 participantes.
Imagen de ilustración Pixabay
En cada etapa de estos experimentos, los voluntarios se enfrentaban a una situación de elección binaria entre una opción segura (por ejemplo, ganar 20 puntos con certeza) y una opción arriesgada (por ejemplo, tener un 50% de posibilidades de ganar 40 puntos y un 50% de posibilidades de no ganar nada). Para evitar ciertos sesgos metodológicos, los científicos hicieron que la opción arriesgada fuera más o menos ventajosa en comparación con la opción segura, variando la probabilidad de ganancia (10%, 50%, 90%) y su valor (40 o 60 puntos). La calidad de las decisiones se midió por la capacidad de los voluntarios para elegir la opción que ofrecía la ganancia promedio más alta [1].
La retroalimentación, cuando se proporcionaba, era parcial (solo se daba el resultado de la opción elegida) o completa (se daban los resultados de las dos opciones posibles). Su efecto se evaluaba entonces de dos maneras complementarias: en primer lugar, después de realizar una elección, la persona recibía una retroalimentación cuyo efecto se examinaba en la siguiente elección y permitía observar cómo evolucionaba el comportamiento. Luego -y este es uno de los aspectos más novedosos del estudio-, en algunos experimentos, los voluntarios no eran informados de antemano de que se les daría retroalimentación, mientras que en otros, sabían explícitamente que iba a haber retroalimentación.
Los resultados de los experimentos muestran que la presencia de retroalimentación aumenta sistemáticamente la toma de riesgos entre un 35% y un 45%, pero sin mejorar la calidad de las decisiones.
Según las situaciones, dos mecanismos psicológicos distintos puestos de manifiesto por el análisis de los datos de los experimentos podrían explicar estos resultados. Cuando solo se revela el resultado de la elección realizada (retroalimentación parcial), el aumento de la toma de riesgos estaría relacionado con la curiosidad: elegir la opción arriesgada permite obtener más información (ya que el resultado de la opción segura es, por defecto, siempre conocido). Por el contrario, cuando los voluntarios ven también lo que podrían haber ganado con la opción no elegida (retroalimentación completa), es la anticipación del arrepentimiento lo que favorecería las decisiones arriesgadas en las elecciones siguientes.
Otro resultado sorprendente: en las personas que sabían, antes de tomar su decisión, que iban a recibir retroalimentación, el aumento de la toma de riesgos aparecía incluso antes de que los voluntarios hubieran recibido ninguna retroalimentación.
"
Estos resultados sugieren que la simple anticipación de recibir una retroalimentación modificaría la actitud frente al riesgo, incluso antes de cualquier experiencia", explica Stefano Palminteri.
Finalmente, el equipo puso de manifiesto un último resultado particularmente contraintuitivo: inmediatamente después de recibir una retroalimentación positiva (una confirmación de que la elección realizada permitió obtener la ganancia máxima posible), la probabilidad de que la persona volviera a elegir una opción arriesgada disminuía.
"
Según las teorías dominantes, cabría esperar que una retroalimentación positiva condujera a repetir la elección asociada,
lo que sería compatible con un efecto de aprendizaje por experiencia, analiza Stefano Palminteri,
sin embargo, observamos lo contrario. Esto puede explicarse por un sesgo cognitivo llamado 'falacia del jugador': después de ganar, las personas estiman que tienen menos posibilidades de volver a ganar inmediatamente, y por lo tanto evitan volver a jugar."
Estos resultados exponen, por tanto, tanto efectos paradójicos relacionados con la anticipación de la retroalimentación como otros relacionados con sus consecuencias inmediatas. Según el equipo de investigación, limitan considerablemente el efecto de aprendizaje de la retroalimentación en un contexto arriesgado de toma de decisiones.
"Esta investigación contribuye a una comprensión más fina de los mecanismos cognitivos de la toma de decisiones bajo riesgo, comenta Antonios Nasioulas, doctor en economía de la Paris School of Economics, primer autor y coautor correspondiente de este trabajo
. La retroalimentación se presenta a menudo como una herramienta de 'des-sesgo' que permite mejorar las decisiones en contextos aplicados, como la gestión financiera o las decisiones médicas.
Este estudio muestra, por el contrario, que la retroalimentación puede introducir nuevos sesgos, al modificar la actitud frente al riesgo en lugar de favorecer un aprendizaje racional."
Estos trabajos abren así nuevas vías para estudiar ciertos comportamientos excesivamente arriesgados observados en la vida cotidiana o en el marco de estudios conductuales. Los autores también subrayan la importancia de tener en cuenta estos resultados para el diseño de dispositivos de ayuda a la decisión, ya estén destinados al público en general, a profesionales o integrados en sistemas digitales.
Nota:
[1] Este enfoque se basa en el "valor esperado" (EV); para cada opción, el equipo calculó el promedio de las ganancias posibles, ponderado por sus probabilidades: en el caso concreto de este estudio
EV = (probabilidad de ganar × ganancia posible). En cada etapa de elección, es por tanto la opción con el mayor valor esperado la que se considera "óptima". Este método permite determinar si las elecciones son óptimas desde un punto de vista matemático, independientemente de las preferencias personales por el riesgo.
Ejemplo: Si la opción segura reporta 20 puntos, entonces EV
segura = 1 x 20 = 20 ; si la opción arriesgada ofrece un 50% de posibilidades de ganar 90 puntos, entonces EV
arriesgada = 0,5 x 90 = 45. Aquí EV
arriesgada es por tanto la elección más óptima.
Fuente: Inserm