El dilema del viajero, en teoría de juegos, es un juego de suma distinta de cero en el que dos jugadores intentan maximizar su propia recompensa, sin tener en cuenta al otro. El juego demuestra la » paradoja de la racionalidad «, la ironía de que tomar decisiones de manera ilógica o ingenua a menudo produce una mejor recompensa en la teoría de juegos.
CONCLUSIONES CLAVE
- El dilema del viajero es un juego en el que dos jugadores pujan cada uno por un pago propuesto y ambos reciben la puja más baja, más o menos un pago de bonificación.
- Según la teoría de juegos, la estrategia racional para ambos jugadores es elegir el pago más bajo posible. Esto da como resultado que ambos jugadores reciban pagos menores de los que podrían lograr siguiendo una estrategia irracional.
- En los estudios experimentales, las personas eligieron consistentemente recompensas más altas y lograron mejores resultados que la estrategia racional predicha por la teoría de juegos.
Comprender el dilema del viajero
El juego del dilema del viajero, formulado en 1994 por el economista Kaushik Basu, presenta un escenario en el que una aerolínea daña gravemente antigüedades idénticas compradas por dos viajeros diferentes. El gerente de la aerolínea está dispuesto a compensarlos por la pérdida de las antigüedades, pero como no tiene idea de su valor, les dice a los dos viajeros que escriban por separado su estimación del valor como cualquier número entre $2 y $100 sin consultar con uno otro.
Sin embargo, hay un par de advertencias:
- En el caso que ambos viajeros anotan el mismo número, les reembolsará esa cantidad a cada uno de ellos.
- Si escriben números diferentes, el gerente asumirá que el precio más bajo es el valor real y que la persona con el número más alto está haciendo trampa. Si bien les pagará a ambos la cifra más baja, la persona con el número más bajo recibirá un bono de $2 por honestidad, mientras que el que escribió el número más alto recibirá una multa de $2.
La elección racional, en términos del equilibrio de Nash, es $2. El razonamiento es el siguiente. El primer impulso del viajero A puede ser anotar $100; si el Viajero B también anota $100, esa es la cantidad que ambos recibirán del gerente de la aerolínea. Pero pensándolo bien, el Viajero A razona que si escribe $99 y B deposita $100, entonces A recibiría $101 ($99 + $2 de bonificación).
Pero A cree que esta línea de pensamiento también se le ocurrirá a B, y si B también pone $99, ambos recibirían $99. Por lo tanto, sería mejor que A depositara $98 y recibiera $100 ($98 + bono de $2) si B escribe $99. Pero dado que a B se le podría ocurrir la misma idea de escribir $98, A considera poner $97, y así sucesivamente. Esta línea de inducción hacia atrás llevará a los viajeros hasta el número más pequeño permitido, que es $2.
¿La gente elige realmente el equilibrio de Nash?
En los estudios experimentales, contrariamente a las predicciones de la teoría de juegos, la mayoría de la gente elige $100 o un número cercano, ya sea sin pensar en el problema o siendo plenamente consciente de que se están desviando de la elección racional. Entonces, mientras que la mayoría de las personas sienten intuitivamente que seleccionarían un número mucho mayor que $2, esta intuición parece contradecir el resultado lógico predicho por la teoría de juegos: que cada viajero seleccionaría $2. Al rechazar la opción lógica y actuar de manera ilógica escribiendo un número más alto, la gente termina obteniendo una recompensa sustancialmente mayor.
Estos resultados concuerdan con estudios similares que utilizan otros juegos como el dilema del prisionero y el juego de los bienes públicos, donde los sujetos experimentales tienden a no elegir el equilibrio de Nash. Con base en estos estudios, los investigadores han propuesto que las personas parecen tener una actitud natural y positiva a favor de la cooperación. Esta actitud conduce a equilibrios cooperativos que proporcionan mayores recompensas a todos los jugadores en juegos de un solo tiro o repetidos, y puede explicarse por presiones evolutivas selectivas que favorecen este tipo de estrategias aparentemente irracionales pero beneficiosas.
Sin embargo, los estudios del dilema del viajero también han demostrado que cuando la penalización / bonificación es mayor o cuando los jugadores están formados por equipos de varias personas que toman una decisión común, los jugadores eligen con mayor frecuencia seguir la estrategia racional que conduce al equilibrio de Nash. Estos efectos también interactúan, ya que los equipos de jugadores no solo eligen la estrategia más racional, sino que también responden mejor al tamaño de la penalización / bonificación que los jugadores individuales. Estos estudios sugieren que las estrategias evolucionadas que tienden a crear resultados sociales beneficiosos pueden compensarse con estrategias más racionales que tienden hacia el equilibrio de Nash dependiendo de la estructura de los incentivos y la presencia de divisiones sociales.