La inducción hacia atrás en la teoría de juegos es un proceso iterativo de razonamiento hacia atrás en el tiempo, desde el final de un problema o situación, para resolver juegos secuenciales y de forma extensiva finita, e inferir una secuencia de acciones óptimas.
Explicación de la inducción hacia atrás
La inducción hacia atrás se ha utilizado para resolver juegos desde que John von Neumann y Oskar Morgenstern establecieron la teoría de juegos como asignatura académica cuando publicaron su libro, Theory of Games and Economic Behavior en 1944.
En cada etapa del juego, la inducción hacia atrás determina la estrategia óptima del jugador que hace el último movimiento en el juego. Luego, se determina la acción óptima del penúltimo jugador en movimiento, tomando la acción del último jugador como dada. Este proceso continúa hacia atrás hasta que se determina la mejor acción para cada momento. Efectivamente, se está determinando el equilibrio de Nash de cada subjuego del juego original.
Sin embargo, los resultados inferidos de la inducción hacia atrás a menudo no logran predecir el juego humano real. Los estudios experimentales han demostrado que el comportamiento «racional» (como lo predice la teoría de juegos) rara vez se manifiesta en la vida real. Los jugadores irracionales pueden terminar obteniendo recompensas más altas que las predichas por la inducción hacia atrás, como se ilustra en el juego del ciempiés .
En el juego del ciempiés, dos jugadores tienen alternativamente la oportunidad de tomar una parte mayor de un bote de dinero cada vez mayor o de pasar el bote al otro jugador. Los pagos se organizan de modo que si el bote se pasa al oponente y el oponente se lleva el bote en la siguiente ronda, uno recibe un poco menos que si se hubiera llevado el bote en esta ronda. El juego concluye tan pronto como un jugador toma el alijo, con ese jugador obteniendo la porción más grande y el otro jugador obteniendo la porción más pequeña.
Ejemplo de inducción hacia atrás
Como ejemplo, suponga que el jugador A va primero y tiene que decidir si debe «tomar» o «pasar» el alijo, que actualmente asciende a $ 2. Si toma, entonces A y B obtienen $ 1 cada uno, pero si A aprueba, el jugador B debe tomar la decisión de tomar o pasar ahora. y A obtiene $ 0. Pero si B pasa, A ahora decide si acepta o pasa, y así sucesivamente. Si ambos jugadores siempre eligen pasar, cada uno recibirá una recompensa de $ 100 al final del juego.
El objetivo del juego es que si A y B cooperan y continúan pasando hasta el final del juego, obtienen el pago máximo de $ 100 cada uno. Pero si desconfían del otro jugador y esperan que «aprovechen» en la primera oportunidad, el equilibrio de Nash predice que los jugadores tomarán el reclamo más bajo posible ($ 1 en este caso).
El equilibrio de Nash de este juego, donde ningún jugador tiene un incentivo para desviarse de su estrategia elegida después de considerar la elección de un oponente, sugiere que el primer jugador se llevaría el bote en la primera ronda del juego. Sin embargo, en realidad, relativamente pocos jugadores lo hacen. Como resultado, obtienen una recompensa mayor que la pronosticada por el análisis de equilibrio.
Resolver juegos secuenciales usando inducción hacia atrás
A continuación se muestra un juego secuencial simple entre dos jugadores. Las etiquetas con Jugador 1 y Jugador 2 dentro de ellas son los conjuntos de información para los jugadores uno o dos, respectivamente. Los números entre paréntesis en la parte inferior del árbol son los pagos en cada punto respectivo. El juego también es secuencial, por lo que el jugador 1 toma la primera decisión (izquierda o derecha) y el jugador 2 toma su decisión después del jugador 1 (arriba o abajo).
La inducción hacia atrás, como toda teoría de juegos, utiliza los supuestos de racionalidad y maximización, lo que significa que el jugador 2 maximizará su beneficio en cualquier situación dada. En cualquier conjunto de información tenemos dos opciones, cuatro en total. Al eliminar las opciones que el jugador 2 no elegirá, podemos reducir nuestro árbol. De esta manera, marcaremos las líneas en azul que maximizan la recompensa del jugador en el conjunto de información dado.
Después de esta reducción, el jugador 1 puede maximizar sus ganancias ahora que se dan a conocer las elecciones del jugador 2. El resultado es un equilibrio hallado por inducción hacia atrás en el que el jugador 1 elige «correcto» y el jugador 2 elige «arriba». A continuación se muestra la solución del juego con la ruta de equilibrio en negrita.
Por ejemplo, uno podría configurar fácilmente un juego similar al anterior utilizando empresas como jugadores. Este juego podría incluir escenarios de lanzamiento de productos . Si la empresa 1 quisiera lanzar un producto, ¿qué podría hacer la empresa 2 en respuesta? ¿La Compañía 2 lanzará un producto competitivo similar? Al pronosticar las ventas de este nuevo producto en diferentes escenarios, podemos configurar un juego para predecir cómo se desarrollarán los eventos. A continuación se muestra un ejemplo de cómo se podría modelar un juego de este tipo.