revista dharma

La Teoría de los Juegos

Vicente Carbona



Fue Sócrates (en el Menón de Platón) el que dijo que mejor que enseñar, vale la pena preguntar, porque la sabiduría (la virtud) no puede ser enseñada, pero puede ser recuperada a través de la opinión correcta. Y la opinión correcta viene de la investigación. La entelequia del estudio está en ver soluciones donde los demás sólo ven problemas. La inteligencia no se aprende, se desarrolla.

Para encontrar una realidad social entre el altruismo y el interés propio, un espacio de convivencia que, lejos de ser una utopía, resulta ser medible y aplicable, la Teoría de los Juegos representa una posible entelequia. Es sencillamente una estrategia útil para estudiar y predecir el comportamiento individual y colectivo en diversas situaciones basándose en una serie de probabilidades.

En efecto, todos utilizamos la estrategia de juegos en nuestras relaciones con los demás y con el entorno; incluso se puede decir que toda la existencia humana se basa en una serie de juegos en los que participamos consciente o subconscientemente y en los que nuestras reacciones y respuestas son hasta cierto punto predecibles. Desde una partida de ajedrez, hasta negociaciones sobre el control de armas nucleares, la teoría de los juegos tiene aplicaciones directas.

Como tal, el concepto es aplicable a diversas áreas de estudio, entre ellas la filosofía, la economía, las ciencias políticas y las sociales: las humanidades o las “artes liberales”; pero también a las ciencias naturales: la biología, la física, las matemáticas, etc. Cada una de estas aplicaciones tiene sus preceptos específicos y sus formulaciones únicas.

Aunque es imposible saber exactamente cómo una persona reaccionará ante dilemas existenciales, resulta posible predecir, con un relativo nivel de exactitud, las probabilidades inherentes a cada tipo de reacción ante situaciones específicas.

Según la enciclopedia popular digital Wikipedia (wikipedia.com) (es.wikipedia.org/wiki/Wikipedia:Portada) la Teoría de los Juegos es esencialmente una rama de matemáticas aplicadas que estudia situaciones en las que los participantes escogen diversas estrategias para lograr los mejores resultados. Su estudio creció durante la Guerra Fría debido a sus aplicaciones en estrategia militar, especialmente en el concepto de la destrucción mutua asegurada, aunque en la década de los 70 se aplicó también para entender el comportamiento en el mundo animal, y el desarrollo de las especies basándose en la selección natural, de lo que hablaremos más adelante.

Para comprender el concepto básico, consideremos primero el juego de suma cero. Esta es una situación en la que la ganancia o pérdida de uno de los participantes en el juego está perfectamente equilibrada por la ganancia o pérdida del (o de los) demás participantes. “Se llama así porque si sumas el total de las ganancias de los participantes y restas las pérdidas totales el resultado es cero. Cortar una tarta es de suma cero porque llevarte un trozo más grande reduce la cantidad de tarta que les queda a los demás” (es.wikipedia.org/wiki/Suma_ cero). En este escenario, las diversas estrategias que se pueden utilizar se definen como estrategias minimax.

El método minimax es una teoría de toma de decisiones en la que el objetivo es minimizar la pérdida potencial máxima, considerando que tu información es perfecta, y que tu adversario escogerá la estrategia que más daño te hará a ti. Este método es aplicable en juegos en los que los participantes se turnan moviendo ficha (o tomando decisiones), y también en los que todos mueven ficha de forma simultánea. Se puede ver cómo este concepto lleva a juegos cada vez más complejos y a estrategias generales de toma de decisiones, hasta incorporar el elemento de la incertidumbre.

De aquí el concepto básico desemboca en modelos de formación de coaliciones (entre grupos de participantes), en líneas de conductas racionales (como veremos, no tiene nada que ver con conceptos éticos o morales), y en estrategias de negociación basadas en la calidad de la información existente para cada participante… hasta situaciones en las que la decisión estratégica de cada jugador representa una respuesta óptima individual a las posibles elecciones estratégicas de los demás participantes en el juego.

Para ilustrar el concepto básico, consideremos el llamado Dilema del Preso (que no es un juego de suma cero, sino que ambos pueden ganar o perder), en el que el interés propio mutuo perjudica a todos, un concepto que esclarece y de cierta manera contradice conceptos éticos y filosóficos establecidos. ¿Cooperarán los dos presos para minimizar su pérdida de libertad total o, confiando en que el otro cooperará con las autoridades, traicionará uno de ellos al otro para obtener su libertad?

Dos delincuentes armados, A y B, con el coche lleno de objetos robados, son arrestados y encerrados en celdas incomunicadas. La policía necesita pruebas definitivas de su culpabilidad, y utilizando la posesión ilegal de armas como amenaza, les propone individualmente el mismo acuerdo. Si A testifica contra B, y B permanece callado, B recibe 10 años de cárcel y A sale libre. Si los dos se callan, la policía sólo los podrá encarcelar 1 año cada uno por posesión ilegal de armas. Si los dos cooperan con la policía, recibirán 5 años de prisión cada uno.

Obviamente la solución ideal sería que ambos permanecieran callados, pero el truco es determinar si, en el mundo real, con información imperfecta, cada persona tiende a confiar o desconfiar del prójimo. Pensando racionalmente, es decir, sin poder asegurar que B permanecerá callado, es más, asumiendo que B hará lo que más le conviene (cooperar con la policía), la opción natural para A siempre será de colaborar. Esa es la paradoja. La solución racional perjudica al grupo igual que al individuo.

Esta realidad explica por qué las decisiones de personas que controlan el poder, ya sea político, económico, religioso, social, etc. suelen ser egoístas y desafortunadas, y tienden a perjudicarnos individual y colectivamente. Porque lo que uno percibe como su propio interés tiende a corromper la racionalidad decisiva.

Generalizando este experimento podemos extrapolar una situación en la que dos jugadores tienen dos cartas cada uno, “cooperar” y “traicionar”, y en cada turno muestran una de ellas simultáneamente según la estrategia ganadora que han adoptado. Las reglas son: si A traiciona y B coopera, A recibe 5 puntos y B recibe 0 puntos. Si los dos cooperan, cada uno recibe 3 puntos. Y si los dos traicionan, cada uno recibe 1 punto. ¿Por qué asignar 5 puntos a la acción de traicionar? Porque en la naturaleza el traidor es el que se beneficia de la bondad de los demás sin aportar nada (tiempo, esfuerzo, etc.).

Obviamente en este caso, si creemos firmemente que así lo define la selección natural, o si confiamos en la supervivencia del más fuerte (o más egoísta), la mejor estrategia será engañar al otro para que coopere, traicionarle, y llevarse los 5 puntos. Esto explica muchos de los problemas que sufre la especie humana, un concepto francamente alarmante. Porque en términos evolutivos, esta estrategia nos conduce al escenario predicado en el concepto de “destrucción mutua asegurada” de la Guerra Fría.

Pero este escenario no tiene en cuenta un parámetro básico de la evolución, tal como la describió Richard Dawkins en su obra maestra El gen egoísta, en la que el objetivo principal no es el beneficio propio, ni siquiera la supremacía del más fuerte, sino simplemente la propagación del gen. Nosotros somos máquinas que nuestros genes han construido, replicándose, para asegurar su propia supervivencia. De ahí el gen “egoísta”.

Y para asegurar la supervivencia del gen, procurando la evolución de las especies mejor adaptadas, las estrategias adoptadas en el mundo natural cuentan con variables que tienden a moderar y paliar los efectos del engaño mutuo, del aparentemente irremediable narcisismo humano. Para el gen, la destrucción mutua asegurada es el peor de los escenarios posibles. Consideremos ahora la estrategia tit for tat, o “el que la hace la paga”.

Dawkins pone de ejemplo la manera en que una especie de ave afronta un problema. Estos pájaros son propensos a ser infestados por colonias de ácaros, parásitos que son capaces de causarles la muerte. Cada pájaro puede limpiarse el cuerpo con el pico y matar los ácaros, menos en la corona del cogote: para esto depende de la colaboración de sus semejantes. La composición genética original de la especie hace que, para asegurar su supervivencia, estos pájaros cooperen entre sí, y cuando un pájaro pide a otro que le desinsecte la cabeza, éste lo hará. Llamemos a este tipo de pájaro el “cooperante”. Entonces, gracias a la selección natural, surge un nuevo problema.

Una mutación genética crea un indivíduo que decide que podrá sobrevivir mejor si adopta una actitud que llamaremos “traicionera”. Es decir, cuando necesita que le limpien la cabeza, los demás se lo hacen. Pero cuando le piden a él que les limpie la cabeza, el “traidor” rehúsa. Rehúsa porque un gen “desviado” le indica que en lugar de limpiar la cabeza de los demás, puede utilizar esa energía (la energía es un valor concreto utilizable para tareas de supervivencia) para, por ejemplo, tener más tiempo para buscar comida. Esto hace que la mutación “traicionera” se convierta en ascendente dentro de la población y tenga cada vez más incidencia. El pájaro que rehúsa limparles la cabeza a los demás tiene más tiempo y energía para comer, descansar, propagarse y progresar. Obviamente, cuantos más “traidores” existen, más disminuye la población de “cooperadores”, hasta que se llega al punto en que los “cooperadores” se hallan en peligro de extinción.

Claro, la extinción de los “cooperadores” significa la “destrucción mutua asegurada”, ya que si estos desaparecen, los “traidores”, no teniendo quien les quite los ácaros de la cabeza, con el tiempo también desaparecerán.

Aquí es donde aparece otra mutación genética (gracias al “egoísmo” del gen por sobrevivir), fundada en la necesidad evolutiva, y basada en “reconocimiento de caras”, que conlleva un aumento de la memoria, agudez visual, percepción de rasgos, etc., con todos los cambios físicos y cognitivos apropiados. Este tipo de mutación es común en la naturaleza y es lo que hace que la evolución sea viable. Nace la estrategia “el que la hace la paga”, y aparece entre la población de pájaros el “precavido”, el que recuerda quién le limpia la cabeza y quién no, y actúa en consecuencia: “si no me limpias la cabeza, cuando me pidas que te la limpie a ti, no lo haré”.

“Es muy interesante observar una simulación en ordenador que comienza con una fuerte mayoría de cooperadores, una minoría de precavidos situada justo por encima de la frecuencia crítica, y una minoría parecida de traidores”, explica Dawkins en el El gen egoísta (edición Oxford University Press de 1999). La explotación por parte de los traidores hace que la población de cooperadores disminuya dramáticamente, hasta que desaparece el último cooperador, que es cuando los traidores dominan la población. De repente, sin embargo, la población de precavidos comienza a crecer, y sigue aumentando rápidamente. La población de traidores entonces comienza a desaparecer, y los precavidos acaban dominando.

“Paradójicamente”, agrega Dawkins, “la presencia de los cooperadores hacía peligrar la existencia de los precavidos al principio, porque ellos eran responsables de la prosperidad temporal de los traidores”.

En un capítulo del mismo libro, titulado Los buenos salen ganando, Dawkins describe un experimento del científico político estadounidense Robert Axelrod en el que examina el concepto de “altruismo recíproco”, encapsulado en “el que la hace la paga”, a niveles insospechados.

Basándose en una variante más compleja (iterada) del Dilema del Preso, con las variables “cooperar” y “traicionar”, propuso una competición a la que invitó a 15 expertos en Teoría de los Juegos para que propusieran sus propias estrategias, y los enfrentó a todos en un programa de ordenador a 200 turnos.

La estrategia ganadora fue propuesta por Anatol Rapoport, un profesor experto en psicología y Teoría de Juegos, residente en Toronto, Canadá. Su estrategia, la original “tit for tat”, se basaba en un concepto muy sencillo. Comienza cooperando en su primer turno y, a partir de ahí, simplemente copia las acciones de sus oponentes en el turno anterior. Luego repitieron el experimento, invitando a 62 expertos, dejando el número de turnos abierto, y el resultado fue el mismo: “el que la hace la paga” no tenía rival.

“Parece que mucha gente, quizás sin siquiera pensarlo, preferiría hundir al otro jugador en lugar de cooperar con el otro jugador (en beneficio mutuo). El trabajo de Axelrod ha demostrado que esto es un error”, dice Dawkins. “Lo que parece ser un confrontamiento de suma cero puede, con un poco de buena voluntad, transformarse en un juego de beneficio mutuo”.

Thomas C. Schelling (Nobel de Economía 2005, por su trabajo en la Teoría de los Juegos) dijo, en un ensayo titulado Ética, ley y el ejercicio de auto-mando (1982): “Existe una paradoja. Completa libertad supone la libertad de controlarse, de incurrir en una obligación, de reducir la propia gama de opciones. Específicamente, ésta es la libertad contractual; y funciona a través de las expectativas. El comportamiento de los demás depende de lo que ellos esperan de mí; al restringir mi propia libertad de elección gano influencia sobre las elecciones de los demás”.

Esta influencia se puede llamar altruismo, interés propio ilustrado, convivencia. La Teoría de los Juegos nos puede ayudar a analizar nuestras propias acciones y decisiones, y a concebir estrategias colectivas más positivas y menos conflictivas. Si aplicáramos “el que la hace la paga” al mundo real, a la gestión medioambiental, a la economía global, a los acuerdos internacionales o hasta a la política local, saldríamos todos ganando.

Ya no es un concepto religioso, ético o moral, el de “tratar a los demás como quieres que ellos te traten”, sino que se reduce a pura matemática. Euclides estará sonriendo desde el otro lado de la existencia. Cuando le preguntaron a Euclides (Megara, +/- 400 ac) qué pensaba de los dioses, dijo: “No sé nada más de ellos que esto: que odian a las personas inquisitivas”. Y con razón.

En 1944, John von Neumann y Oskar Morgen-stern publicaron su libro "Theory of Games and Economic Behavior", iniciando la aplicación de la Teoría de los Juegos al análisis económico. En 1994 se concedió el Premio Nobel de Economía a John Harsanyi, John Nash (el de “Una mente maravillosa”) y Reinhard Selten, por sus pioneros análisis del equilibrio en la Teoría de los Juegos no cooperativos. En 2005 se concedió el Premio Nobel de Economía a Robert J. Aumann y Thomas C. Schelling "por ampliar nuestra comprensión del conflicto y la cooperación mediante el análisis de la Teoría de los Juegos".










BUDISMO · ECOLOGÍA · VIDA SANA · SOLIDARIDAD · CULTURA