IllustrationEdit
Dans un coup de pied de pénalité au football, le botteur doit choisir s’il doit frapper à droite ou à gauche du but, et simultanément le gardien doit décider de quelle manière le bloquer. De plus, le botteur a une direction dans laquelle il est le meilleur pour tirer, qui est la gauche s’il est droitier. La matrice du jeu de football illustre cette situation, une forme simplifiée du jeu étudié par Chiappori, Levitt et Groseclose (2002). Elle suppose que si le gardien de but devine correctement, le coup de pied est bloqué, ce qui correspond au gain de base de 0 pour les deux joueurs. Si le gardien se trompe, le coup de pied a plus de chances de rentrer s’il est à gauche (payoffs de +2 pour le botteur et de -2 pour le gardien) que s’il est à droite (payoff inférieur de +1 pour le botteur et de -1 pour le gardien).
Goalie | |||
Lean Left | Lean Right | ||
Kicker | Kick Left | 0, 0 | +2, -2 |
Coup de pied droit | +1, -1 | 0, 0 | |
Gain pour le jeu de football (botteur, Gardien de but) | |||
Ce jeu n’a pas d’équilibre de stratégie pure, car un joueur ou l’autre dévierait de n’importe quel profil de stratégies-par exemple, (Gauche, Gauche) n’est pas un équilibre car le botteur dévierait vers la droite et augmenterait son gain de 0 à 1.
L’équilibre de stratégie mixte du botteur est trouvé à partir du fait qu’il déviera de la randomisation à moins que ses gains du coup de pied gauche et du coup de pied droit soient exactement égaux. Si le gardien penche à gauche avec la probabilité g, le gain attendu du botteur pour le coup de pied gauche est g(0) + (1-g)(2), et pour le coup de pied droit est g(1) + (1-g)(0). En les mettant en équation, on obtient g= 2/3. De même, le gardien de but n’est prêt à faire un choix aléatoire que si le botteur choisit une probabilité de stratégie mixte k telle que le gain de k(0) + (1-k)(-1) de Lean Left est égal au gain de k(-2) + (1-k)(0) de Lean Right, soit k = 1/3. Ainsi, l’équilibre de la stratégie mixte est (Prob(Kick Left) = 1/3, (Prob(Lean Left) = 2/3).
Notez qu’à l’équilibre, le botteur ne botte vers son meilleur côté qu’un tiers du temps. Cela est dû au fait que le gardien de but garde davantage ce côté. Notez également qu’à l’équilibre, le botteur est indifférent à la façon dont il botte, mais pour que ce soit un équilibre, il doit choisir exactement 1/3 de probabilité.
Chiappori, Levitt et Groseclose essaient de mesurer l’importance pour le botteur de botter vers son côté favorisé, ajoutent les coups de pied centraux, etc. et regardent comment les joueurs professionnels se comportent réellement. Ils constatent qu’il y a bel et bien randomisation et que les botteurs bottent vers leur côté favori dans 45 % des cas et que les gardiens penchent vers ce côté dans 57 % des cas. Leur article est bien connu comme un exemple de la façon dont les gens dans la vie réelle utilisent des stratégies mixtes malgré le fait qu’ils ne sont pas mathématiquement sophistiqués.
SignificanceEdit
Dans son célèbre article, John Forbes Nash a prouvé qu’il existe un équilibre pour chaque jeu fini. On peut diviser les équilibres de Nash en deux types . Les équilibres de Nash à stratégie pure sont des équilibres de Nash où tous les joueurs jouent des stratégies pures. Les équilibres de Nash à stratégie mixte sont des équilibres où au moins un joueur joue une stratégie mixte. Bien que Nash ait prouvé que tout jeu fini a un équilibre de Nash, tous n’ont pas d’équilibres de Nash à stratégie pure. Pour un exemple de jeu qui n’a pas d’équilibre de Nash en stratégie pure, voir Matching pennies. Cependant, de nombreux jeux ont des équilibres de Nash en stratégie pure (par exemple, le jeu de coordination, le dilemme du prisonnier, la chasse au cerf). En outre, les jeux peuvent avoir à la fois des équilibres de stratégie pure et de stratégie mixte. Un exemple facile est le jeu de coordination pur, où en plus des stratégies pures (A,A) et (B,B), il existe un équilibre mixte dans lequel les deux joueurs jouent l’une ou l’autre stratégie avec une probabilité 1/2.
Interprétations des stratégies mixtesEdit
Durant les années 1980, le concept de stratégies mixtes a fait l’objet de vives critiques pour être « intuitivement problématique », puisqu’il s’agit d’équilibres de Nash faibles, et qu’un joueur est indifférent au fait de suivre sa probabilité de stratégie d’équilibre ou de dévier vers une autre probabilité. Le théoricien des jeux Ariel Rubinstein décrit des façons alternatives de comprendre le concept. La première, due à Harsanyi (1973), est appelée purification et suppose que l’interprétation des stratégies mixtes reflète simplement notre manque de connaissance des informations et du processus de décision des joueurs. Les choix apparemment aléatoires sont alors considérés comme les conséquences de facteurs exogènes non spécifiés et sans rapport avec les gains. Une deuxième interprétation consiste à imaginer que les joueurs représentent une grande population d’agents. Chacun des agents choisit une stratégie pure, et le gain dépend de la fraction d’agents choisissant chaque stratégie. La stratégie mixte représente donc la distribution des stratégies pures choisies par chaque population. Cependant, cela ne fournit aucune justification pour le cas où les joueurs sont des agents individuels.
Plus tard, Aumann et Brandenburger (1995), ont réinterprété l’équilibre de Nash comme un équilibre dans les croyances, plutôt que dans les actions. Par exemple, dans le cas de pierre-papier-ciseaux, un équilibre dans les croyances voudrait que chaque joueur croie que l’autre a la même probabilité de jouer chaque stratégie. Cette interprétation affaiblit cependant le pouvoir descriptif de l’équilibre de Nash, car il est possible dans un tel équilibre que chaque joueur joue effectivement une stratégie pure de Roche à chaque partie du jeu, même si au fil du temps les probabilités sont celles de la stratégie mixte.
Stratégie de comportementModifier
Alors qu’une stratégie mixte attribue une distribution de probabilité sur les stratégies pures, une stratégie de comportement attribue à chaque ensemble d’informations une distribution de probabilité sur l’ensemble des actions possibles. Alors que les deux concepts sont très étroitement liés dans le contexte des jeux de forme normale, ils ont des implications très différentes pour les jeux de forme extensive. Grossièrement, une stratégie mixte choisit aléatoirement un chemin déterministe à travers l’arbre de jeu, tandis qu’une stratégie de comportement peut être vue comme un chemin stochastique.
La relation entre les stratégies mixtes et les stratégies de comportement est le sujet du théorème de Kuhn, une perspective comportementale sur les hypothèses traditionnelles de la théorie des jeux. Le résultat établit que dans tout jeu de forme extensive fini avec rappel parfait, pour tout joueur et toute stratégie mixte, il existe une stratégie de comportement qui, contre tous les profils de stratégies (des autres joueurs), induit la même distribution sur les nœuds terminaux que la stratégie mixte. La réciproque est également vraie.
Un exemple célèbre de la raison pour laquelle le rappel parfait est requis pour l’équivalence est donné par Piccione et Rubinstein (1997) avec leur jeu Absent-Minded Driver.