IllustrationEdit

Bij een strafschop in het voetbal moet de schopper kiezen of hij naar de rechter- of de linkerkant van het doel trapt, en tegelijkertijd moet de keeper beslissen welke kant hij de strafschop wil blokkeren. Ook heeft de schopper een richting waarin hij het best kan schieten, en dat is links als hij rechtsvoetig is. De matrix voor het voetbalspel illustreert deze situatie, een vereenvoudigde vorm van het spel dat is bestudeerd door Chiappori, Levitt, en Groseclose (2002). De matrix gaat ervan uit dat als de keeper juist raadt, de trap wordt geblokkeerd, wat voor beide spelers de basisopbrengst 0 is. Als de keeper verkeerd raadt, is de kans groter dat de schop erin gaat als deze naar links is (uitbetaling van +2 voor de kicker en -2 voor de keeper) dan als deze naar rechts is (de lagere uitbetaling van +1 voor de kicker en -1 voor de keeper).

Goalie
Lean links Lean rechts
Kicker Kick links 0, 0 +2, -2
Kick Rechts +1, -1 0, 0
Payoff voor het voetbalspel (Kicker, Goalie)

Dit spel heeft geen zuiver strategisch evenwicht, omdat de ene of de andere speler zou afwijken van elk profiel van strategieën-bijvoorbeeld (Links, Links) is geen evenwicht omdat de schopper zou afwijken naar Rechts en zijn uitbetaling zou verhogen van 0 naar 1.

Het gemengde-strategie-evenwicht van de schopper wordt gevonden uit het feit dat hij zal afwijken van willekeurig schoppen tenzij zijn uitbetalingen van Linker Schop en Rechter Schop precies gelijk zijn. Als de keeper naar links leunt met kans g, is de verwachte opbrengst van de schopper van Kick Links g(0) + (1-g)(2), en van Kick Rechts g(1) + (1-g)(0). De vergelijking levert g= 2/3 op. Op dezelfde manier is de keeper alleen bereid om te roteren als de kicker gemengde strategie kans k zo kiest dat Lean Left’s uitbetaling van k(0) + (1-k)(-1) gelijk is aan Lean Right’s uitbetaling van k(-2) + (1-k)(0), dus k = 1/3. Dus, de gemengde-strategie evenwicht is (Prob(Kick Left) = 1/3, (Prob(Lean Left) = 2/3).

Noteer dat in evenwicht, de kicker kickt naar zijn beste kant slechts 1/3 van de tijd. Dat komt omdat de keeper die kant meer bewaakt. Merk ook op dat in evenwicht, de schopper onverschillig is welke kant hij op trapt, maar om een evenwicht te zijn moet hij precies 1/3 kans kiezen.

Chiappori, Levitt, en Groseclose proberen te meten hoe belangrijk het is voor de schopper om naar zijn favoriete kant te trappen, voegen middenschoppen toe, etc., en kijken naar hoe professionele spelers zich daadwerkelijk gedragen. Zij vinden dat zij willekeurig te werk gaan, en dat schoppers 45% van de tijd naar hun favoriete kant schoppen en keepers 57% van de tijd naar die kant leunen. Hun artikel is bekend als een voorbeeld van hoe mensen in het echte leven gemengde strategieën gebruiken ondanks het feit dat ze niet wiskundig onderlegd zijn.

SignificanceEdit

In zijn beroemde paper bewees John Forbes Nash dat er een evenwicht bestaat voor elk eindig spel. Men kan Nash-evenwichten in twee soorten verdelen. Pure strategie Nash evenwichten zijn Nash evenwichten waar alle spelers pure strategieën spelen. Gemengde strategie Nash evenwichten zijn evenwichten waar minstens één speler een gemengde strategie speelt. Hoewel Nash bewees dat elk eindig spel een Nash-evenwicht heeft, hebben niet alle spellen zuivere strategie Nash-evenwichten. Voor een voorbeeld van een spel dat geen Nash-evenwicht in zuivere strategieën heeft, zie Matching pennies. Veel spellen hebben echter wel een zuiver strategisch Nash-evenwicht (bijv. het Coördinatiespel, het Prisoner’s dilemma, de Stag hunt). Verder kunnen spellen zowel zuivere strategie als gemengde strategie-evenwichten hebben. Een eenvoudig voorbeeld is het zuivere coördinatiespel, waarbij naast de zuivere strategieën (A,A) en (B,B) een gemengd evenwicht bestaat waarin beide spelers een van beide strategieën spelen met kans 1/2.

Interpretaties van gemengde strategieënEdit

In de jaren tachtig kwam het concept van gemengde strategieën zwaar onder vuur te liggen omdat het “intuïtief problematisch” zou zijn, omdat het zwakke Nash-evenwichten zijn, en een speler onverschillig is over de vraag of hij zijn evenwichtsstrategiekans moet volgen of moet afwijken naar een andere kans. speltheoreticus Ariel Rubinstein beschrijft alternatieve manieren om het concept te begrijpen. De eerste, te danken aan Harsanyi (1973), wordt zuivering genoemd, en veronderstelt dat de gemengde strategieën interpretatie slechts ons gebrek aan kennis van de informatie en het besluitvormingsproces van de spelers weerspiegelt. Schijnbaar willekeurige keuzes worden dan gezien als gevolgen van niet gespecificeerde, voor de uitbetaling irrelevante exogene factoren.Een tweede interpretatie stelt zich voor dat de spelers van het spel staan voor een grote populatie van agenten. Elk van de agenten kiest een zuivere strategie, en de uitbetaling hangt af van de fractie van agenten die elke strategie kiezen. De gemengde strategie vertegenwoordigt dus de verdeling van de zuivere strategieën die door elke populatie worden gekozen. Dit biedt echter geen rechtvaardiging voor het geval dat de spelers individuele agenten zijn.

Later, Aumann en Brandenburger (1995), herinterpreteerden het Nash evenwicht als een evenwicht in overtuigingen, eerder dan in acties. Bijvoorbeeld, bij steen-papier-schaar zou een evenwicht in overtuigingen inhouden dat elke speler gelooft dat de ander evenveel kans heeft om elke strategie te spelen. Deze interpretatie verzwakt echter de beschrijvende kracht van het Nash-evenwicht, omdat het in een dergelijk evenwicht mogelijk is dat elke speler in elk spel een zuivere strategie van Rots speelt, ook al zijn de kansen in de tijd die van de gemengde strategie.

GedragsstrategieEdit

Want een gemengde strategie kent een kansverdeling over zuivere strategieën toe, een gedragsstrategie kent bij elke informatieverzameling een kansverdeling over de verzameling van mogelijke acties toe. Hoewel de twee concepten zeer nauw verwant zijn in de context van normale vormspelen, hebben zij zeer verschillende implicaties voor extensieve vormspelen. Ruwweg kiest een gemengde strategie willekeurig een deterministisch pad door de spelboom, terwijl een gedragsstrategie kan worden gezien als een stochastisch pad.

De relatie tussen gemengde en gedragsstrategieën is het onderwerp van Kuhn’s stelling, een gedragsmatige kijk op traditionele speltheoretische hypothesen. Het resultaat stelt dat in elk eindig extensief-vormig spel met perfecte herinnering, voor elke speler en elke gemengde strategie, er een gedragsstrategie bestaat die, tegen alle profielen van strategieën (van andere spelers), dezelfde verdeling over eindknopen induceert als de gemengde strategie doet. Het omgekeerde is ook waar.

Een beroemd voorbeeld van waarom perfect recall nodig is voor de gelijkwaardigheid wordt gegeven door Piccione en Rubinstein (1997) met hun Absent-Minded Driver game.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.