IllustrationEdit

I en straffspark i fotboll måste sparkaren välja om han ska sparka till höger eller vänster om målet, och samtidigt måste målvakten välja åt vilket håll han ska blockera den. Dessutom har sparkaren en riktning som han är bäst på att skjuta, vilket är vänster om han är högerfotad. Matrisen för fotbollsspelet illustrerar denna situation, en förenklad form av det spel som studerats av Chiappori, Levitt och Groseclose (2002). Den utgår från att om målvakten gissar rätt blockeras sparken, vilket sätts till basutbetalningen 0 för båda spelarna. Om målvakten gissar fel är det mer sannolikt att sparken går in om den är till vänster (utdelning +2 för sparkaren och -2 för målvakten) än om den är till höger (lägre utdelning +1 för sparkaren och -1 för målvakten).

Målvakt
Lean Left Lean Right
Kicker Kick Left 0, 0 +2, -2
Spark höger +1, -1 0, 0
Utbetalning av fotbollsspelet (Kicker, Målvakt)

Det här spelet har ingen jämvikt med ren strategi, eftersom den ena eller andra spelaren skulle avvika från vilken profil som helst av strategierna – till exempel är (Vänster, Vänster) inte en jämvikt eftersom kicker skulle avvika till höger och öka sin utdelning från 0 till 1.

Kickerns jämvikt med blandade strategier hittas från det faktum att han kommer att avvika från att randomisera om inte hans payoffs från Left Kick och Right Kick är exakt lika stora. Om målvakten lutar åt vänster med sannolikheten g är kickerns förväntade utdelning från Kick Left g(0) + (1-g)(2) och från Kick Right g(1) + (1-g)(0). Genom att sätta likhetstecken mellan dessa resultat får man g= 2/3. På samma sätt är målvakten villig att randomisera endast om sparkaren väljer en sådan sannolikhet för blandad strategi k att Lean Left’s payoff på k(0) + (1-k)(-1) är lika med Lean Right’s payoff på k(-2) + (1-k)(0), så k = 1/3. Således är jämvikten med blandad strategi (Prob(Kick Left) = 1/3, (Prob(Lean Left) = 2/3).

Bemärk att i jämvikt sparkar sparkaren till sin bästa sida endast 1/3 av tiden. Det beror på att målvakten bevakar den sidan mer. Notera också att i jämvikt är sparkaren likgiltig åt vilket håll han sparkar, men för att det ska vara en jämvikt måste han välja exakt 1/3 sannolikhet.

Chiappori, Levitt och Groseclose försöker mäta hur viktigt det är för sparkaren att sparka till sin favoritsida, lägga till centerkickar etc., och titta på hur professionella spelare faktiskt beter sig. De försöker också mäta hur viktigt det är för sparkaren att sparka till sin favoritsida, lägga till centerkickar etc. och titta på hur professionella spelare faktiskt beter sig. De finner att de faktiskt randomiserar och att sparkarna sparkar till sin favoritsida 45 procent av gångerna och att målvakterna lutar sig åt den sidan 57 procent av gångerna. Deras artikel är välkänd som ett exempel på hur människor i det verkliga livet använder sig av blandade strategier trots att de inte är matematiskt sofistikerade.

BetydelseEdit

I sin berömda artikel bevisade John Forbes Nash att det finns en jämvikt för varje ändligt spel. Man kan dela in Nashs jämvikter i två typer. Nash-jämvikter med ren strategi är Nash-jämvikter där alla spelare spelar rena strategier. Nash-jämvikter med blandad strategi är jämvikter där minst en spelare spelar en blandad strategi. Nash bevisade att alla ändliga spel har en Nash-jämvikt, men alla har inte Nash-jämvikter med ren strategi. För ett exempel på ett spel som inte har en Nash-jämvikt med rena strategier, se Matching pennies. Många spel har dock Nash-jämvikter i ren strategi (t.ex. samordningsspelet, fångens dilemma och hjortjakten). Vidare kan spel ha både jämvikter med ren strategi och jämvikter med blandad strategi. Ett enkelt exempel är det rena samordningsspelet, där det utöver de rena strategierna (A,A) och (B,B) finns en blandad jämvikt där båda spelarna spelar någon av strategierna med sannolikhet 1/2.

Tolkningar av blandade strategierEdit

Under 1980-talet kom begreppet blandade strategier under kraftig beskjutning för att vara ”intuitivt problematiskt”, eftersom de är svaga Nash-jämvikter och en spelare är indifferent i fråga om huruvida han ska följa sin jämviktsstrategis sannolikhet eller avvika till någon annan sannolikhet. spelteoretikern Ariel Rubinstein beskriver alternativa sätt att förstå begreppet. Det första, som beror på Harsanyi (1973), kallas renodling och utgår från att tolkningen av blandade strategier endast återspeglar vår bristande kunskap om spelarnas information och beslutsprocess. Till synes slumpmässiga val ses då som konsekvenser av ospecificerade, för utdelningen irrelevanta exogena faktorer.En andra tolkning föreställer sig att spelarna står för en stor population av agenter. Var och en av agenterna väljer en ren strategi, och vinsten beror på hur stor andel av agenterna som väljer varje strategi. Den blandade strategin representerar således fördelningen av rena strategier som väljs av varje population. Detta ger dock inget rättfärdigande för det fall då spelarna är individuella agenter.

Senare omtolkade Aumann och Brandenburger (1995) Nash equilibrium som en jämvikt i trosuppfattningar, snarare än i handlingar. Till exempel skulle en jämvikt i trosuppfattningar i rock paper scissors innebära att varje spelare tror att det är lika troligt att den andra spelaren spelar varje strategi. Denna tolkning försvagar dock Nash-jämviktens beskrivande förmåga, eftersom det i en sådan jämvikt är möjligt för varje spelare att faktiskt spela en ren strategi av Rock i varje spelomgång, även om sannolikheterna med tiden är de för den blandade strategin.

BeteendestrategiRedigera

Men medan en blandad strategi tilldelar en sannolikhetsfördelning över de rena strategierna tilldelar en beteendestrategi för varje informationsuppsättning en sannolikhetsfördelning över uppsättningen av möjliga handlingar. Medan de två begreppen är mycket nära besläktade i samband med normalformspel, har de mycket olika konsekvenser för extensiva formspel. Grovt sett väljer en blandad strategi slumpmässigt en deterministisk väg genom spelträdet, medan en beteendestrategi kan ses som en stokastisk väg.

Sambandet mellan blandade strategier och beteendestrategier är föremål för Kuhns teorem, en beteendevetenskaplig syn på traditionella spelteoretiska hypoteser. Resultatet fastställer att det i varje ändligt extensivt spel med perfekt återkallande, för varje spelare och varje blandad strategi, finns en beteendestrategi som, mot alla profiler av strategier (för andra spelare), inducerar samma fördelning över terminala noder som den blandade strategin gör. Det omvända är också sant.

Ett berömt exempel på varför perfekt återkallande krävs för ekvivalensen ges av Piccione och Rubinstein (1997) med deras spel Absent-Minded Driver game.

Lämna ett svar

Din e-postadress kommer inte publiceras.