SAMENVATTING: MARKT EN STRATEGIE
DEEL 8: SPELTHEORIE
Hoofdstuk 22: Statische spelen
Het gaat om afhankelijke keuzen: supermarkten baseren hun prijzen op die van andere supermarkten
Speltheorie = de theorie van onderling afhankelijke besluitvorming, afhankelijk strategisch gedrag
Hoe moeten we verwachten dat spelers zich gedragen wanneer de uitkomst afhangt van de acties van
verschillende spelers?
Spel 1: het gevangenendilemma
De politie arresteert twee verdachten
Ze hebben voldoende bewijsmateriaal om hun allebei 1 maand gevangenisstraf te geven, maar niet
voldoende om ze volledig schuldig te verklaren (10 maanden gevangenisstraf)
De politie wil er nu voor zorgen dat de verdachten meer informatie geven en elkaar verklikken zodat ze
de echte dader kunnen ontdekken en straffen dat doen ze door onderhandelingen
De voorwaarden van de onderhandelingen zien er als volgt uit:
o Als ze allebei zwijgen, krijgen ze beiden 1 maand
o Als ze beiden klikken, krijgen ze beiden 4 maanden
o Als één iemand klikt en de andere zwijgt, dan krijgt de klikker geen straf en degene die verklikt is
krijgt 10 maanden
We gaan er vanuit dat beide spelers denken uit eigen belang, ze vertrouwen elkaar niet en denken niet
aan de andere
Ook beslissen ze tegelijkertijd: ze weten niet wat de andere gaat doen
Verdachte 2
Zwijgt Klikt
Zwijgt 1, 1 10, 0
Verdachte 1
Klikt 0, 10 4, 4
Strategie verdachte 1:
o Als verdachte 2 zwijgt, dan kan ik beter klikken (dan krijg ik 0 maanden tov 1 maand)
o Als verdachte 2 klikt, dan kan ik ook beter klikken (dan krijg ik 4 maanden tov 10)
o Verdachte 1 zal dus klikken wat de andere verdachte ook doet
Strategie verdachte 2:
o Als verdachte 1 zwijgt, dan kan ik beter klikken (0 < 1 maand)
o Als verdachte 1 klikt, dan kan ik beter ook klikken (4 < 10 maanden)
o Verdachte 2 zal ook klikken
We komen uit op punt 4,4 ze krijgen beide 4 maanden
o Merk op dat wanneer ze samen zouden werken, ze veel beter zouden kunnen uitkomen op 1,1
o Doen ze niet omdat ze elkaar niet vertrouwen want als je weet dat de andere zal zwijgen, kan
je kiezen om toch nog te klikken en 0 maanden te krijgen ipv 1
Alternatieve representatie van het spel
Nu zijn de getallen het aantal maanden gevangenisstraf dat je kan vermijden, nut = 10 – het aantal
maanden
Ze denken nog steeds enkel aan hun eigenbelang
1
,SAMENVATTING: MARKT EN STRATEGIE
Zwijgt Klikt
Zwijgt 9, 9 0, 10
Klikt 10, 0 6, 6
Het is voor beiden (voor de groep) beter om te zwijgen, maar doordat ze elkaar niet vertrouwen en voor
zichzelf kiezen komen ze op een uitkomst die voor beiden slechter is
o Het ‘common good’ is voor beide om te zwijgen
Best reply = de actie die mijn nut maximaliseert, gegeven een bepaald gedrag van de andere
Best reply functie = de regel die voor elk mogelijk gedrag van de ander de beste keuze toekent
Strikt dominante strategie = de strategie die strikt beter is dan alle andere strategieën en die
onafhankelijk is van wat de andere doet
o Vb. rechts rijden is optimaal op voorwaarde dat de andere bestuurders dat ook doen, het is dus
GEEN strikt dominante strategie want is niet onafhankelijk van wat de andere doet
o Vb. in het gevangenen dilemma is de strikt dominante strategie om te klikken
o In een spel waarin de spelers elkaar vertrouwen, zal men nooit zijn strikt dominante strategie
uitvoeren (dan kunnen ze iets afspreken om een beter resultaat te bekomen)
Uitkomst van het spel:
o Als speler 2 zwijgt, zal speler 1 klikken dat is de best reply gegeven dat speler 2 zwijgt
o Als speler 2 klikt, zal speler 1 ook klikken
o Als speler 1 zwijgt, zal speler 2 klikken en als speler 1 klikt, zal speler 2 ook klikken de best
reply functie van speler 2 is om te klikken, wat speler 1 ook doet
Klikken is de strikt dominante strategie
o We komen op 6,6 (is een slechtere uitkomst voor beiden dan 9,9)
Belangrijke inzichten bij het gevangenen dilemma
- Conflict: particuliere prikkels versus efficiëntie
o Rationele keuze kan leiden tot slechte uitkomsten
o Het leidt hen niet naar het ‘common good’
(ze zouden beiden beter af zijn wanneer ze samenwerken)
- Afspraken vooraf doen er niet toe, als spelers geen prikkels hebben om afspraken na te komen
(als ze iets afspreken, zou de ene ervoor kunnen kiezen om toch te klikken en dan vrij te gaan)
- Dominantie
o Speel nooit een strikt gedomineerde strategie (strategieën anders dan de strikt dominante, de
gedomineerde strategieën worden gedomineerd door de dominante strategieën)
o Soms bestaat er wel een strikt dominante strategie
Verandering in het spel: speler 1 is een altruïstisch persoon
We stellen nu dat speler 1 ook aan de andere speler denkt, in het belang van de groep (speler 2 denkt nog
steeds in eigenbelang)
Nut speler 1 = 20 – de som van het aantal maanden dat beide spelers krijgen
Nut speler 2 = 10 – het aantal maanden dat hij krijgt
Uitkomst matrix Payoff matrix
2
,SAMENVATTING: MARKT EN STRATEGIE
De 18 bij komt van 20 (maximaal nut) – 2 maanden die beiden samen moeten zitten als ze zwijgen
Speler 2 heeft daar als nut 9, want hij denkt enkel aan zichzelf 10 – 1
Verloop spel:
o Best reply speler 1 als speler 2 zwijgt: ook zwijgen (18 > 10)
o Best reply speler 1 als speler 2 klikt: ook klikken (12 > 10)
o Best reply functie speler 1: is er niet
o Best reply speler 2 als speler 1 zwijgt: klikken (10 > 9)
o Best reply speler 2 als speler 1 klikt: ook klikken (6 > 0)
o Best reply functie speler 2: klikken
De strategie van speler 1 hangt af van de actie van speler 2, maar de strategie van speler 2 hangt niet af
van de actie van speler 1
Speler 2 gaat sowieso klikken (denkt enkel aan zichzelf) speler 1 weet dat en zal daarom beter ook
klikken de persoon die voor de groep denkt zal dat spelen wat de groep niet ten goede komt
Klikt, klikt is een evenwicht omdat: speler 1 zijn nut maximaliseert gegeven het gedrag van speler 2 en
speler 2 ook zijn nut maximaliseert gegeven het gedrag van speler 1
o Niemand heeft er belang bij om van dat evenwicht af te wijken, want dan lopen ze risico om
slechter uit te komen evenwicht
Belangrijk inzicht: in een strategische situatie moet men zich in de schoenen van de andere kunnen
plaatsen
Normale vormen
Een spel in normale vorm specifieert volgende dingen:
- Wie de spelers zijn
- Wat de strategieën van de spelers zijn
- Hun payoff voor alle mogelijke combinaties van strategie keuzes
Toepassen op het gevangenen dilemma: twee spelers met elks twee strategieën: zwijgen of klikken
Si = {clam, rat} met Si de set van strategieën van speler i
Een specifieke strategie noteren we met si
Een strategie profiel is een paar van specifieke strategieën van beide spelers: (s1, s2)
ui staat voor de payoff of het nut van speler i
o Dat nut is afhankelijk van wat beide spelers doen: ui (s1, s2)
Bij spelen in normale vorm gaat men er vanuit dat de spelers niet van elkaar weten wat ze doen: ze kiezen
tegelijkertijd of na elkaar maar degene die het laatst kiest weet niet wat de andere heeft gedaan
In beide scenario’s noemt men dat simultane keuzes omdat ze niet op elkaars keuze gebaseerd zijn
Spelen van volledige informatie: spelen waarbij beide spelers niet enkel hun eigen set van strategieën
(mogelijke keuzes) en nutsfunctie kennen, maar ook die van de andere speler
Om het gedrag van de spelers te voorspellen gaat men op zoek naar het Nash evenwicht:
Nash evenwicht = een situatie waarbij beide spelers zijn nut maximaliseren gegeven wat de andere doet
en niemand heeft er belang bij om van dat evenwicht af te wijken
In een spel met twee spelers is het strategie profiel ( s*1, s*2) een evenwicht als:
o Speler 1 zijn nut maximaliseert gegeven het gedrag van speler 2: u1 (s*1, s*2) >= u1 (s1,
s*2) voor alle strategieën s1 in de set van strategieën S1
o Speler 2 zijn nut maximaliseert gegeven het gedrag van speler 1: u2 (s*1, s*2) >= u2 (s*1,
s2) voor alle strategieën s2 in de set van strategieën S2
Merk op: door de groter dan of gelijk aan zijn er meerdere Nash evenwichten mogelijk
3
, SAMENVATTING: MARKT EN STRATEGIE
o Als er bij de vergelijkingen strikt groter dan zou staan, dan noemen we dat evenwicht een strikt
Nash evenwicht
Twee voorwaarden voor een Nash evenwicht:
1. Rationaliteit: alle spelers zijn rationeel d.w.z. dat ze hun nut/ winst willen maximaliseren gegeven de
verwachtingen van wat de anderen zullen doen
u1 (s*1 , E1s2) >= u1 (s1, E1s2) voor alle strategieën s1 in S1 met E1s2 de verwachting van speler
1 over het gedrag van speler 2
2. Coördinatie: alle spelers weten wat er zal gebeuren als er een combinatie van strategieën zich
voordoet voordat ze hun keuze moeten maken ze hebben een juiste verwachting van wat de
andere zal doen
E1s2 = s*2
Als aan deze twee voorwaarden voldaan is, dan stellen we dat de spelers zich zullen gedragen naar een
Nash evenwicht
Hoe weten we zeker dat ze zich zullen gedragen naar dat evenwicht als die voorwaarden voldaan zijn?
o Stel de spelers zijn rationeel en ze weten wat er zal gebeuren, maar ze gedragen zich niet naar
een Nash evenwicht
o Aangezien het geen evenwicht is, zal minstens één speler geneigd zijn om af te wijken van dat
evenwicht om nog een betere uitkomst te verkrijgen (want hij is rationeel dus wilt het beste
voor zichzelf)
o Dit gaat in tegenstrijd met de veronderstelling dat de spelers van elkaar weten wat ze zullen
doen dus dit is tegenstrijdig met de assumpties!
Oefening
Met r1 de vermindering in straf die de spelers krijgen als ze
klikken en de andere zwijgt en r2 de vermindering die ze krijgen
als ze beiden klikken
- Hoe groot is r1 en r2 om te garanderen dat (klikt, klikt) een evenwicht is?
o 10 – r2 <= 10 r2 >= 0
o Verder zijn er geen restricties voor r1
- Hoe groot is r1 en r2 om te garanderen dat (klikt, klikt) het enige evenwicht is?
o 10 – r2 < 10 r2 > 0 (zodat (zwijgt, klikt) niet kan voorkomen)
o Om ervoor te zorgen dat (zwijgt, zwijgt) ook geen evenwicht wordt, moet 10 – r1 < 1 r1 > 9
Spel 2: coördinatie spel
Beschrijving van de situatie: twee auto’s kruisen elkaar op de weg, als ze beiden links of rechts blijven rijden dan
kruisen ze elkaar, anders zullen ze crashen beide chauffeurs nemen simultaan een beslissing
4