Week 1
Statistisch spel met complete informatie
In een statistisch spel zijn er spelers 𝑖 ∈ 𝑁. We noemen acties 𝑎 ∈ 𝐴 strategieën en geven ze
weer door 𝑠 ∈ 𝑆, voor speler 𝑖, 𝑠! ∈ 𝑆! . Payoff van een speler hangt af van wat zij kiest en
wat andere spelers kiezen, 𝑣! (𝑠! , 𝑠"! )
Spel in normale vorm
In de normale vorm van een spel zit een verzameling spelers 𝑁 = {𝑖 } = {1, … , 𝑛}, een
verzameling strategieën voor elke 𝑖 ∈ 𝑁, 𝑆 = 𝑆# × … × 𝑆$ en een payoff functie 𝑣! : 𝑆 → ℝ.
De notatie van het spel is dan Γ = 〈{𝑖}, {𝑆! }, {𝑣! }〉 of Γ = 〈𝑁, 𝑆, 𝑣〉 met 𝑣: 𝑆 → ℝ$ is de
gezamenlijke payoff functie. 𝑆! is de verzameling “pure” strategieën, zeg mar niet-
stochastisch. Strategieprofiel 𝑠 = (𝑠# , … , 𝑠!"# , 𝑠! , 𝑠!%# , … , 𝑠$ ) = (𝑠! , 𝑠"! ) en strategieruimte
𝑆 = 𝑆# × … × 𝑆$ = 𝑆! × 𝑆"!
Definitie strategie
Een strategie is een compleet contingent plan. In normale spelen maakt iedere speler zijn
keuze zonder weet te hebben van de keuzes die ander spelers gemaakt hebben
(“simultaan”) en kent elke speler het spel (het is zelfs “common knowledge”)
Nash Evenwicht (NE)
Een strategieprofiel 𝑠 ∗ = (𝑠!∗ , 𝑠"! ∗
) is een Nash Evenwicht (NE) als (2 definities:
∗ ∗ ∗
- 𝑣! (𝑠! , 𝑠"! ) ≥ 𝑣! (𝑠! , 𝑠"! ) ∀𝑠! ∈ 𝑆! en ∀𝑖 ∈ 𝑁
- 𝑠!∗ = 𝐵𝑅! (𝑠"! ∗
) ∀𝑖 ∈ 𝑁
∗ ∗
𝐵𝑅! (𝑠"! ) is de best reply van speler 𝑖 gegeven dat de andere spelers 𝑠"! spelen.
∗
Als 𝑠 niet NE is, dan is het onwaarschijnlijk dat spelers dit strategieprofiel zullen spelen,
want er is op z’n minst 1 speler die strikt hogere payoffs kan krijgen. Elke speler kent de NE
Mixed strategieën
De strategieruimte kan vergroot worden door kansen te koppelen aan de strategieën. De
notatie is dan 𝜎! = 𝑝! , waar 𝑝! de kans is dat speler 𝑖 voor een strategie kiest.
Als Pr(𝑠! |𝜎! ) > 0 in een mixed strategie 𝜎! , dan moet 𝑠! moet een 𝐵𝑅 zijn: 𝑠! ∈ 𝐵𝑅! (𝜎"! ).
Als Pr(𝑠! |𝜎! ) = 0, dan kan 𝑠! een 𝐵𝑅 zijn. Elke spel Γ = 〈{𝑖}, {𝑆! }, {𝑣! }〉 met eindige
verzamelingen {𝑖} en {𝑆! } heeft ten minste 1 NE, wellicht in mixed strategieën
Dominante strategieën
Strategie 𝑠! is een strikt dominante strategie als het strikt beter is dan elke andere strategie
𝑠!' , onafhankelijk van wat de andere spelers spelen: ∀𝑠!' ∈ 𝑆! \𝑠! en
∀𝑠"! ∈ 𝑆"! : 𝑣! (𝑠! , 𝑠"! ) > 𝑣! (𝑠!' , 𝑠"! ). Strategie 𝑠! is een zwak dominante strategie als het niet
slechter is dan elke andere strategie 𝑠!' , onafhankelijk van wat de andere spelers spelen:
∀𝑠!' ∈ 𝑆! en ∀𝑠"! ∈ 𝑆"! : 𝑣! (𝑠! , 𝑠"! ) ≥ 𝑣! (𝑠!' , 𝑠"! )
Zwakke en strikte dominantie
Als een best reply 𝑠!∗ ∈ 𝐵𝑅! (𝑠"! ) constant is, dan is het een zwak dominante strategie. Als
het daarnaast uniek is, 𝑠!∗ = 𝐵𝑅! (𝑠"! ), dan is het strikt dominante strategie
Gedomineerde strategieën
Strategie 𝑠! is een strikt gedomineerde strategie als er een andere strategie 𝑠!' is die strikt
beter is dan 𝑠! , onafhankelijk van wat de andere spelers spelen:
∃𝑠!' ∈ 𝑆! : ∀𝑠"! ∈ 𝑆"! : 𝑣! (𝑠! , 𝑠"! ) < 𝑣! (𝑠!' , 𝑠"! )
Informatiezameling (IV)
Als in een spelboom simultaan wordt besloten, dan ontstaat er een informatieverzameling.
Speler 2 weet niet wat speler 1 heeft gekozen, dus in de knopen van speler 2 heeft hij
dezelfde informatie. Tussen de knopen van speler 2 komt een gestippelde lijn. Schrijf ℎ! (𝑠"! )
voor een IV van 𝑖. Een informatie partitie 𝐻! ≔ {ℎ! } − de collectie van IVs van 𝑖
Spel in extensieve vorm
Een spel in extensieve vorm is 〈𝑁, 𝑆, 𝑣〉, plus een spelboom en informatieverzameling
Dus Γ = 〈𝑉, 𝐸, 𝐻, 𝑁, 𝑆, 𝑣〉
,Gedragsstrategie
Een gedragsstrategie van speler 𝑖 is een verzameling kansverdelingen over acties in elke info
set ℎ! . Voor elke gedragsstrategie is een mixed strategie te vinden met dezelfde
kansverdeling over acties, andersom geldt niet. In dynamische spelen gebruiken we liever
gedragsstrategieën, in statistische spelen doet onderscheid er niet toe
Subspel
Een subspel van Γ is een spel. De beginknoop van het spel is een info set met 1 knoop. Het
omvat alle info sets en eindknopen die vanuit de beginknoop van het subspel bereikt
worden en niet meer. Een subspel snijdt geen info set in tweeën. Het subspel kan
aangegeven worden met het unieke pad dat naar de beginknoop van het subspel leidt
Subspel Perfect Nash Evenwicht (SPNE)
Het strategieprofiel (𝜎! , 𝜎"! ) is een SPNE als het voor elke subspel strategieën voorschrijft
die NE zijn. SPNE is, per definitie, een NE, niet alleen in Γ, maar ook in alle andere subspelen
Nut
In de speltheorie maximaliseren hun (verwachte) nut, gegeven het gedrag van anderen, dus
de payoffs moet je lezen als nutsniveaus. Nut is stijgend in inkomen
Risicohouding
Als de Bernoulli nutsfunctie lineair is, 𝑢(𝑥) = 𝑎𝑥 + 𝑏, 𝑎 > 0, dan heet de persoon
risiconeutraal. Als de Bernoulli nutsfunctie concaaf is, 𝑢′(𝑥) > 0, 𝑢'' (𝑥) < 0, dan heet de
persoon risicomijdend. Als de Bernoulli nutsfunctie convex is, 𝑢' (𝑥) > 0, 𝑢'' (𝑥) > 0, dan
heet de persoon risiconeutraal
Implicaties risicohouding
Risiconeutrale mensen zijn indifferent tussen het spelen van een loterij en het krijgen van de
verwachte monetaire payoff met zekerheid: ∫ 𝑢(𝑥)𝑑𝐹(𝑥) = 𝑢(∫ 𝑥𝑑𝐹(𝑥)). Risicomijdende
mensen ontvangen liever de verwachte monetaire payoff dan dat ze de loterij spelen:
∫ 𝑢(𝑥)𝑑𝐹(𝑥) < 𝑢(∫ 𝑥𝑑𝐹(𝑥)). Risicozoekende mensen spelen liever de loterij dan dat ze de
verwachte monetaire payoff ontvangen met zekerheid
Risicohouding meten
Er zijn verschillende maten voor iemands risicohouding. Twee populaire maten zijn:
)!! (+)
- Arrow-Pratt degree of absolute rist aversion, 𝑅(𝑥) = − )!(+) . Als 𝑅(𝑥) constnt is, dan
#"- "#$
spreken we over een CARA nutsfunctie, 𝑢(𝑥) = .
+)!! (+)
- Arrow-Pratt degree of relative risk aversion, 𝑟(𝑥) = − )! (+)
. Als 𝑟(𝑥) constant is, dan
+ %"& "#
spreken we over een CRRA nutsfunctie, 𝑢(𝑥) = #"/
Eerste orde stochastische dominantie
Twee stochastische variabelen, 𝑋 en 𝑌, met respectieve verdelingsfunctie 𝐹 en 𝐺 met 𝐹, 𝐺
zijn niet-dalend en 𝐹, 𝐺: [−∞, +∞] → [0,1]. We zeggen dat 𝑋 first-order stochastically
dominates 𝑌 als ∀𝑡 1 − 𝐹(𝑡) ≥ 1 − 𝐺(𝑡). Compact: 𝑋 FOSD 𝑌. Stel dat 𝑋 FOSD 𝑌 met elk
individu met 𝑢(𝑥) en 𝑢' (𝑥) > 0 prefereert 𝑋 boven 𝑌, 𝐸^𝑢(𝑋)_ ≥ 𝐸^𝑢(𝑌)_
Tweede orde stochastische dominantie
+
We zeggen dat 𝑋 second-order stochastically dominates 𝑌 als ∀𝑡 ∫"0^1 − 𝐹(𝑡)_𝑑𝑡 ≥
+
∫"0^1 − 𝐺(𝑡)_𝑑𝑡. Compact: 𝑋 SOSD 𝑌. It holds that 𝑋 FOSD 𝑌 ⟹ 𝑋 SOSD 𝑌. Stel dat 𝑋
SOSD 𝑌. Elk risicomijdend individu, 𝑢(𝑥), 𝑢' (𝑥) > 0 en 𝑢'' (𝑥) < 0 prefereert 𝑋 boven 𝑌,
𝐸^𝑢(𝑋)_ ≥ 𝐸^𝑢(𝑌)_
Order statistics
Beschouw een steekproef 𝑋 = {𝑋# , … , 𝑋$ } van 𝑛 iid stochasten, elk met verdeling 𝐹(𝑥).
Orden de realisatie van de steekproef, van klein naar groot. 𝑋(#) ≔ min 𝑋, 𝑋($) ≔ max 𝑋 en
, 𝑋(1) als de 𝑘 2- order statistic 𝑘 = 1, … , 𝑛. 𝑋(1) is een stochast, en met de steekproefgrootte
($)
is het 𝑋(1)
Verdeling order statistics
($) ($) ($) ($)
De verdelingsfunctie van 𝑋(1) is 𝐹(1) (𝑥) = 𝑃h𝑋(1) ≤ 𝑥j. 𝐹($) (𝑥) = 𝐹(𝑥)$ en
($) $ ($)
𝐹(#) (𝑥) = 1 − ^1 − 𝐹(𝑥)_ . 𝐹($"#)(𝑥) = 𝑛𝐹(𝑥)$"# ^1 − 𝐹(𝑥)_ + 𝐹(𝑥)$ en
($)
𝑓($"#) (𝑥) = 𝑛(𝑛 − 1)𝐹(𝑥)$"3 ^1 − 𝐹(𝑥)_𝑓(𝑥)
(Im)perfecte informatie
Wel of niet zien van acties van andere spelers
(In)complete informatie
Elke speler weet alles / niet elke speler weet alles over het spel dat gespeeld wordt
Bayesiaanse spelen
Voeg speler toe, Nature, 𝑁. Nature kiest als eerste en bepaalt wat de spelers weten.
Sommige spelers zien de keuze van Nature, anderen niet. Nature is randomisatie device,
heeft geen doelstellingsfunctie. Het past een mixed strategy toe. Modeleer incomplete
informatie door aan te nemen dat speler keuze van Nature niet ziet. Door Nature toe te
voegen herschrijven we een spel met incomplete informatie als een spel met complete maar
imperfecte informatie
Typen en Bayesiaanse strategie
We zeggen dat speler 1 van bepaalde typen kan, 𝜃4 ∈ Θ4 , met Θ4 de verzameling van alle
mogelijke types voor speler 1. Speler 1 kent zijn type, maar de spelers erna niet, maar wel de
kans waarmee speler 1 een bepaald type is
Bayesiaans spel
Breid spel met spelers uit naar spel met speler-types: verzameling spelers 𝑁, verzameling
typen voor elke speler Θ! , verzameling acties voor elke speler 𝐴! , een payoff functie voor
elke speler 𝑣! (𝑎! , 𝑎"! , 𝜃! , 𝜃"! ) en een gezamenlijke kansdichtheidsfunctie of gezamenlijke
kansverdeling 𝑝(𝜃! , 𝜃"! ). Speler gebruikt, indien mogelijk, zijn type om beliefs over andere
spelers bij te stellen: gegeven 𝑝(𝜃! , 𝜃"! ) kan 𝑝(𝜃"! |𝜃! ) berekend worden met Bayes rule.
Speler 𝑖 kent 𝜃! en bepaalt verwachte payoffs van acties m.b.v. conditionele kansverdeling
𝑝(𝜃"! |𝜃! )
Payoffs
Ex post payoff: 𝑣! (𝑎! , 𝑎"! , 𝜃! , 𝜃"! ). Verwachte payoff in interim stage (als 𝑖 zijn type 𝜃! kent):
𝑉! (𝑎! , 𝑠"! ; 𝜃! ) = ∑5"' 𝑃(𝜃"! |𝜃! )𝑣! (𝑎! , 𝑠"! (𝜃"! ), 𝜃! , 𝜃"! ). Verwachte payoff ex ante (als
strategie opgeschreven wordt): 𝑉! (𝑠! , 𝑠"! ) = ∑5' 𝑃(𝜃! )𝑉! (𝑎! , 𝑠"! ; 𝜃! )
Bayes-Nash evenwicht (BNE)
Een strategieprofiel 𝑠 ∗ is een BNE als het een Nash evenwicht is van een Bayesiaans spel,
𝑉! (𝑠!∗ , 𝑠"!
∗ ∗
) ≥ 𝑉! (𝑠! , 𝑠"! ) voor alle 𝑠! ∈ 𝑆! en alle 𝑖
Alternatieve definitie BNE
Als Θ! continuüm is dan is 𝑠!∗ een functie. 𝑠 ∗ is een BNE ⟺ 𝑉! (𝑠!∗ (𝜃! ), 𝑠"! ∗ ∗
, 𝜃! ) ≥ 𝑉! (𝑎! , 𝑠"! , 𝜃! )
voor alle 𝜃! en 𝑖
Algemenere opzet
Voor sommige spelen hebben we een algemenere opzet nodig dan eerder beschreven. Er
zijn states of the world, 𝑤 ∈ Ω. 𝑤 wordt getrokken met kans 𝑃(𝑤). In state 𝑤, Nature stuurt
iedere speler 𝑖 signaal 𝜃! (𝑤), 𝑚𝑒𝑡 𝜃! ∈ Θ! . Signaal 𝜃! kan stochastisch zijn met 𝑃(𝜃! |𝑤) in
state w. Conditioneel op 𝑤 ∈ 𝑊 kunnen types {𝜃! } onafhankelijk of gecorreleerd zijn
Beliefs en belief systeem
De beliefs 𝜇(ℎ! ) van 𝑖 in een informatieset ℎ! zijn een kansverdeling over de
beslissingsnodes in ℎ! . Het beliefsystem 𝜇! van 𝑖 is een verzameling kansverdelingen 𝜇(ℎ! )
over beslissingnodes in elke informatieset ℎ! ∈ 𝐻! .