Schatters
Populatieparameters (μ, σ, π,…) zijn in de praktijk zelden of nooit gekend.
⇒ een schatting t voor de onbekende parameter λ is een getalwaarde bekomen op
basis van de verzamelde steekproefwaarden x1,x2, . . . , xn
1 n
Voorbeeld: steekproefgemiddelde x = ∑ xi
n i =1
Vermits elke onderzoeker, bij dezelfde proefopzet, andere steekproefwaarden zal
krijgen, kan een steekproef beschreven worden door kansvariabelen X1,X2, . . . , Xn
⇒ een schatter T, als functie van de steekproefwaarden X1,X2, . . . , Xn, is een
kansvariabele, deze levert voor elke concrete steekproef een nieuwe schatting op.
1 n
Voorbeeld: steekproefgemiddelde X = ∑ Xi
n i =1
Vermits een schatter een kansvariabele is, heeft deze bijgevolg ook een verdeling
met bijhorende kentallen. Deze worden gebruikt om kwaliteitscriteria voor
schatters te definiëren.
Criteria voor schatters
Een schatter θˆ voor een populatieparameter θ is zuiver of onvertekend indien
E( θˆ ) = θ.
De vertekening van een schatter is gelijk aan V( θˆ )=|E( θˆ )- θ|.
Een efficiënte schatter heeft minimale variantie var( θˆ ).
Gemiddelde gekwadrateerde afwijking: GGA( θˆ ) = var( θˆ )+V( θˆ )2.
De GGA zoekt een compromis tussen zuiverheid en efficiëntie.
,Voorbeeld:
• Op onderstaande figuur zijn θˆ1 en θˆ2 onvertekende schatters, θˆ3 is vertekend.
De schatters θˆ1 en θˆ3 hebben dezelfde variantie, θˆ2 heeft een grotere
variantie en is dus minder efficiënt.
• Neem X1,X2, . . . , Xn onafhankelijke waarnemingen uit een populatie met
verwachtingswaarde µ en variantie σ2, dan geldt dat
1 1 1
= = = =
1 1 1
var = var = var = =
σ2 σ2
Dus X is onvertekend met GGA( X )= +(µ-µ)2=
n n
,Een schatter is consistent indien de waarde van de schatter dichter naar de
populatieparameter nadert voor grote steekproeven:
lim n → ∞ P(| θˆ − θ |> ε ) = 0
voor een reëel getal ε >0 dat willekeurig klein kan worden gekozen.
Eigenschap: een zuivere schatter is consistent indien zijn variantie naar 0 gaat voor
grote steekproeven.
Voorbeeld:
is een onvertekende schatter van µ, bovendien is var = , dus voor → ∞,
gaat var → 0 (zie figuur). Bijgevolg is ook een consistente schatter van µ.
Opmerking: consistentie is een minimumkwaliteitseis voor een schatter. Een
schatter is vaak nog aanvaardbaar met een lichte vertekening of inefficiëntie, maar
hij moet altijd consistent zijn.
, Associatiemaat en toets voor kwalitatieve variabelen:
Cramer’s V en χ²-toets
Onderzoeksvraag:
Is er een significante associatie (verband) tussen twee kwalitatieve variabelen X en
Y?
Kansvariabelen en meetschaal: X en Y, nominaal (of ordinaal)
X is ingedeeld in r klassen of niveaus, Y is ingedeeld in c klassen of niveaus,
wat resulteert in een kruistabel met r rijen en c kolommen
Steekproefgegevens: geobserveerde celfrequenties Oij
Voorwaarden: alle verwachte celfrequenties Eij moeten minstens gelijk zijn aan 1,
maximaal één vijfde van de Eij zijn kleiner dan 5
Hypothesen:
H0 : geen associatie tussen de 2 variabelen, X en Y zijn onafhankelijk
Ha : wel associatie tussen de 2 variabelen, X en Y zijn afhankelijk
2
(𝑂𝑖𝑗 −𝐸𝑖𝑗 )
Toetsingsgrootheid onder H0: 𝜒 = ∑𝑖,𝑗 ~ 𝜒 2 [(𝑟 − 1)(𝑐 − 1)]
𝐸𝑖𝑗
Hierbij is Eij, de verwachte celfrequentie onder H0, gegeven door
𝑟𝑖 𝑐𝑗 rijtotaal x kolomtotaal
𝐸𝑖𝑗 = =
𝑛 aantal observaties
Beslissingsregel
H0 verwerpen
⇔ 𝑂𝑖𝑗 <<>> 𝐸𝑖𝑗
⇔ 𝑂𝑖𝑗 − 𝐸𝑖𝑗 <<>> 0
(𝑂𝑖𝑗 −𝐸𝑖𝑗 )2
⇔ 𝜒 = ∑𝑖,𝑗 >> 0
𝐸𝑖𝑗
⇔ té groot bij een 𝜒 2 [(𝑟 − 1)(𝑐 − 1)] -verdeling
De sterkte van het verband tussen X en Y kan worden gemeten met
𝜒
Cramer’s V= √ met 0 ≤ V ≤ 1. Hierbij is L = min(r,c).
𝑛(𝐿−1)