STATISTIEK III
Prof. Dr. Peter Theuns
AJ 2022-2023
,Inhoudsopgave
STATISTIEK III: UNIVARIATE DATA-ANALYSE............................................................................................................. 1
HOOFDSTUK 6: INLEIDING TOT INFERENTIE ............................................................................................................. 2
1. INTRO (STATISTIEK II) ..................................................................................................................................... 2
1.1 INDUCTIEVE TECHNIEKEN ................................................................................................................................ 2
2. BETROUWBAAR SCHATTEN (STATISTIEK II) ....................................................................................................... 4
2.1 INFERENTIE ................................................................................................................................................ 4
2.1.1 VOORWAARDEN VOOR INFERENTIES OVER EEN GEMIDDELDE...................................................................................................... 4
2.2 STATISTISCH SCHATTEN ................................................................................................................................. 4
2.2.1 PUNTSCHATTING ............................................................................................................................................................... 4
2.2.2 INTERVALSCHATTING.......................................................................................................................................................... 5
2.3 BETROUWBAARHEIDSINTERVALLEN .................................................................................................................... 6
2.3.1 DE STANDAARDNORMAALTABEL ........................................................................................................................................... 6
2.3.2 COURANTE WAARDEN VOOR Z* ............................................................................................................................................ 6
2.3.3 SAMENGEVAT: BETROUWBAARHEIDSNIVEAU (CONFIDENCE LEVEL) ............................................................................................ 7
2.3.4 FORMULERING VAN EEN BETROUWBAARHEIDSINTERVAL ........................................................................................................... 7
2.3.5 GEDRAG VAN DE BETROUWBAARHEID .................................................................................................................................... 7
2.4 STEEKPROEFGROOTTE BEPALEN ........................................................................................................................ 8
2.5 WAARSCHUWINGEN I.V.M. SCHATTERS ................................................................................................................ 8
2.6 SAMENGEVAT: POPULATIEVERDELING, STEEKPROEVENVERDELING EN BETROUWBAARHEIDSINTERVAL ..................................... 9
2.7 BOOTSTRAPPING (RESAMPLING) ....................................................................................................................... 9
3. SIGNIFICANTIETOETSEN (STATISTIEK II) ......................................................................................................... 10
3.1 SIGNIFICANTIETOETS IN 4 STAPPEN .................................................................................................................. 10
3.2 HYPOTHESEN STELLEN ................................................................................................................................. 11
3.2.1 HYPOTHESEN FORMULEREN .............................................................................................................................................. 11
3.3 TOETSINGSGROOTHEDEN .............................................................................................................................. 11
3.4 OVERSCHRIJDINGSKANSEN (P-WAARDEN) .......................................................................................................... 12
3.5 STATISTISCHE SIGNIFICANTIE ......................................................................................................................... 13
3.5.1 VERWERPEN VS NIET VERWERPEN ....................................................................................................................................... 13
3.5.2 SIGNIFICANTIENIVEAU a ................................................................................................................................................... 13
3.5.3 BETROUWBAARHEIDSINTERVALLEN VS. SIGNIFICANTIETOETSEN INDIEN s BEKEND..................................................................... 14
3.6 TOETSEN VOOR EEN POPULATIEGEMIDDELDE Y ..................................................................................................... 14
3.7 TWEE-ZIJDIGE SIGNIFICANTE TOETSEN EN BETROUWBAARHEIDSINTERVALLEN ............................................................... 15
3.7.1 EEN-ZIJDIG VS TWEE-ZIJDIG .............................................................................................................................................. 15
3.7.2 Z-TOETS VOOR EEN POPULATIEGEMIDDELDE µ0 .................................................................................................................... 16
3.7.3 TWEE-ZIJDIGE SIGNIFICANTIETOETSEN EN AANVAARDINGSINTERVALLEN ................................................................................... 16
3.7.4 OVERSCHRIJDINGSKANSEN (P-WAARDEN) VERSUS VAST SIGNIFICANTIENIVEAU A ........................................................................ 16
4. GEBRUIK EN MISBRUIK VAN TOETSEN (STATISTIEK II) ...................................................................................... 17
4.1 SIGNIFICANTIENIVEAU KIEZEN......................................................................................................................... 17
Statistiek III: Univariate data-analyse (AJ 2022 – 2023) 1
,4.2 WAT STATISTISCHE SIGNIFICANTIE NIET BETEKENT ............................................................................................... 17
4.3 EEN GEBREK AAN SIGNIFICANTIE BETER NIET NEGEREN ............................................................................................ 17
4.4 VOORZICHTIG MET HET NASTREVEN VAN SIGNIFICANTIE ........................................................................................... 17
4.5 CRUCIALE VRAGEN BIJ SIGNIFICANTIETOETSEN ..................................................................................................... 18
5. ONDERSCHEIDINGSVERMOGEN EN BESLISSEN (START STAT III) ........................................................................ 19
5.1 FOUTEN: TYPE I EN TYPE II ............................................................................................................................ 19
5.2 ONDERSCHEIDINGSVERMOGEN (POWER)............................................................................................................ 20
5.3 ONDERSCHEIDINGSVERMOGEN VERGROTEN ........................................................................................................ 20
5.4 ONDERSCHEIDINGSVERMOGEN BIJ EEN Z-TEST .................................................................................................... 22
5.5 ONDERSCHEIDINGSVERMOGEN BEREKENEN ......................................................................................................... 23
5.6 BESLISSINGSFOUTEN ................................................................................................................................... 24
5.7 NOG EENS UITDIEPEN …............................................................................................................................... 24
5.7.1 ALTERNATIEVE HYPOTHESE EN HET ONDERSCHEIDINGSVERMOGEN .......................................................................................... 24
5.7.2 ONDERSCHEIDINGSVERMOGEN EN ALFA .............................................................................................................................. 24
5.7.3 N & s EN HET ONDERSCHEIDINGSVERMOGEN ....................................................................................................................... 24
Statistiek III: Univariate data-analyse (AJ 2022 – 2023) 2
, STATISTIEK III: UNIVARIATE DATA-ANALYSE
Herhaling Statistiek I en Statistiek II
Statistiek II:
• Steekproevenverdeling = frequentieverdeling van steekproefresultaten (en dus niet van een populatie). Met dit idee gaan
we verder in Statistiek III.
• Hypothese: we gaan doen alsof we het populatiegemiddelde niet kennen, maar de standaardafwijking wel. Dit was wat
vreemd. In Statistiek III gaan we weg van dit idee.
Statistiek III: Univariate data-analyse (AJ 2022 – 2023) 1
, HOOFDSTUK 6: INLEIDING TOT INFERENTIE
Dit is een herhaling van het laatste hoofdstuk van Statistiek II (AJ 2021 – 2022) (groene arcering komt aan bod in 1e HOC Stat III)
Inferentie > statistische analyse
1. INTRO ( STATISTIEK II)
Je vertrekt van een populatie die je niet kent, en je wil daar iets over
zeggen. Je neemt dus een steekproef.
Zie vb: elk jaar 70 toestellen onderhouden > elk jaar een steekproef van 70.
Dit is echter uitzonderlijk! Heel veel studies zijn ‘one-shot studies’, waarbij
je 1 keer een studie doet. Je gaat van die steekproef de beschrijvende
statistiek halen.
Je krijgt dan bepaalde uitspraken, bv. Jan en An hebben problemen met
studeren. Je hebt dus specifieke uitspraken over de steekproef.
De vraag is dan: hoe kan je die specifieke informatie terugkoppelen
naar de populatie? Wat leren deze specifieke dingen ons over de
populatie?
ð De gemiddelde en steekproef-data gaan over de steekproef, niet over de populatie. Je gaat een veiligheidsmarge
inbouwen.
1.1 Inductieve technieken
We gaan uit een steekproef een parameter berekenen, bv. een gemiddelde of percentage. We kunnen hier 2 dingen mee doen:
1) SCHATTEN (betrouwbaarheidsintervallen): als je een steekproefgemiddelde krijgt van 50, want heb je dan als
populatiegemiddelde? Kan je dan grenzen aangeven waarbinnen dat pop.gemiddelde moet liggen?
ð In welke mate is dit een goede weergave van het populatiegemiddelde? Dit is de betrouwbaarheidsinterval. Het zal
niet exact zijn, maar je kan grenzen aangeven.
2) TOETSEN (significantietoetsen): je hebt een hypothese en je gaat kijken hoe groot het verschil is. Je gaat statistische
uitspraken toetsen.
ð Dit gemiddelde van de steekproef – maar je dacht dat het gemiddelde X zou zijn (hypothese). Er is dus een verschil
tussen de twee. Hoe groot mag het verschil zijn dat het niet verontrustend is? Als het verschil te groot is, is er een
significant verschil tussen de twee.
Statistiek III: Univariate data-analyse (AJ 2022 – 2023) 2
,Voorbeeld: ‘toeval of niet’:
40 patiënten nemen deel aan een experiment met een nieuw medicijn. Mensen die medicatie krijgen genezen niet noodzakelijk
allemaal. Mensen die de medicatie niet krijgen, genezen wel. Soms kan medicatie niet aanslaan.
20 : nieuw medicijn, (minstens) 15 genezen
20 : placebo, 10 genezen
=> Kan dit resultaat berusten op toeval?
=> Laat ons ervan uitgaan dat het medicament niet werkt. Laat ons kijken naar de situatie van mensen die spontaan genezen
(8).
STAP 1: je hebt hier een binomiaalverdeling (wel of geen succes)
OPTIE 1: apart berekenen
P [X ≥15] = P [X =15] + P [X =16] + …
OPTIE 2: kansrekenen
OPTIE 3: benaderen met normaalverdeling
Ipv 15 => 14,5 =
CONTINUITEITSCORRECTIE
Samengevat:
Via normaalverdeling: Zullen er meer of 15 genezen? 5% van de steekproeven van 20 die je zou gaan behandelen door niets te
geven, dan zal je in 5% van de gevallen 15 of meer krijgen. Het is dus vrij onwaarschijnlijk dat het medicament niet helpt, indien
de spontane genezing 40% bedraagt.
Klassiek leg je in psychologie op 5%. Je gaat een risico durven nemen van 5% dat die nulhypothese die zegt dat 40% van de
mensen spontaan geneest, dat we die nulhypothese onterecht zouden aanvaarden. Er is meer dan 5% kans dat 15 mensen
spontaan zouden genezen. Strikt genomen zou je dus zeggen dat het onwaarschijnlijk is dat dit medicament écht werkt. Maar,
5,7% is wel heel weinig, je kan dus denken dat het geen toeval geweest is. Alles hangt er dus vanaf waar je de grens legt.
Statistiek III: Univariate data-analyse (AJ 2022 – 2023) 3
,2. B ETROUWBAAR SCHATTEN ( STATISTIEK II)
2.1 Inferentie
2.1.1 Voorwaarden voor inferenties over een gemiddelde
Statistische inferentie is gebaseerd op een aantal hypothesen. Deze hypothesen zorgen ervoor of dat je de redeneringen wel of
niet kunnen maken, en vooral, betrouwen.
*EAS: enkelvoudig aselecte steekproef
1. EAS: je moet bereiken dat iedereen uit de populatie even veel kans heeft om in de steekproef te belanden. Dit lijkt evident,
MAAR:
Voorbeeld: lengte van vrouwen in kaart brengen op de VUB. Niet alle vrouwen willen deelnemen, bv. hele kleine/grote
vrouwen. Is het dan realistisch om aan te nemen dat een aselecte steekproef kan bereikt worden. Ook, de VUB is de
wereld niet! Je gaat waarschijnlijk weinig kans hebben om kleine mensen te meten, en meer kans om Belgen te meten
dan Nederlanders (die doorgaans groter zijn).
2. Dit klopt.
3. Je kan geen sd berekenen zonder gemiddelde.
3) Opmerking: Deze werkhypothesen zijn eigenlijk vrij onrealistisch.
2.2 Statistisch schatten
PUNTSCHATTING
Je gaat 1 enkele waarde nemen als schatter voor het
populatiegemiddelde.
INTERVALSCHATTING
Rondom het gemiddelde ga je een gebied afbakenen, een marge.
2.2.1 Puntschatting
Statistiek III: Univariate data-analyse (AJ 2022 – 2023) 4
,2.2.2 Intervalschatting
We vertrekken van een steekproef. Voor deze SP berekenen we het gemiddelde. Obv hiervan willen we een interval geven
waarbinnen we verwachten met een grote zekerheid dat het échte populatiegemiddelde zich ergens bevindt.
Voorbeeld: toelatingsproeven (SAT) in de VS
Duizenden studenten leggen deze test af in de VS, elk jaar opnieuw. Men gaat die scores transformeren naar een gemiddelde
van 500, en een sd van 100; zodanig dat dat examen elk jaar even moeilijk blijft.
=> Is dit een goed idee, een goede methode?
=> Wie doet er mee? Doet iedereen mee? Is er dus een soort van zelfselectie die ontstaat, waardoor zwakkere studenten niet
deelneemt, en men een standaardisering doet op de beste studenten …
=> Klopt dit wel? Bestaat die zelfselectie?
Om na te gaan of de zelfselectie van de deelnemers tot gevolg heeft dat de SATscores kunstmatig hoog uitvallen doe je een
onderzoek bij 500 willekeurig geselecteerde leerlingen uit het laatste jaar middelbare school en die behalen een gemiddelde
score van 461.
=> Kunnen we dat begrijpen? En als je dit resultaat hebt: hoe groot is de kans dat die ‘500’ een toevallige afwijking is. Als het
meer is dan een toevallige afwijking, dan bestaat dat fenomeen van zelfselectie.
=> Wat kan je nu zeggen over de te verwachten gemiddelde score voor ALLE studenten (dus ook voor niet-deelnemende)?
Je vertrekt van een steekproef, waarvoor je een gemiddelde en
sd berekent. Aan de hand hiervan, ga je uitspraken doen: je
maakt de steekproevenverdeling en je kan zien hoe uitzonderlijk
die 500 zou zijn wanneer je in je steekproef een gemiddelde vindt
van 461.
Steekkproevenverdeling SAT
De steekproevenverdeling (bij herhaalde steekproeven) zou
normaal verdeeld zijn.
Rond het theoretisch gemiddelde hebben we een interval van +/-
9. 461 zit meer dan 9 punten verwijderd van de 500, dus
waarschijnlijk is het geen toeval, en is er wel degelijk een tendens
tot zelfselectie.
Dit ene gemiddelde waar we het mee moeten doen, brengt ons in deze
situatie.
Stippellijn: populatiegemiddelde en de sd eromheen. Dit willen we leren
kennen. Maar, we kunnen er niet aan omdat we het populatiegemiddelde
niet kennen.
MAAR: je kent wel het SP-gemiddelde! En je weet ook dat als je dat
gebruikt, er interessante mogelijkheden zijn. Met het SP-gemiddelde
verwacht je dat het populatiegemiddelde niet meer dan een bepaalde
afstand van het SP-gemiddelde kan liggen. De redenering op de gekende
gele figuur komt sterk overeen met het spiegelbeeld van de onbekende
figuur.
Het verschil tussen P-gemiddelde en SP-gemiddelde: je gaat kijken hoe ver
het afwijkt, of hoe ver het SP-gemiddelde verwijderd ligt van het P-
gemiddelde.
Rond het SP-gemiddelde bouwen we een domein op gebaseerd op de
steekproevenverdeling. Er komt hierrond een interval +/- een bepaalde
foutmarge, waarvoor je kan zeggen met X% (gele oppervlakte) zal je met
Stippellijn = situatie waarvan we dromen > hoe ver kan het SP-gemiddelde
dit gebied/interval het échte populatiegemiddelde kunnen vangen.
er vanaf liggen? De werkelijkheid is dat je enkel het SP-gemiddelde kent.
= betrouwbaarheidsinterval rond mu (P-gemiddelde dat je niet kent)
Hier ken je echter ook het POP-gemiddelde.
Statistiek III: Univariate data-analyse (AJ 2022 – 2023) 5
,2.3 Betrouwbaarheidsintervallen
Het interval ga je optellen en aftrekken.
De marge = de sd van de SP-verdeling (sigma/wortel n),
vermenigvuldigd met de z-waarde
z* = waarde die je gaat opzoeken in de normaaltabel
2.3.1 De standaardnormaaltabel
De standaardnormaaltabel
Er is hier een z-as => is uitgedrukt in het aantal sd
boven/onder het gemiddelde.
Betrouwbaarheidsinterval: SP-gemiddelde
2.3.2 Courante waarden voor z*
Klassieke z* hebben een vaste waarde. Dikwijls gaat men naar 99 of 99,9%.
Tussen welke grenzen verwachten we dat het
populatiegemiddelde valt? Elke onderzoeker wil zo’n interval
kunnen maken, maar heeft enkel de gegevens van de eigen
steekproef. Iedereen gaat dus vertrekken van het gemiddelde
van die SP. Daarom ga je rond dat SP-gemiddelde een interval
maken waarvan je denkt dat het populatiegemiddelde ergens
in dat interval valt.
Liever zouden we vertrekken van het populatiegemiddelde, en
zien hoe ver het SP-gemiddelde er vanaf ligt. Maar, dan moet
je dat POP-gemiddelde kennen, en dat is nu net de grote
onbekende in het hele verhaal.
Hier worden zeer veel fouten op gemaakt. Dikwijls gaat men
zeggen: ik ben 95% zeker dat het POP-gemiddelde valt binnen
de grenzen van het BI.
MAAR: het centrum is helemaal niet vast!
Statistiek III: Univariate data-analyse (AJ 2022 – 2023) 6
, 2.3.3 Samengevat: Betrouwbaarheidsniveau (Confidence Level)
Het betrouwbaarheidsniveau C% is het “algemene vangpercentage” indien de methode zeer vaak wordt toegepast. Het
steekproefgemiddelde varieert met elke steekproef, maar de methode schatter ± foutmarge om een interval te bepalen op
basis van elke steekproef zal bij C% van de steekproeven de onbekende populatieparameter µ “vangen”.
2.3.4 Formulering van een betrouwbaarheidsinterval
Voorbeeld
“Met deze methode heb ik een betrouwbaarheidsinterval
gemaakt dat 95% kans heeft om het echte
populatiegemiddelde te bevatten.”
Hoe groter het BI, hoe meer twijfel! We verkiezen kleinere
BI.
Trade-off: vraag voor een grotere zekerheid dat je de echte
POP-gemiddelde pakt (= groot net) => vangen met een
kleiner net: dat is die Ön. Als je de SP waanzinnig groot
maakt, dan ga je een heel nauwkeurige schatting krijgen.
2.3.5 Gedrag van de betrouwbaarheid
Formule om de BI te berekenen
• Kleinere BI: dan kan je de z aanpakken (90%) => je maakt dan
meer fouten
• Kleinere sigma s: minder afwijkingen van het gemiddelde.
Hoe? Betere metingen, perfecte meetinstrumenten =>
meetfouten vermijden.
Statistiek III: Univariate data-analyse (AJ 2022 – 2023) 7