Dit is een samenvatting voor het vak statistiek 2, gedoceerd door Prof Theuns. Het omvat de theorie van de slides en het boek. (foutje op p33 wanneer df toeneemt neigt het meer naar een normaalverdeling)
Statistiek 2
Inhoudsopgave
HOOFDSTUK 6: INLEIDING TOT INFERENTIE: Z-TEST ......................................................................................... 2
6.1 SCHATTEN MET BETROUWBAARHEID......................................................................................................... 3
6.2 SIGNIFICANTIETOETSEN ......................................................................................................................... 4
6.3 GEBRUIK EN MISBRUIK VAN TOETSEN ........................................................................................................ 5
6.4 ONDERSCHEIDINGSVERMOGEN EN INFERENTIE ALS BESLISSING ........................................................................ 5
6.4.1 Onderscheidingsvermogen (Power) ........................................................................................ 5
6.4.2 Onderscheidingsvermogen vergroten ..................................................................................... 7
HOOFDSTUK 7: INFERENTIE VOOR VERDELINGEN: T-TEST ................................................................................ 9
7.1 INFERENTIE OVER VERWACHTING VAN 1 POPULATIE ...................................................................................... 9
7.1.1 De t-verdelingen .................................................................................................................... 9
7.1.2 1-steekproef t betrouwbaarheidsinterval ............................................................................. 11
7.1.3 1- steekproef t-test .............................................................................................................. 11
7.1.4 t toetsen voor gekoppelde paren.......................................................................................... 12
7.1.5 Robuusheid van t procedures ............................................................................................... 14
7.2 VERGELIJKEN VAN 2 VERWACHTINGEN .................................................................................................... 16
7.2.1 Vergelijken van 2-steekproef gemiddelden ........................................................................... 16
7.2.2 Twee steekproeven t procedures .......................................................................................... 16
7.2.3 Robuustheid van t procedures voor onafhankelijke steekproeven ......................................... 18
7.2.4 Gepoelde (Pooled) 2-steekproeven t procedures ................................................................... 19
7.3 EXTRA TOPICS VER HET VERGELIJKEN VAN VERDELINGEN .............................................................................. 20
7.3.1 Inferentie voor populatie spreiding ...................................................................................... 20
7.3.2 De F test voor gelijkheid van spreidingen.............................................................................. 20
7.3.3 Onderscheidingsvermogen van de 2-steekproeven t-test ...................................................... 20
HOOFDSTUK 8: INFERENTIE VOOR FRACTIES (PROPORTIES EN PERCENTAGES) .............................................. 21
8.1 INFERENTIE VOOR EEN ENKELE PROPORTIE (=FRACTIE)................................................................................. 21
8.2 TWEE PROPORIES/ FRACTIES VERGELIJKEN ................................................................................................ 23
HOOFDSTUK 15: NIET-PARAMETRISCHE TOETSEN .......................................................................................... 27
15.1 WILCOXON RANK SUM TEST (RANGSOMTEST) = MANN-WHITNEY U-TEST ...................................................... 27
15.1.1 Rang transformatie ............................................................................................................. 28
15.1.2 Wilcoxon Rangsom Test = u-test .......................................................................................... 28
15.2 WILCOXON SIGNED RANK TEST (RANGTEKENTEST) ..................................................................................... 30
15.3 KRUSKAL- WALLIS TEST ...................................................................................................................... 31
HOOFDSTUK 9: ANALYSE VAN 2-WEGS TABELLEN OF CONTINGENTIE TABELLEN............................................ 32
9.3 GOODNESS OF FIT (AANPASSINGSTOETS) ................................................................................................. 33
9.1 INFERENTIE VOOR CONTINGENTIETABELLEN (2-WEGS TABELLEN) VERGELIJKEN VAN 2 OF MEER ONAFHANKELIJKE
STEEKPROEVEN ............................................................................................................................................... 35
,Hoofdstuk 6: Inleiding tot inferentie: Z-test
• Doel van statistische inferentie is het trekken van conclusies uit gegevens.
o Bij formele inferentie ligt de nadruk op het onderbouwen van onze conclusies met
kansberekeningen. (gebaseerd op steekproefverdelingen)
§ Dankzij de kansrekening kunnen we rekening houden met toevallige varieties
en op deze wijze onze beoordeling aan de hand van berekeningen corrigeren
§ Als u statistische inferentie gebruikt, handelt u alsof de gegevens afkomstig
zijn uit een aslecte steekproef of een random experiment.
• Twee soorten steekproeven
o Between subjects design
§ Vb zijn mannen sneller dan vrouwen
§ Het zijn onafhankelijke/ niet gepaarde/ niet gekoppelde steekproeven
§ = unpaired samples
o Within subjects design
§ Is Jennifer sneller na het nemen van EPO
§ Afhankelijke/ gepaarde/ gekoppelde steekproeven
§ = paired samples à 2 herhaalde metingen
• Inductieve technieken : 2 doelen
o Schatten (betrouwbaarheidsintervallen): op basis van een steekproef
o Toetsen (significantietoetsen): komt een bepaald resultaat door toeval tot stand?
• Statistisch schatten
o Puntschatting
o Intervalsschatting
2
,6.1 Schatten met betrouwbaarheid
• Het steekproefgemiddelde x is de natuurlijke schatter van de onbekende
populatieverwachting µ. Wat nog belangrijker is, de wet van de grote aantallen zegt dat het
steekproefgemiddelde moet naderen tot de populatieverwachting als de steekproefomvang
toeneemt.
• Betrouwbaarheidsinterval (Confidence level)
o Het doel van een BI is een schatting te geven van een onbekende parameter, met
een indicatie van de mate van nauwkeurigheid van de schatting en van de mate
vertrouwen die men in de correctheid van het resultaat mag hebben
o Een betrouwbaarheidsinterval van niveau C voor een parameter is een interval dat is
berekend uit de steekproefdata, volgens een methode die kans C heeft om een
interval op te leveren dat de werkelijke waarde van de parameter bevat.
§ 95% betrouwbaarheidsinterval is een omgeving rondom het resultaat van 1
replicatie zodat in 95% van de replicaties een interval wordt gevonden dat de
echte populatiewaarde van de onderzochte variabele (het resultaat op
papulatie niveau) bevat.
§ Als u de methode 1 maal toepast kunt u niet weten of uw interval een juiste
waarde gaf (dit gebeurt in 95% van de gevallen) of niet (dit gebeurt in 5% van
de gevallen)
o Steekproefgemiddelde varieert met elke steekproef
o Betrouwbaarheidsinterval voor µ = (schatter ± formarge) zal bij C% van de
steekproeven de onbekende populatieparameter µ “vangen”.
§ C% is het algemene vangpercentage à a
1
§ 𝑓𝑜𝑢𝑡𝑚𝑎𝑟𝑔𝑒 (𝑚 ) = 𝑧 ∗ .
√3
§ Hierbij is z* de waarde voor de stanaardnormale curve met oppervlakte C
tussen de kritieke punten -z* en z*. Het niveau C betrouwbaarheidsinterval
voor µ is [ x ± m ]
§ Dit interval is exact correct als de populatieverdeling normaal is en is in
andere gevallen voor grote n bij benadering correct
o Steekproefomvang bij een gewenste foutmarge:
§ Het betrouwbaarheidsinterval voor een populatiegemiddelde zal een
gespecificeerde foutmarge m hebben als de steekproefomvang gelijk is aan
6∗.1 8
§ 𝑛=5 3
7
• Gedrag van de betrouwbaarheid
o Een klein BI (betrouwbaarheidsinterval) impliceert: hoge betrouwbaarheid DUS een
kleine foutenmarge
§ Gebruik een lager betrouwbaarheidsniveau (kleiner dan C; meestal
gebruiken wij 95%)
§ Grotere steekproef
§ Kleinere s
• Waarschuwing ivm schatters
o Formules voor schatters gelden enkel onder de voorwaarde dat de gegevens
bekomen zijn uit een Enkelvoudige Aselecte Steekproef (de mate waarin hieraan is
voldaan moet geëvalueerd worden)
o Voor specifieke meer complexe steekproefmodelle bestaan aangepaste formules
o Voor “gemakkelijkheidshalve” of ad hoc steekproeven met een vertekening (bias)
van onbekende omvang is er geen methode voor correcte inferentie
3
, o Bij kleine steekproeven worden betrouwbaarheidsintervallen wellicht te klein
geschat
o s moet gekend zijn
6.2 Significantietoetsen
• Een significantietoets is een formele procedure om waargenomen data te vergelijken met
een hypothese waarvan we willen beoordelen of hij waar is. (de hypothese is een bewering
over de parameters in een populatie of model)
o Een significantietoets meet de kans dat een resultaat wordt verkregen dat even
extreem is als of meer extreem dan het feitelijk waargenomen resultaat (extreem
betekent ver af van wat we zouden verwachten als H0 juist zou zijn)
• Het doel van significantietoetsen is om een populatieparameter te schatten. Het ander doel
is; het beoordelen van het door de data verschafte bewijsmateriaal ten gunste van de een of
andere bewering omtrent de populatie
o Een significantietoets is een formele procedure om waargenomen data te vergelijken
met een hypothese waarvan we willen beoordelen of hij waar is. De hypothese is
een bewering over de parameters in een populatie of model.
o Het beoordeelt het door de data aangedragen bewijsmateriaal tegen een
nulhypothese ten gunste van een alternatieve hypothese
• De cruciale vraag bij significantie toetsen:
o Hoe groot is de kans dat het resultaat van mijn onderzoek tot stand zou zijn
gekomen indien de nulhypothese waar zou zijn?
• Significantietoets in 4 stappen
o Formuleer de nul-en alternatieve hypothesen
§ Nulhypothese is de bewering die in een significantietoets wordt getoetst. De
significantietoets is ontworpen om de sterkte van het bewijs tegen de
nulhypothese vast te stellen. Gewoonlijk is de nulhypothese een bewering
van de vorm “geen effect” of “geen verschil”
o Bepaal de waarde van de toetsingsgrootheid
§ De toetsingsgrootheid is een maat voor de mate waarin de nulhypothese en
de gegevens op elkaar aansluiten. We gebruiken deze voor de
waarschijnlijkheidsberekening die we nodig hebben voor de
significantietoets. Het gaat om een stochastische variabele met een bekende
verdeling.
9:;<==>?@;ABC=;>=D9:;> E<<?F>
§ 𝑧 = 9=<3F<<?F<GEDHID3J K<3 F> 9:;<==>?
§ De z- toets veronderstelt een EAS van omvang n, een bekende
standaardafwijking s voor de populatie, en ofwel een normale populatie
ofwel een grote steekproef. Overschrijdingskansen worden berekend uit de
normale verdeling. Vaste a- toetsen gebruiken de tabel van
standaardnormale kritieke waarden
o Bepaal de overschrijdingskans p voor de data
§ De kans, berekend onder de aanname dat H0 waar is, dat de
toetsingsgrootheid een waarde zou aannemen die even extreem is als of nog
extremer is dan de feitelijke waargenomen uitkomst, wordt de
overschrijdingskans of p- waarde van een toets genoemd. Hoe kleiner de
overschrijdingskans, hoe sterker het door de data tegen H0 geleverde bewijs.
§ Statistische significantie: als de overschrijdingskans kleiner dan of gelijk is
aan a, zeggen we dat de data statistisch significant zijn op niveau a
o Formuleer de conclusie in APA-stijl
4
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur claudinestynen. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €6,99. Vous n'êtes lié à rien après votre achat.