STATISTIEK I – HOC 5 TOT HOC 8 –
TWEEDIMENSIONALE WAARGENOMEN REEKSEN
Samenhang = het samen variëren van twee variabelen; komt tot uiting in een
betere voorspelbaarheid van de ene variabele, gegeven de andere.
- Veelheid aan termen: verband, relatie, correlatie, associatie, hangen
samen, afhankelijk
- Afspraak: men gebruikt de term associatie om te verwijzen naar een
samenhang tussen twee categorische variabelen (nominaal, ordinaal) en men
gebruikt de term correlatie om te verwijzen naar de samenhang tussen twee
numerieke variabelen (interval, ratio).
- De samenhang is afhankelijk van het meetniveau van de variabelen!
Phi-kwadraat Phi-kwadraat Phi-kwadraat
Cramer’s V Cramer’s V Cramer’s V
variabele
Ordinaal Kruistabel Rangcorrelatiecoëfficië Rangcorrelatiecoëfficië
Phi-kwadraat nt nt
Cramer’s V
Interval/ Kruistabel Rangcorrelatiecoëfficië Covariantie
Ratio Phi-kwadraat nt Correlatie
Cramer’s V Regressie
- Causaliteit of causaal verband?
Van een oorzakelijk verband is alleen sprake als verandering in X
altijd een verandering in Y teweegbrengt Y is afhankelijk van X
Drie causaliteitsvoorwaarden:
1e voorwaarde: er bestaat een relatie tussen a en b
2e voorwaarde: a gaat in de tijd vooraf aan b
3e voorwaarde: relatie tussen a en b blijft bestaan wanneer
we controleren voor allerlei andere factoren (c,d,e,etc.)
In de Sociale wetenschappen: moeilijk!
KRUISTABEL
Ook wel frequentietabel of contingentietabel genoemd. Deze tabel geeft de aard
en de richting van een relatie weer.
- 3 doelstellingen:
Beschrijven van aard en richting van verband in onderzochte
steekproef
Berekening van rijpercentages en kolompercentages
Vergelijking van relatieve conditionele verdelingen
Veralgemeenbaarheid van samenhang in steekproef naar
populatie
Berekening verwachte celfrequenties bij onafhankelijkheid
Chi-kwadraattoets en chi-kwadraatverdelling
Bepalen van sterke van de samenhang
1
, Associatiematen voor nominale variabelen
Associatiematen voor ordinale variabelen
Samenhang analyseren:
- Stap 1: kruistabel tussen beide kenmerken opstellen
- Stap 2: asymmetrische relatie
Kenmerk Y (afhankelijk – bv. partijvoorkeur) en kenmerk X
(onafhankelijk – bv. geslacht)
- Stap 3: vergelijken relatieve verdeling van Y naar categorieën van X =
relatieve conditionele verdeling
Onafhankelijke variabelen worden in kolommen geplaatst en afhankelijke
variabelen worden in rijen geplaatst.
Marginale en conditionele verdeling
- Marginale verdeling geeft de univariate verdeling weer van de
variabelen
- De som van de absolute frequenties F(ij) per rij vormt een rijtotaal;
rijtotalen Fi vormen de marginale verdeling van de Y-variabele; de som
van de rijtotalen is gelijk aan het effectief N
- De som van de absolute frequenties F(ij) per kolom vormt een
kolomtotaal; kolomtotalen F.j vormen de marginale verdeling van de X-
variabele; de som van de kolomtotalen is gelijk aan het effectief N
- Conditionele verdeling van Y?
Verdeling rijvariabelen Y voor één bepaalde categorie van
kolomvariabele X vormt de conditionele verdeling van Y gegeven
X
Bv. verdeling van partijvoorkeur bij mannen is de conditionele
verdeling van partijvoorkeur (Y), gegeven geslacht (X) = man
we geven de conditie dat de persoon een man is, wat is de
verdeling naar partijvoorkeur?
- Conditionele verdeling van X?
Verdeling kolomvariabele voor één specifieke categorie van
rijvariabelen Y vormt de conditionele verdeling van X gegeven Y
Bv. verdeling van geslacht bij de Groen-stemmers vormt de
conditionele verdeling van geslacht (X), gegeven partijvoorkeur
(Y) = Groen
Rij- en kolompercentages
- Hoe conditionele relatieve verdeling berekenen?
Verschil tussen symmetrische en asymmetrische relaties
Asymmetrisch
Conventioneel staat afhankelijke variabele Y in rijen van de
tabel en onafhankelijke variabele X in kolommen van de
tabel
In kruistabel worden percentages berekend in de richting
van de onafhankelijke variabele (zijde kolompercentages)
2
, We berekenen dus kolompercentages om de relatieve
verdeling van Y te vergelijken tussen categorieën van X
Kolompercentage = (celfrequentie/kolomtotaal)*100
Rijpercentage = (celfreqientie/rijtotaal)*100
Rij- en kolompercentages steeds vergelijken dwars op de richting
waarin werd gepercenteerd als je kolompercentages gaat
vergelijken vergelijk je per rij, als je rijpercentages gaat
vergelijken vergelijk je per kolom.
- Aard samenhang: rij- en kolompercentages
Kolompercentages: inschatting van de sterkte van het verband
Liggen ze sterk bij elkaar = zwak verband
Liggen ze ver uit elkaar = sterk verband
Heel gebruikelijk en vooral bij niet te grote tabellen
Nadelen?
Omslachtig bij grote tabellen
Als men geen causale orde kan opstellen rijpercentages
of kolompercentages?
We weten niet of verband significant is
Geen synthetische index van de samenhang
Via significatietoets is het verband aan toeval te wijten of
echt?
Via associatiematen hoe sterk is dit verband?
CHI-KWADRAAT
Een significatietoets bestaan steeds uit 5 stappen:
1. Assumpties:
- Om significatietoets te kunnen toepassen: gegevens uit een aselecte
steekproef
- Meetniveau?
- Afhankelijke en onafhankelijke variabele?
- Het verwacht aantal observaties in elke cel van de kruistabel minstens 5
moet bedragen
2. Hypothesen
- De bewering die in een significatietoets wordt getest, heet de
nulhypothese
- Nulhypothese: we vertrekken van de hypothese dat er geen verband
bestaat en dat de waargenomen verbanden (verschillen) louter toeval
zijn = nulhypothese (H0): stelling dat verband niet significant is
- De significatietoets: ontworpen om sterkte van het bewijs tegen de
nulhypothese vast te stellen aantonen dat de nulhypothese niet klopt
en dat er dus wel een verband is
3. Toetsstatistiek: chi-kwadraat
- Hoe berekenen we de Chi-kwadraat teststatistiek?
Voor de toetsing van de H0 in m*n tabel vergelijken we de
geobserveerde celfrequenties met de verwachte celfrequenties
3
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur joyceroeland02. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €9,49. Vous n'êtes lié à rien après votre achat.