Beknopte samenvatting van de tentamenstof van week 1 t/m week 7.
Per week worden de belangrijkste dingen beschreven inclusief een kort stappenplan van hoe je de analyses in SPSS/PROCES moet uitvoeren.
Betrouwbaarheid
Is de mate waarin de metingen van de kenmerken dezelfde resultaten oplevert als het onderzoek
onder de dezelfde omstandigheden wordt gedaan
Power
De Power of het onderscheidingsvermogen is de kans om een daadwerkelijk bestaand verschil of
correlatie te kunnen traceren. Kan tussen 0 en 1. Vanaf 0,8 is goed.
Power is de kans dat een test de nulhypothese correct verwerpt wanneer de alternatieve hypothese
waar is. Met andere woorden, het is de kans om een type II-fout te vermijden (de fout waarbij een
daadwerkelijk bestaand effect niet wordt gedetecteerd).
Formule: Power = 1 - β, waarbij β de kans is op een type II-fout.
Representativiteit
Wanneer dezelfde kenmerken worden vertoond als de populatie waar de steekproef uit getrokken is.
Oftewel, wanneer de verdeling van de onderzochte variabelen in de steekproef hetzelfde is als in de
populatie. Het is belangrijk voor de generaliseerbaarheid van de resultaten en heeft invloed op de
externe validiteit.
Representativiteit testen (2 manieren)
Dit kan met een frequentietabel door de percentages met de steekproefpopulatie met de
percentages van de werkelijke populatie te vergelijken. Wanneer deze verschillen te groot zijn is het
niet representatief. Een verschil van > 5% betekent dat er te grote verschillen zijn.
Dit kan met een Chi-kwadraat die nagaat of twee of meer populaties van elkaar verschillen. Voor deze
test werken we met een alfa van .30 zodat je niet te snel zegt dat een steekproef representatief is,
terwijl die dat eigenlijk niet zo is.
Uitvoering SPSS
Menu Analyze > non-parametric tests > Legacy Dialogs > Chi-Square.
Zet de variabele die je wilt testen in het blok 'test variable list'.
Verwachte aantallen: Stel je hebt binnen opleidingsniveau drie categorieën met een verwachte
verdeling van laag 30, midden 50 en hoog 20. In het Chi-Square venster zie je een optie 'Expected
Values'. Vink het vakje 'Values' aan. Voer hier op volgorde de verwachte aantallen in door steeds op
add te klikken.
Interpretatie SPSS
Hypothesen opstellen
H0 = verdeling in steekproef = verdeling in populatie
Ha = verdeling in steekproef ≠ verdeling in populatie
Hypothesen testen/significante waarden aflezen
P-waarde > gekozen alfa → dan H0 accepteren: steekproef is representatief voor populatie
P-waarde < gekozen alfa → dan H0 verwerpen: steekproef is niet representatief
APA: chi2 (1, N=15630) = 37.35, p < 0,001
Missing values en data cleaning
,Data cleaning response set
Response set ontstaat wanneer respondenten systematisch antwoorden op een manier die de
validiteit van de meting schaadt, zoals het invullen van een patroon zonder de vragen echt te lezen.
Dit kan veroorzaakt worden door bijvoorbeeld vermoeidheid of irritatie bij lange vragenlijsten.
Onderzoekers moeten maatregelen treffen om dit probleem aan te pakken, zoals het beoordelen van
de patronen en eventueel verdachte antwoorden verwijderen of als missing declareren als het aantal
gering is.
Verder zijn er nog
Routings
Codes
Missings
Missing values
Dit zijn scores die ontbreken en daarmee invloed kunnen hebben op de betrouwbaarheid en
validiteit. Het hoeft niet uit te maken als respondenten bij een vragenlijst bijvoorbeeld bepaalde
vragen mogen overslaan. Maar je moet wel bepalen welk type data mist.
Niet erg:
Non-response/sample
Routings
Gecensureerde data/design (als je een sample uit het leger pakt en voor het leger geldt dat je
minimaal 1.80 meter moet zijn, is het logisch dat mensen onder de 1.80 meter niet in de data
voorkomen)
Wel erg:
Ontbrekende antwoorden
Ontbrekende categorieën
Oorzaken van missing data wat je niet mag negeren: door onjuiste routings, de vraag, de
interviewer, of invoeren van data.
Vervolgens moet je bepalen hoe groot het percentage missing data is: als er sprake is van MCAR is <
dan 10% niet erg.
Vervolgens moet je bepalen of er sprake is van MCAR of MAR.
MAR = Missing at Random → meer missing data in één groep dan in de andere.
H₁: percentage verschillen wijken wel significant af dus MAR
MCAR = Missing Completely at Random → missing data gelijk in iedere groep.
Je wilt dat je data MCAR is.
H₀: percentage verschillen wijken niet significant af dus MCAR
Je gaat beide testen:
MAR testen
N>400→verschil% boven 5% is significant
,N<400→verschil% boven 10% is significant
Let op: als er meerdere missings zijn gedefinieerd moet je voordat je naar het verschil % kijkt, eerst
alle missings bij elkaar optellen per categorie en dan pas gaan vergelijken!
MCAR testen
Little MCAR test waarbij geldt:
H0 = missing patronen wijken niet af van verwachte patronen bij MCAR (dus je hebt MCAR)
Ha = missing patronen wijken wel af van verwachte patronen bij MCAR (dus je hebt MAR)
Uitvoering SPSS
Analyze → Missing Value Analysis → Alle waarden variabelen onder Quantitative Variables en de
achtergrondkenmerken onder Categorical Variables.
Patterns: Tabulated Cases aan + Sort variables by missing value pattern uit.
Descriptives: selecteer t-tests en crosstabulations + vraag Probabilities op + percentage onderin op
1% Vink onder Estimation de optie EM aan.
Interpretatie SPSS
Stap 1
Bij tabel: Univariate Statistics: als alle variabelen < 10% missings hebben, is de omvang van de
missings in ieder geval geen probleem (mits ze MCAR zijn).
Stap 2
Randomness checken (MAR): bekijk in de tabel ‘Separate Variance t Testsa’ bij % missings
N>400: %verschil > 5% = significant verschil tussen missings en niet-missings dus MAR
N<400: %verschil > 10% = significant verschil tussen missings en niet-missings dus MAR
Tel voor de vergelijking van het verschil % alle missings bij elkaar op en check bij de missings of het
dus niet meer dan 5 of 10% is afhankelijk van de N.
Stap 3
Randomness checken: check de significantie bij de table ‘EM MEANS’ naar de little MCAR test.
Little MCAR test Sign > alfa = H0 accepteren → MCAR
Little MCAR test Sign < alfa = H0 verwerpen → MAR
Samengevat stappen
Stap 1. Type missing data vaststellen: wel of niet negeerbare missing data
Stap 2. Omvang missing data vaststellen: < 10% niet erg, >10% wel erg
Stap 3. Nagaan of de missing data random zijn:
MAR toetsen, wanneer de T-toets significant is kan dat wijzen op MAR.
MCAR toetsen, via een chi-kwadraat, wanneer deze niet significant is, wijst dat op MCAR.
Week 2 – Betrouwbaarheids- en Factor analyse
, Factoranalyse
Het doel van factor- en betrouwbaarheidsanalyse is tweeledig. Aan de ene kant willen beide
technieken een latente structuur vinden die ten grondslag ligt aan meerdere items. Aan de andere
kant zorgen beide technieken voor datareductie.
De betrouwbaarheidsanalyse een uni dimensionele schaaltechniek. De verschillende items worden
teruggebracht tot één schaal. De factoranalyse is multidimensionale, verschillende items worden op
een bepaalde manier samengebracht, zodat er meerdere factoren (schalen) ontstaan.
Doelen
Het heeft dus twee doelen:
1. Latente structuur die ten grondslag ligt aan meerdere items
2. Het reduceren van data
Vereisten: variabelen moeten van minimaal interval niveau zijn al kunnen ordinale soms ook.
Richtlijn steekproefomvang: De algemene aanbeveling is dat je minstens vijf keer zoveel
waarnemingen (cases) hebt als het aantal items (variabelen) dat je in de factoranalyse wilt opnemen.
Benaderingen
Binnen de factoranalyse zijn er twee verschillende benaderingen.
1. De principale componenten analyse: de totale variantie van alle variabelen kan volledig
worden verklaard door de andere variabelen in het model.
2. De principale factoranalyse: de variantie van elke variabelen kan niet volledig worden
verklaard door de andere vairabelen in het model, elke vairabelen heeft namelijk een uniek
deel.
Factorlading
Bij de factoranalyse laadt een vairabelen op een factor. Een factorlading is de correlatie van een item
met de onderliggende factoren. Hoe hoger deze factorlading, hoe beter het item wordt
gerepresenteerd door de onderliggende factor. Het doel daarbij is dat een item/vairabelen op slechts
1 factor laadt, niet op meerderen. Als je dat bereikt heb je een simpele structuur.
Stappen
1. Correlatiematrix
2. Benadering kiesen (PCA of PFA)
3. Geschiktheid checken door KMO-test en Bartlett’s-Test te checken
4. De initiële factoroplossing berekenen
5. Het aantal factoren bepalen
6. De initiële oplossing roteren
7. De uiteindelijke factoren benoemen
8. Voor elke respondent een score berekenen voor elke factor
Stap 1
Kies een benadering:
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur IGGY1. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €5,39. Vous n'êtes lié à rien après votre achat.