OMT 1:
PSYCHOMETRIE
Prof. dr. Tim Vantilborgh
Academiejaar 2023-2024
Examen: schriftelijk meerkeuze (70%), online testen (20%), experimenten (10%)
Lesinhoud:
1. psychometrie
2. meetschalen
3. individuele verschillen
4. transformatiemeetwaarden
5. betrouwbaarheid
6. betrouwbaarheid schatten
7. constructvaliditeit
8. constructvaliditeit schatten
9. responsbias
10. itemanalyse en itemresponstheorie
11. testaccuraatheid
,1/ PSYCHOMETRIE
1. Het belang van psychologische testen
1.1. Psychologische testen in de praktijk
Het maakt niet uit of een test kwalitatief goed of slecht is om gedefinieerd te worden als psychologische test.
Vbn psychologische testen: houding meten t.o.v. autoriteit via stellingen, enquêtes in populaire dagbladen die
naar mening peilen, neurocognitieve testen, …
Waarom zijn psychologische testen belangrijk?
- psychologische testen spelen een grote rol in ons dagelijks leven
- we komen doorheen ons leven allemaal in aanraking met psychologische testen
o geboorte: APGAR test waarbij pasgeborenen worden geëvalueerd op 5 kenmerken:
ademhaling, reflexen, spiertonus, pols en kleur – score (5x /2) lager dan 7/10 wijst op
probleem waarbij men (mogelijk) medisch moet ingrijpen
o school/ werk: examens, sollicitatie, persoonlijkheid, geheugen, aandoeningen…
- pychologische testen kunnen vergaande gevolgen hebben voor mensen: in extreme gevallen
bepaalt een psychologische test over leven en dood – kan tot grote discussie leiden als scores nipt zijn,
als experts tot andere conclusies komen… hoe komt dit en hoe daar rekening mee houden?
o bv. wet in bepaalde staten VS die stelt dat mentaal achtergestelde personen niet tot de dood
veroordeeld kunnen worden; zwakbegaafd = score van 70 of lager op IQ test
o bv. euthanasieproces Tine Nys (vele testen om lijdensdruk te bepalen)
Hoeveel vertrouwen kunnen we hebben in psychologische testen? Steeds kritisch blijven.
Þ testen van slechte kwaliteit gebruiken, vergroot risico om foute beslissingen te nemen
bv. waarom blijven bedrijven hun werknemers opdelen in groen/ rood/ geel/ blauw? test scoort zeer slecht o.b.v.
wetenschappelijk bepaalde kwaliteitscriteria; maar is simpel en veel marketing
Hoe ga jij later – als psycholoog – gebruik maken van psychologische testen? Basisinstrument om diagnose
psychiatrische stoornis te stellen, risicoinschatting (forensisch: recidieven, suïcide…), evolutie van problematiek
meten om te kijken of behandeling effectief is
Psychometrie = wetenschappelijke studie van (de kwaliteit van) psychologische testen; focus ligt
daarbij op psychologische testen en assessment, maar psychometrie is ook toepasbaar op andere
domeinen zoals criminologie, economie, of educatiewetenschappen
1.2. Het belang van psychologische testen
psychologen • klinisch psycholoog: stellen van diagnoses
- testing: relatief eenvoudig proces waarbij psychologische test wordt afgenomen
v/een persoon en men tot specifieke score op de test komt
- assessment: complex proces waarbij meerdere psychologische testen worden
afgenomen, aangevuld met info uit andere bronnen zoals interviews en observaties,
om zo tot een holistisch beeld te komen over functioneren v/een persoon
• a&o psycholoog: selecteren beste kandidaat tijdens sollicitatieprocedure
onderzoekers • verzamelen van data m.b.v. een vragenlijst of experiment (> hypotheses testen)
maatschappij • we vullen allemaal testen in, die een impact hebben op ons dagdagelijks leven
(bv. reviews om keuzes op te baseren, we geven zelf/ scoren reviews resto’s..)
• impact social media, big data, AI (wat je doet wordt geregistreerd door bedrijven
die dit aanbieden; zij kunnen zo bep zaken zoals ph inschatten)
1
,1.3. Definitie
Psychologische test = een systematische procedure om het gedrag van twee of meer personen te
vergelijken (inter-individuele verschillen), of om het gedrag van een persoon op verschillende
momenten te vergelijken (intra-individuele verschillen)
Cornbach definieerde in 1960 eerste deel “systematische
procedure om gedrag van 2 of meer personen te vergelijken”
Enkele kenmerken:
- gebruiken systematische procedures
- leveren een staal van gedrag op (steekproef >
uitspraak over breder gedrag)
- leveren een testscore op
- maken gebruik van normen
- voorspellen gedrag buiten de test
1.4. Kenmerken van psychologische testen bv. zelfbeoordelingstest
Een staal van gedrag
Een test bestaat uit een eindig aantal items (= vragen/ stellingen/ opdrachten) (praktisch haalbr houden)
Selectie van deze items is dus cruciaal, ze moeten een representatief “staal” van gedrag meten
bv. examen: inschatten of studenten leerstof beheersen – representatief staal van vragen nodig; enkel over HOC1
geeft geen goed beeld over totale kennis vak
Deze items moeten niet noodzakelijk rechtstreekse afspiegeling zijn vh gedrag dat we wensen te meten
bv. stel vragenlijst over depressiviteit met item “hoeveel glazen water drinkt u per dag” – heeft geen rechtstreeks
verband. Maar kan zijn dat onderzocht is of depressieve mensen minder water drinken en dan is het wel nuttig
Systematische procedures (op 3 niveaus)
Testontwikkeling
Psychologische testen worden ontwikkeld op basis van wetenschappelijk onderzoek
- testontwikkelaar stelt een itempool op (grote lijst van vragen die allemaal bruikbaar kunnen zijn)
- uit itempool worden beste items geselecteerd (items die goed scoren op of bijdragen aan
psychometrische kenmerken, zoals betrouwbaarheid, predictieve validiteit, test accuraatheid –
er zeker van zijn dat items die ze hanteren daadwerkelijk meten wat ze geacht worden te meten)
- psychometrische kwaliteit van test wordt op regelmatige basis opnieuw getest – test van 20 jaar
geleden bv. kan intussen gedateerd zijn
Testafname
Gestandaardiseerde manier om test af te nemen (omschrijft op duidelijke manier hoe test af te nemen; bij
iedereen op zelfde manier afnemen, zodat resultaten achteraf makkelijk kunnen worden vergeleken)
Bv. digit span test: steeds langer wordende reeks cijfers herhalen om intelligentie te meten; stemintonatie, of
manier waarop je die reeks aanbiedt, speelt grote rol in reactie persoon – vergelijk:
- 1–8–0–0–3–2–6–4–8
- 1800 – 32 – 648 (makkelijker want trunken)
2
, Testscoring en interpretatie
Hoe worden antwoorden op verschillende items omgezet in score en hoe deze interpreteren?
- objectieve scoring = via een op voorhand opgesteld schema, lijst met alle antwoordopties (bv.
zelfbeoordeling), aan elke optie wordt een waarde toegekend
- subjectieve scoring = bv. inktvlekken test “wat zie je in figuur”? – er zijn oneindig veel antwoorden
mogelijk, je kan daar dan uithalen of de persoon zich gaat richten op de zwarte gedeeltes, de rechts of
links deeltjes,... er zijn dus enkel een paar richtlijnen om de responsen te hanteren (op voorhand scores
verbinden aan antwoorden gaat hier niet; eerder kijken nr bep kenmerken van antwoorden om te scoren)
Testscores
“Whatever exists at all exists in some amount” (Thorndike, 1918) als iets in bepaalde mate bestaat,
“Anything that exists in amount can be measured” (McCall, 1939) kunnen we het ook meten
Met een test willen we een bepaald psychologisch kenmerk (construct) meten (bv. intelligentie,
depressie, creativiteit); we gaan er van uit dat elke persoon dit kenmerk in zekere mate bezit
Testscore = een schatting van de “mate” waarin dit kenmerk bij een persoon aanwezig is; elke
testscore bevat echter een zekere meetfout: X = T + e
Bv. examen: je zal een score halen die licht afwijkt van wat je normaal zou kunnen behalen – als je op dag
examen opstaat en je hebt hoofdpijn, kan dit tot slechtere score leiden; als de vragen toevallig allemaal gaan over
delen die je goed gestudeerd hebt, ga je beter scoren
Bv. als je een IQ test doet en iemand scoort 110 is dat de effectieve score, maar die is nooit 100% juist. Er gaat
altijd iets verloren door meetfout
- X = geobserveerde score, T = ware score (True), e = meetfout (error)
- X en T moeten zoveel mogelijk overeenstemmen
- T score moet niet onveranderlijk zijn (bv. persoonlijkheidstrekken)
- e is negatief als je bv. IQ van 120 test maar het is eigenlijk 130, dan negatieve meetfout van -10
- meetfout kan door verschillende dingen bv. slecht geslapen
- meetfout zal nooit 0 zijn en voor elke onderzochte deelnemer zal e een andere waarde zijn
Wat met een psychologische test wordt gemeten, is geen “ding” dat fysisch bestaat. Meestal gaat het over een
abstractie (abstract begrip of construct) waarvan men heeft ondervonden dat het bruikbaar is om niet-testgedrag
te voorspellen. Bv. IQ is niet zoiets dat ieder van ons met zich draagt, het is een score op een test waarvan is
gebleken dat die bruikbaar is om studiesucces, intellectuele vaardigheden en dergelijke te voorspellen.
Normen en standaarden
Stel dat je een score 130 op een intelligentietest uitkomt. Hoe moet je dit interpreteren?
Normen = een samenvatting van testresultaten voor een grote steekproef die representatief is voor een
populatie; maar, niet elke test heeft normen! (kost tijd/ geld + niet elke test normen nodig – criterion based)
(voordeel normen: test afnemen van nieuwe persoon en diens score vergelijken met norm)
Verschil tussen norm-referenced en criterion-referenced testen
- norm-referenced – men gebruikt normen om scores te interpreteren
- criterion-referenced: – geen normen nodig, je moet een bepaalde score behalen op test om bepaalde
diagnose te krijgen/ geslaagd te zijn – kijken of criterium behaald wordt (bv. examens)
3