CAPITA SELECTA (1STPN: 10 MKV+ GISCORRECTIE)
TEKST 1: De zaden van psychometrie: Thurstone zijn subjectieve units
1.Ontstaan psychometrie
Begin van de 20e eeuw (1900) ontstond er een studiegebied dat zich richtte op het meten van menselijke eigenschappen.
• Lastig vast te pinnen
• De onderwijspsychologie was een opkomende specialisatie
- Pogingen gedaan om de benadering van meten te combineren die Galton en Fechner hadden geïntroduceerd
- Thorndike, Spearman en Binet benadrukken de rol die metingen zouden moeten spelen in de studie van menselijke cognitie,
leren en ontwikkeling.
- Explosie van belangstelling voor intelligentietests tussen 1910 en 1930 => de facto een subveld binnen de onderwijspsychologie
ontstond dat zich richtte op mentale tests, en een subveld binnen dit subveld dat zich primair richtte op het testen van
academische prestaties => onderwijsmeting (educational measurement) (Lindquist, 1951)
- Begin jaren dertig (1930) stond op het punt een veld te ontstaan van studie en praktijk dat de grenzen overlapte die bestonden
tussen de opkomende tradities van de experimentele psychologie, de onderwijspsychologie en de onderwijsmeting
= PSYCHOMETRIE (Thurstone)
- H3: Galton die psychometrie had gedefinieerd als ‘de kunst v/h opleggen van metingen en getallen aan de werking v/d geest
- Het vakgebied psychometrie ontstond pas 1936 met de publicatie van Guilford’s boek Psychometrische Methoden + oprichting
v/d Psychometrische wetenschap/Society en het bijbehorende tijdschrift Psychometrika.
- Guilford merkt op: Begin 20e eeuw (1900) twee verschillende benaderingen van psychologische metingen ontstaan: de ene was
gebaseerd op de experimentele methoden v/d psychofysica en de andere op de correlatieve studie v/ individuele verschillen door
middel van mentale tests.
- 1) Enerzijds kunnen we I/h cumulatieve werk van Thurstone een synthese vinden v/d methoden en conceptualisaties van het
meten van menselijke eigenschappen (geïntroduceerd door: Fechner, Galton, Binet en Spearman).
- 2) Anderzijds vermeed en/of verwierp Thurstone met opzet aspecten van deze methoden en conceptualiseringen die tot de
meeste controverse hadden geleid (vb: de metafysica van Fechner, de leeftijdseenheden van Binet en het dogmatisme van
Spearman) of die, in het geval van Galtons eugenetica (de meeste minachting)
- Thurstone: vermogen om de heersende onderzoeksmethoden in het onderwijs en de psychologie te inventariseren, wat hij als
hun zwakke punten beschouwde, te snoeien, ze binnen een algemener wiskundig raamwerk te plaatsen, en vanuit dit raamwerk
niet alleen nieuwe methoden vast te stellen, maar ze ook toe te passen + een breed scala aan actuele sociale kwesties
bestuderen, zoals de structuur en ontwikkeling van intelligentie, maatschappelijke attitudes en zelfs het effect van propaganda
op deze attitudes.
- Het zou opmerkelijk genoeg zijn om dit op één enkel gebied te doen; Thurstone deed het op ten minste drie gebieden:
factoranalyse (Spearman), de schaalvergroting van mentale tests (Galton, Binet en Thorndike) en psychofysica (Fechner)
(Dit H: focus op enkel de psychofysica, omdat dit de duidelijkste verwoording is van Thurstone’s conceptualisering van
psychologische meting).
2.Achtergrond Thurnstone
Meest indrukwekkende deel van Thurstone’s carrière vond plaats voordat hij met FA begon te werken, tijdens zijn eerste zeven jaar als
nieuw benoemd professor aan de afdeling Psychologie van de Universiteit van Chicago (1924-1931).
• Publicatie boek: The Nature of Intelligence (1924) (waarin hij hypothesen over cognitief functioneren presenteerde die verschilden
van alle heersende theorieën van die tijd)
• De volgende vijf jaar: nam hij drie gelijktijdige werkzaamheden op zich: het verzamelen van de materialen voor een leerboek over
mentale testtheorie dat zich concentreerde op de concepten van betrouwbaarheid en validiteit (dit werd nooit gepubliceerd maar
werd wijd verspreid onder de naam Thurstone , 1931a), het ontwikkelen van nieuwe methoden voor het opschalen van educatieve
en psychologische tests, en het reconceptualiseren van psychofysica tot een methode voor psychologische meting met potentiële
toepasbaarheid die veel verder gaat dan het meten van sensatie.
• Motivatie voor alle 3 deze bijdragen => voor een groot deel voort uit Thurstone’s beoordeling van de zwakke kennis rond mentale
tests en psychofysica toen hem werd gevraagd deze onderwerpen aan zijn studenten te onderwijzen.
• Extra uitleg andere 2 bijdragen: eerst geïntroduceerd als een methode voor absolute schaalvergroting voor educatieve en
psychologische tests, maar nu bekend als de methode van ‘Thurstoniaanse schaalvergroting’ (in literatuur over onderwijsmeting)
- Begin jaren twintig (1920) was er 1 prominente methode om prestatie- en intelligentietestscores op een meetschaal te plaatsen:
de ‘mentale leeftijd’-methode die was geïntroduceerd door Binet en Simon (1916 [1908, 1911]) en verder gepopulariseerd door
Terman. (1916).
- Thurstone: zag aanzienlijke problemen met de constructie en interpretatie van een mentale leeftijdsschaal + ook problemen met
bestaande puntschaalmethoden als hulpmiddelen voor het beantwoorden van opkomende vragen over de groei van de
intelligentie in de loop van de tijd.
- Hoewel het oorspronkelijke doel van intelligentietests (Binet): het verschaffen van fundamenteel normatieve informatie was die
voor diagnostische doeleinden kon worden gebruikt, riep het gebruik van de tests vragen op over wat er kon worden afgeleid
over de chronologische ontwikkeling van intelligentie.
- Bijdrage Thurstone: expliciet maken dat het doel van elke testonderneming die werd opgezet met het doel conclusies te trekken
over groei, een schaal moest zijn die kon voldoen aan de eisen van orde, afstand en oorsprong die kenmerkend zijn voor fysieke
meetschalen.
- Thurstone (1928a): (nadrukkelijk) “de hele studie naar het meten van intelligentie nauwelijks twee fundamentelere problemen
kan hebben dan het ontbreken van een meeteenheid en het ontbreken van een oorsprong van waaruit kan worden gemeten!”
- De benadering van “absolute schaling” die Thurstone (1925-1931) introduceerde + ontwikkelde, was in wezen een uitwerking van
Galtons methode van relatieve meting (zie hoofdstuk 3) die was toegepast door Thorndike als context v/h creëren van schalen
voor de leesbaarheid van het handschrift, de kwaliteit van het schrijven en de prestaties bij het tekenen.
- De methode van Thurstone was gebaseerd op de veronderstelling dat een reeks tests gericht op kinderen naar leeftijd een
gemeenschappelijk kenmerk mat dat normaal verdeeld was
, - Gegeven een ontwerp waarbij er subsets van items gemeenschappelijk zijn voor kinderen van aangrenzende leeftijden, zou men
het aandeel van deze correct beantwoorde items kunnen gebruiken in combinatie met het omgekeerde van de normale
cumulatieve verdelingsfunctie om de schaal voor de lagere leeftijdstest te koppelen aan de schaal voor de hogere leeftijdstoets
(of omgekeerd)
- Bij demonstratie, merkte Thurstone een belangrijke verborgen aanname op van de methode zoals deze door Thorndike was
geïmplementeerd: dat de variabiliteit van het attribuut in de loop van de tijd constant zou blijven.
- De schaalbenadering (Thurstone) versoepelde deze veronderstelling=> aantonen dat er (ótot conventionele wijsheid) bewijs
was dat de variabiliteit in intelligentie toenam met de leeftijd en geen tekenen vertoonde van een significante vertraging op de
leeftijd van 14 jaar.
- Met een innovatieve empirische methode=> lokatie vast stellen voor een ‘absoluut nulpunt’ van intelligentie op zijn schaal, een
die correspondeerde met een voorspelde chronologische leeftijd van twee maanden na de conceptie.
- Weinig context voor het probleem dat Thurstone probeerde op te lossen en de nadruk die hij legde op het vaststellen van een
betekenisvolle meeteenheid
- Tegelijkertijd kan men sympathie voelen voor deze discrepantie, omdat Thurstone zelf, achteraf bezien, zich misschien heeft
gerealiseerd dat de schaalmethode die hij had toegepast in de context van intelligentietests enigszins inconsistent was met zijn
eigen theoretische perspectief, ondersteund door zijn empirisch onderzoek m.b.v FA blijkt dat intelligentie een multidimensionaal
attribuut is
- Niettemin zijn 2 aspecten van Thurstone’s absolute schaalbenadering kenmerken die ook naar voren komen in de benadering die
hij zou volgen om de analyse van psychofysische experimenten opnieuw te conceptualiseren.
1. Hij had niet alleen een methode ontwikkeld die gebruik maakte van de aanname van normaliteit, maar die ook een middel
bood voor een empirische controle van de plausibiliteit van de aanname
2. Hij had het schaalprobleem geformaliseerd in termen van een stelsel van vergelijkingen en daarbij rekening gehouden met
verschillen in variabiliteit bij het parametriseren van het stelsel van vergelijkingen
- Zijn vrouw: Thelma Gwinn Thurstone speelt een belangrijke rol
3.Op weg naar psychologische metingen
1) Discriminele processen
De bredere conceptualisering v/d psychofysica (Thurstone (1927-1930) introduceert), werd kennelijk aangewakkerd door zijn irritatie
omdat hij het onderwerp aan zijn studenten moest onderwijzen. Hij beschouwde de klassieke psychofysica als het ‘dode onderwerp van
opgeheven gewichten’ en het ‘saaiste deel van de psychologie’ (1959).
• Toen ik in 1924 begon met lesgeven in psychologische metingen, was het vanzelfsprekend dat ik de studenten aanmoedigde iets over
psychofysische methoden te leren.
• De standaardreferentie waren de 2 grote delen over kwantitatieve psychologie van Titchener. Het bepalen van een limen [een net
merkbaar verschil] was het fundamentele probleem in de ouderwetse psychofysica. Om wetenschappelijk op dit gebied te zijn, werd
men verondersteld op de hoogte te zijn van de oude debatten over hoe de limen voor opgeheven gewichten tot op twee decimalen
moet worden berekend met een standaardstimulans van honderd gram.
• Over iets triviaals kan men zich nauwelijks zorgen maken. Wie zorgt er voor de exacte bepaling van iemands limen voor geheven
gewichten? Bij het onderwijzen van dit onderwerp vond ik dat we iets aan deze absurditeit moesten doen door interessantere
stimuli te introduceren.
• H2: psychofysica onder de loep nemen in de context van Fechners experiment met gewichtheffen, waarbij we gebruik maakten van
de methode van goede en foute gevallen, die meer algemeen bekend werd als de constante methode.
• Samengevat: een experiment met een constante methode omvatte altijd een reeks van n stimuli in de vorm van gewichten die op
grootte konden worden gerangschikt van klein naar groot, waarbij elk gewicht in de reeks met een vaste toename verschilde.
- Uitgangspunt v/d klassieke psychofysica was dat elke stimuluswaarde in de reeks (xj) geassocieerd kan worden met een
overeenkomstige sensorische intensiteit (Yj). Fechner had geprobeerd de associatie tussen stimulusverschillen en de reacties op
deze verschillen te gebruiken om een reeks meeteenheden voor de sensatie-intensiteit, Y, op te bouwen in termen van net
waarneembare verschillen (jnds= just noticeable differences).
- Op deze manier konden onbekende eenheden van psychologische grootheden worden begrepen in relatie tot bekende eenheden
van fysieke stimuli. De breuk met de klassieke psychofysica (Thurstone) wilde maken, was het versoepelen van de beperking dat
deze stimuli, xj, fysieke grootheden moesten zijn.
- Wnr een persoon werd blootgesteld aan paren fysieke stimuli in een experiment zoals de constante methode, waren de
vergelijkingen die voor elke combinatie werden gemaakt gebaseerd op het vermogen van een proefpersoon om de volgorde van
het attribuut te onderscheiden in tegenstelling tot de omvang ervan: gewicht 1 zwaarder dan gewicht 2? Is toon 1 luider dan toon
2? In die zin was de enige vereiste bij dergelijke experimenten dat de stimuli waaraan een persoon wordt blootgesteld, kunnen
worden geordend.
- Thurstone: waarom zou hij de aandacht beperken tot gewicht en geluiden?
- Bijzonder: als psychologische kwaliteiten op zijn minst theoretisch te ordenen zijn, dan kunnen ze ook vergeleken worden als een
of andere concretisering v/ deze kwaliteiten gepresenteerd kan worden als stimuli. En als ze kunnen worden vergeleken, kan een
deel van de gevallen worden gevonden waarin stimulus 1 > stimulus 2, en dit deel kan de basis worden voor het lokaliseren van
elke stimulus op een psychologisch continuüm.
- Tegelijkertijd: als de stimuli niet langer fysieke grootheden met bekende eenheden zijn, heeft het niet langer veel zin om over jnds
te spreken, laat staan om een jnd te gebruiken om de meeteenheid voor een psychologisch attribuut van belang te definiëren. Wat
zou de plaats van de jnd innemen? Het idee waar Thurstone zich op zou richten als grondgedachte voor de constructie van een
psychologisch continuüm met een schatbare meeteenheid was het concept van een discriminatieproces.
- Concept lijkt vaag als het in abstracte vorm wordt gepresenteerd (zie vb’en).
- Figuren 2 en 3 presenteren de vier originele grafische figuren die Thurstone achtereenvolgens gebruikte om het concept van een
discriminatieproces te introduceren