Elias El Morabiti 2020-2021
Statistiek I
WAT IS STATISTIEK?
Lock5 → gezin bestaande uit 5 statistiek proffen
Dotplot → puntgrafiek
Proef muntstuk 10x opgooien
Munt: IIII
Kop: IIIIII
Alleen het toeval laten spelen
9 keer kop gooien → ‘niet normaal’ met eerlijk muntstuk → redeneren
Inzicht verwerven uit gegevens
Beschrijvende Inferentiële statistiek
Beschrijvend = Fenomenen beschrijven
Inferentieel = Op basis van steekproefgegevens met bepaalde zekerheid
uitspraken kunnen doen over populaties
Deductieve of beschrijvende statistiek
Berekeningen en interpretatie van samenvattende statistische maten, zoals
indexcijfer, gemiddelde, etc.
Maakt gebruik v/h geheel v/ gelijksoortige objecten of data, ofwel v/d populatie.
Deze data worden samengevat in een beknopte weergave, teneinde globale
patronen en kenmerken te ontdekken.
Inductieve of inferentiële statistiek
Verklarende statistiek, maakt gebruik van kansrekening
Maakt gebruik v/d steekproef. Op basis v/ een beperkt aantal gegevens wordt
getracht om algemene uitspraken te formuleren over de gehele populatie.
1
,Elias El Morabiti 2020-2021
METEN in Psychologie & Educatiewetenschappen
Bij een variabel begrip kunnen meerdere variabelen horen.
Bv. het variabel begrip “Intelligentie”
o Variabelen: schoolse kennis, taalvaardigheden, geheugen, sociaal
inzicht, leervermogen, ruimtelijk inzicht, rekenvaardigheid, …
Van variabel begrip tot variabele…
• Operationaliseren = meetbaar maken v/ variabel begrip
• Variabele = geoperationaliseerd variabel begrip
• Meten = vaststellen v/d waarde van een variabel begrip in een bepaalde analyse-
eenheid
• Meetinstrument = vragen, observaties, metingen, …
Variabele vaak afgerond bij rapportering ( → belangrijk om te realiseren!)
Continue variabele worden vaak discreet gemaakt
Bv: als we aan iemand vragen om de temp te checken dan
krijgen we vaak een antwoord dat een rond getal is (21 , 22,
23). Zo lijkt het alsof temp telkens met een sprong van 1
graden stijgt of daalt. In werkelijkheid is dit niet het geval. Door
afronding maken wij dus van een continue var een discrete
var.
Bv discrete: aantal pingpong ballen in een zak. (je kan geen
halve bal hebben)
Meten is gebaseerd op 4 eigenschappen:
• Identiteit (= of ≠) of Categoriseerbaarheid
o 2 objecten vergelijken: zijn ze gelijk of verschillend vb: geslacht
• Ordenbaarheid (volgorde)
• Afstanden
Meetniveau Bijkomende eigenschap Bewerking
Nominaal Identiteit =≠
Ordinaal Orde <>≤≥
Interval Vaste meeteenheid -
Ratio Absoluut nulpunt ±
(“eigenschap is afwezig”)
• Absoluut nulpunt
o Lengte, temperatuur (0 Kelvin → géén warmte)
Meetniveau bepaalt toegelaten bewerkingen…
2
,Elias El Morabiti 2020-2021
• Nominaal: Er zijn meer meisjes dan jongens (Tellen)
• Ordinaal: De helft v/d studenten is kleiner dan Jan (Analyse eenheden ordenen
volgens variabelen)
• Interval: Vorige week was het elke dag 2°C warmer dan de dag ervoor (Grootte v/
intervallen vergelijken)
• Ratio: Jan heeft de puzzel gelegd in de helft v/d tijd die hij gisteren nodig had
(Verhoudingen tussen meetwaarden bepalen)
Verband tussen meetschalen
Geen zwart-wit-verhaal ; 2 personen met een 7/10 op een toets hebben niet
noodzakelijk dezelfde prestatie geleverd → dus moeilijk om te categoriseren
Optimale meetprocedure en codering streeft naar het hoogst mogelijke meetniveau
Soms kun je een andere meetschaal gebruiken om andere resultaten te
bekomen
Voorbeelden:
• Nominaal = geslacht
• Ratio = lichaamslengte
• Interval = (onze) tijdrekening of temperatuur
• Ordinaal = akkoord / niet akkoord / helemaal akkoord / …
Besluit over meetschalen:
• Meetniveau van een meetschaal bepaalt welke bewerkingen mogelijk zijn met
meetwaarden
• Variabele met een hoog niveau KAN behandeld worden als een variabele met
een lager meetniveau MAAR daarbij gaat informatie verloren
• Daarom kan altijd best een zo hoog mogelijk meetniveau worden nagestreefd
(optimale meetprocedure)
3
, Elias El Morabiti 2020-2021
1.1 Weergeven van verdelingen van grafieken
De eerste stap die je moet zetten als je met data te maken krijgt is die data te
“verkennen”. Een exploratorische data-analyse is het proces waarbij statistische
technieken en hulpmiddelen worden gebruikt om data te onderzoeken en de
kenmerken ervan na te gaan.
Data exploreren:
1. Begin met elke variabele apart te onderzoeken: centrale tendens/”midden”,
spreiding, uitschieters, …
2. Pas daarna wordt gekeken naar verbanden tussen variabelen
3. Begin met één of meerdere grafieken, daarna komen karakteristieke maten en
cijfermatige beschrijvingen aan bod
In een dataset staan voor de onderzochte cases (deelnemers, analyse-eenheden)
telkens meetwaarden voor één of meerdere variabelen (kenmerken, eigenschappen,
prestaties, …)
Bv. uren van proffen tussen faculteiten vergelijken o Observatie-eenheden =
de proffen o Analyse-eenheden = de faculteiten
Variabele = geoperationaliseerd kenmerk v/h individu
Categorische variabele = deelt individu in bepaalde categorie in = nominale
en ordinale schalen
Kwantitatieve variabele = neemt numerische waarden aan waarop wiskundige
operaties zinvol mogelijk zijn – variabelen die cijfers opleveren waarmee we
kunnen rekenen = interval niveau
Grafische voorstelling van een verdeling → tabellen
• De verdeling v/ een variabele geeft weer WELKE WAARDEN die variabele
aanneemt en HOE VAAK die waarden voorkomen
• Verdelingen kunnen op vele manieren voorgesteld worden, de keuze moet
worden bepaald in functie v/d aard v/d variabele en de “leesbaarheid” o
Categorische variabele: kolomdiagram, staafdiagram, strookdiagram,
taartdiagram, lijndiagram, pictogram
o Kwantitatieve variabele: histogram, staafdiagram, frequentieveelhoek,
cumulatief histogram
Grafische voorstellingen van categorische variabelen
Gebaseerd op “gewone” frequentietabel
Staafdiagram = een kolomdiagram waarvan de kolommen versmald worden tot lijnen
Waaraan moet een “goede grafische voorstelling” voldoen?
Duidelijk ; juiste boodschap overbrengen
Goed leesbaar
Besluit over grafische voorstellingen voor kwalitatieve data:
• “MOOI” is niet hetzelfde als “duidelijk” of “informatief”
• Sommige (mooie) grafische voorstellingen zijn ronduit misleidend en moeten daarom
zeer goed toegelicht worden OF beter niet gebruikt…
• Kolomdiagrammen en strookdiagrammen zijn vaak de beste keuze
• 3D-voorstellingen zijn “mooi” maar moeilijk exact af te lezen (door positionering t.o.v.
de achtergrond)
• Pictogrammen beter vermijden vanwege verwarring over grootte
4