STATISTIEK I
Prof. Dr. P. Theuns
ACADEMIEJAAR 2021-2022
VRIJE UNIVERSITEIT BRUSSEL
,
,
,
,
, > Tab
Telserie
1 2 3 4 5 6 7 8 9
INTRO: WAT IS STATISTIEK? 1 6 15 14 23 25 10 5 1
25
Les 1 (27/09/2021)
20
Experiment: Iemand beweert dat die 10 keer een muntstuk heeft opgegooid en daarvan 9 keer na elkaar
15
“kruis” gooide … Liegt deze persoon?
10
Op computer werd deze vraag gesimuleerd: de kans op 10x kruis gooien is zeer klein. Je kan dit
5
bekijken met een software, R (gratis) of SPSS.
0
1 2 3 4 5 6 7 8 9
1. B ESCHRIJVENDE VS . I NFERENTIËLE STATISTIEK
Definitie: Statistiek is de wetenschap van kennisverwerving op basis van gegevens. Hoe kunnen we uit gegevens kennis
Erhalen?
zijn altijd twee delen
Beschrijvende statistiek = DEDUCTIEF Inferentiële statistiek = INDUCTIEF
Fenomenen beschrijven Op basis van steekproefgegevens met bepaalde
zekerheid uitspraken kunnen doen over populaties
Wat • Berekening en interpretatie van • Verklarende statistiek, maakt gebruik van
samenvattende statistische maten, zoals kansrekening
indexcijfer, gemiddelde, etc. • Maakt gebruik van de steekproef. Op basis van
• Maakt gebruik van het geheel van een beperkt aantal gegevens wordt getracht om
gelijksoortige objecten of data, ofwel van de algemene uitspraken te formuleren over de
populatie. Deze data worden samengevat in gehele populatie.
een beknopte weergave, teneinde globale
patronen en kenmerken te ontdekken.
Technieken • Ordeningstechnieken: beeld creëren Veralgemening van steekproef naar populatie
o tabellen • Schatten
o grafische voorstellingen o Op basis van steekproefdata parameters
o frequentieverdeling (karakteristieke maten van populatie)
• Reductietechnieken: grote hoeveelheid schatten
gegevens terugbrengen tot enkele maten • Toetsen
o karakteristieke maten (centrale tendens, o Op basis van steekproefdata expliciete
spreiding, …) hypothesen over populatie aanvaarden of
• Associatietechnieken: verbanden tussen twee verwerpen
variabelen (o.a. correlatie-coëfficiënten)
o associatiematen
Statistiek I: Meetschalen en Beschrijvende Statistiek – AJ2021-2022
1
,2. K ERNBEGRIP : V ARIABELE
Psychologen zijn bijvoorbeeld geïnteresseerd in variabel begrip “INTELLIGENTIE” -> je kan dit echter niet meten
Voorbeeld
met een meetlat! Je gaat dit meten met een IQ-test: een selectie van vragen, probleemstellingen over:
Variabelen: schoolse kennis, taalvaardigheid, geheugen, sociaal inzicht, leervermogen, ruimtelijk inzicht,
rekenvaardigheid, enz. Al deze dingen samen dragen bij aan IQ.
2.1 Definitie
Een variabele is een operationele definitie van een variabel begrip. Bij een variabel begrip kunnen meerdere variabelen
horen.
• METEN = vaststellen van de waarde van een variabel begrip (“construct”) in een bepaalde analyse-eenheid
o Eigenschappen kunnen verschillende waarden hebben in verschillende systemen. De waarden die een
variabel begrip kan aannemen zijn niet noodzakelijk getallen
o Bv. een leerkracht vragen de intelligentie van leerlingen te rangschikken kan ook o.b.v. uitspraken:
§ “Jan is intelligenter dan Tom”
§ “Sabine is een meisje, Tom een jongen”
§ “Laila heeft 12 vragen correct beantwoord, Kaat 14”
§ “De reactietijd van Ina bedroeg is 215 ms, die van Sander 211ms”
• MEETINSTRUMENT: vragen, observaties, metingen, …
• MEETBAAR maken van variabel begrip = operationaliseren
• VARIABELE = geoperationaliseerd variabel begrip
Soorten variabel begrip:
Let op met afronden: er is een realiteit van fenomenen die continu variëren (leeftijd
gebeurt niet in sprongen, gebeurt gradueel), maar door ze te gaan meten/registreren
maken we daar discrete variabelen van. Er zijn variabelen die telbaar zijn (discreet),
maar er zijn ook variabelen die continu zijn, die we discreet zullen beschouwen als
variabele.
2.2 Verzameltabel & matrix
De ruwe gegevens zoals ze zijn binnengekomen staan in een verzameltabel. Die gegevens worden gecodeerd tot een data-
matrix. In zo’n matrix wordt doorgaans gecodeerd tot getallen.
• Rij: ‘analyse-eenheden’ > deelnemers. Rijen zijn niet noodzakelijk mensen; kunnen ook groepen zijn (klassen/…).
• Kolom: ‘variabelen’ > antwoorden op vragen (cijfers/tekst/afbeeldingen/…)
Statistiek I: Meetschalen en Beschrijvende Statistiek – AJ2021-2022
2
, 3. M ETEN : M EETSCHALEN
3.1 4 eigenschappen
Meten kan op verschillende niveaus, er zijn 4 eigenschappen om dit te categoriseren:
Identiteit (= en ≠) of Ordenbaarheid Afstanden (!) Absoluut nulpunt
Categoriseerbaarheid
Om te kunnen meten moet je Er is een rangschikking mogelijk Getal dat een verschil tussen Als iemand als resultaat van de
kunnen zeggen of 2 dingen > er is een logische volgorde twee categorieën aangeeft en meting 0 krijgt, dat die de
hetzelfde of verschillend zijn over de hele lengte van de eigenschap niet heeft
meetschaal hetzelfde blijft
Bv. (haar)kleur: heel veel Bv. groep van mensen die hun Bv. 18j vs 19j en 35j vs 36j: dit is 2x Bv. iets met hoogte ‘0’ heeft geen
gradaties leeftijd zeggen (‘18’ kan ’18 en 25 een afstand van een jaar, dat hoogte, iets met hoogte ‘2’ heeft
dagen’ zijn): je zal categoriseren, even lang duurt een hoogte van 2x de hoogte van
én ordenen o.b.v. volgorde ‘1’
3.1.1 Categoriseerbaarheid: partitie
Een partie wordt bepaald door een equivalentierelatie op een verzameling X, dit
is een relatie ~ op X. Die relatie kan bv. zijn ‘… is even groot als …’
Eigenschappen:
• Reflexiviteit: voor alle x elementen van X geldt dat x ~ x
o X ‘relatie’ X: relatie is kleiner dan of gelijk aan zichzelf
• Symmetrie: voor alle x, y elementen van X geldt: als x ~ y dan y ~ x
• Transitiviteit: voor alle x, y, z elementen van X geldt: als x ~ y en y ~ z dan x ~ z
Deze relatie verdeelt de verzameling X in “equivalentieklassen”: groepen van objecten die je hetzelfde getal toekent. De
dingen die aan één hangen met lijntjes en lusjes worden als gelijk beschouwd (bv. leeftijd, x-y-z kunnen variaties binnen de
leeftijd 18 kunnen betekenen).
Statistiek I: Meetschalen en Beschrijvende Statistiek – AJ2021-2022
3