Hoofdstuk 2 : Meten en meetschalen
Terminologie en kernbegrippen
Onderzoekspopulatie: Alle leden van een welomschreven groep die je wil onderzoeken (Omvang en
type kan sterk variëren, moet duidelijk omschreven zijn)
Statistische eenheid: = cases: element uit de bestudeerde bevolking: mensen, schapen, woningen,
landen, regio’s, kranten...
→Statistiek bestudeert de kenmerken van die bevolking
Variabele: Kenmerken van onderzoekseenheden waarin we geïnteresseerd zijn (soms een waarde;
leeftijd. Soms niet; geslacht)
Waarden: de verschillende antwoordmogelijkheden
Datamarix:
- Cases (waarnemingseenheden): in rijen = records
- Variabelen: in kolommen
- Waarden: in cellen
Terminologie bij de datamatrix:
Parameters: Kengetallen die de verdeling weergeven van een kenmerk in een populatie (vb:
gemiddelde v/e populatie (µ); de standaardafwijking)
Steekproeven: deel van de populatie (Onderzoek m.b.t. specifieke bevolkingsgroep (populatie) vaak
onmogelijk om deze volledig te onderzoeken)
➔ Inferentiële statistiek: conclusies trekken over volledige populatie op basis
van steekproefonderzoek
Steekprofstatistieken: statistische kengetallen v/e steekproef of schatters (vb: gemiddelde
steekproef; standaardafwijking)
➔ Schatter = een numerieke samenvatting v/d steekproef uit de populatie
,Statistische reeks: Reeks waarnemingen (vb: kijkgedrag van verschillende personen)
Tijdreeks: Reeks waarnemingen in de tijd. Ogenblik van waarneming is belangrijk voor de
interpretatie van de gegevens (evolutie van facebookgebruik doorheen de tijd)
Dimensie ven een reeks: Aantal variabelen dat simultaan wordt waargenomen of bestudeerd
(unidimensionale reeks → 1 kenmerk; Tweedimensionale reeks → 2 kenmerken …)
Meten?
1. Waarom meten?
- (Numerieke) waarden aan objecten toekennen
- Laat toe om vergelijkingen te maken
- Standaarden nodig om te vergelijken : el, voet, cm,…
- Moderne standaarden en internationale overeenkomsten: lengtematen, tijdsmaten, gewicht,
inhoud,...
- Statistiek heeft nood aan standaarden
• Voor sommige eenheden evident (bv. leeftijd, bevolkingsdichtheid)
• Voor andere complex (bv. opleidingsniveau, inkomen) tot zeer complex (bv.
armoede)
• Gestandaardiseerde meetschalen en gestandaardiseerde indicatoren
2. Wat is meten?
Operationalisatie:
- Meetbaar maken van variabelen in één of meerdere vragen
- Bepalend voor de rest van je onderzoek
- Meestal op basis van voorafgaand onderzoek of op basis van een theorie
- Sommige variabelen hoeven niet onderbouwd te zijn (geslacht), andere wel (armoede,
seksisme, racisme…)
Afhankelijke en onafhankelijke variabelen:
- In veel onderzoek wens je een variabele te verklaren of relaties met andere variabelen in
kaart te brengen
- Voorbeeld: effect van opleiding op gezondheid
• Gezondheid = afhankelijke variabele
• Opleiding = onafhankelijke variabele
Meten → Stap 1) Verdelen van populatie in equivalentieklassen: Deelverzameling van P die alle
elementen groepeert die equivalent zijn voor het bestudeerde kenmerk
Stap 2) Schalen: Toekennen van een eigen waarde (kwalitatief of kwantitatief) aan elke
equivalentieklasse van het ongeschaalde kenmerk
, - De verzameling X van waarden wordt de meetschaal van de variabele genoemd
- Een variabele is een afbeelding van een bevolking P in een verzameling X van waarden à het
gemeten eigenschap of kenmerk
Meten & meetschalen
Toekennen van getallen aan equivalentieklassen
Hoe? → Aan elke waarde van het ongeschaalde kenmerk wordt een unieke, specifieke ‘code’ of getal
toegekend
Vb: Antwerpen en Gent → Antwerpen krijgt nummer 1, Gent nummer 2
Elke variabele heeft een bepaalde meetschaal. Er zijn 3 eigenschappen:
- Ordenbaarheid ( > of < )
• Bv: slecht < goed < heel goed
- Meeteenheid
• Bv: cm, leeftijd, aantal woorden
- Absoluut nulpunt
• Bv: centimeter, aantal kinderen
Kwantitatieve vs kwalitatieve waarden
In de sociale wetenschappen gebruiken we vaak kwantitatieve waarden
Kwantitatieve waarden: Bevat meetgegevens. Ze bevatten cijfers
Kwalitatieve waarden: Bevat geen meetgegevens. Beschrijvende informatie
Voordelen:
- Kwantitatieve waarden eenduidiger dan kwalitatieve waarden
- Verwerking van kwantitatieve waarden via computer vlotter
- Kwantitatieve waarden meer mogelijkheden tot analyse
➢ gegevens kunnen worden samengevat in simpele beschrijvende maten
➢ relaties tussen kenmerken kunnen als algebraïsche functies uitgedrukt worden
, 3. Eigenschappen van variabelen
Meetniveau:
De meetniveau bepaalt welke statistische analyses mogelijk zijn en welke niet
Er zijn 4 meetschalen (NOIR):
- Nominaal
• Indeling in categorieën zonder logische volgorde
• Classificatie
• De numerieke waarde is altijd een naamgeving
• Bv: geslacht, politieke partijvoorkeur, migratieachtergrond, woonplaats, …
- Ordinaal
• Indeling in categorieën met logische volgorde
• Classificatie + rangordening
• Bv: Opleidingsniveau, 5-puntsschaal of brons-zilver-goud
• Opmerking:
➔ de ordenbaarheid van de waarden weerspiegelt een bestaande ordening
tussen de equivalentieklassen van het bestudeerde kenmerk
➔ volgorde duidelijk, maar verschillen niet interpreteerbaar: opties liggen niet
noodzakelijk even ver uit elkaar
- Interval
• Afstand tussen 2 categorieën/waarden zijn gelijk → Zelfde verschillen tussen de
waarden van X weerspiegelen zelfde verschillen in intensiteit van het bestudeerde
kenmerk
• Classificatie + rangordening + meeteenheid
• Slechts van toepassing op kwantitatieve variabelen
• Bv: Temperatuur, geboortejaar…
- Ratio
• Classificatie + rangordening + meeteenheid + absoluut nulpunt
• Absoluut nulpunt = er komen geen negatieve waarden voor
• Er kan opgeteld en afgetrokken worden, vermenigvuldigd en gedeeld worden
• Bv: Lengte, leeftijd, aantal uren…
• Opmerking
➔ Negatieve waarden komen niet voor wanneer een absoluut nulpunt bestaat
➔ Ratio’s of verhoudingen zijn bepaald
Discrete vs continue variabelen:
- Continue variabelen: kunnen elke waarde aannemen (= met tussenmaten)
• Bv: lengte, afstand, !LEEFTIJD!
- Discrete variabelen: kunnen alleen gehele waarden aannemen
• Bv: aantal kinderen, aantal vrachtwagens
• CONTITUITEITSCORRECTIE!!!!
→ Zie verder voor schikking van gegevens interval- of ratioschaal, in klasse gegroepeerde gegevens
Klassenmidden = ondergrens + bovengrens / 2