Inleiding
Wat is statistiek?
· Als wetenschappelijke discipline, werktuig, instrument & methode
· Kennismethode om de wereld beter te kennen en begrijpen
· Onderzoek obv data
· Kijken naar gegevens en verdelingen
Waarom statistiek?
· Om beweringen te staven
o Beweringen niet voldoende → nood aan data
o Verzamelen adhv juiste technieken
Als we onderzoek doen om antwoord te bieden op vraag : data verzamelen en analyseren
Fasen in sociaal-wetenschappelijk onderzoek
1. Probleemstelling : vergt kennis vd vakgebied
2. Onderzoeksontwerpen & dataverzameling
o Welke methode?
o Onderzoeksdesigns
3. Data-analyse : beschrijvende statistiek, inductieve statistiek, multivariate
analyse,…
4. Rapportering : wetenschapsmethodologie, literatuur opzoeken, refereren,
wetenschappelijk taalgebruik
Soorten statistiek
Beschrijvende statistiek
· De wereld in cijfers beschrijven : we denken spontaan vaak kwantitatief, cijfers geven precies weer
· Basis : frequentievragen
· Samenvatten in kengetallen
· Gebruik van grafische technieken
· Ordenen en synthetiseren van gegevens
· Herleiden tot : samenvattende mate (percentages, mediaan,..) en grafieken
Inferentiële statistiek
· Middel om met een beperkt aantal gegevens uitspraak te doen over een breder geheel
· Uitspraken over de volledige bevolking obv resultaten ve steekproef uit die bevolking
· Extrapolatie = Veralgemeenbaarheid van steekproefresultaten naar de populatie waaruit de steekproef
wordt getrokken
· Voorspellingen obv een steekproef
Statistische analyse
· Kennismethode gericht op verklaring van verschillen & samenhang
· Bivariate , multivariate, dummy, logistische regressie,..
· Vb : Wat is de relatie tussen inkomen vd ouders & schoolresultaten? Hoe belangrijk is elk van deze factor
in de verklaring van kijkgedrag?
Misleidende statistiek
· “There are 3 kind of lies.. Lies, damned lies and statistics”
o kernidee : cijfers zijn enorm overtuigend, worden vaak misbruikt/gebruikt om zwakke/foute
argumenten te ondersteunen
· Statistieken worden regelmatig gebruikt om mensen te misleiden
o Uitkomsten vd onderzoek kunnen gemanipuleerd worden bij :
1. Verzamelen van gegevens
2. Presentatie vd uitkomsten
3. Omschrijven va de conclusies
1
,Misleiding bij verzamelen vd gegevens
· Slechte selectie van onderzoekspersonen, niet representatief voor de bevolking die je wil onderzoeken
· Te klein aantal onderzochte personen
· Slechte vraagstelling
Misleiding bij presentatie van gegevens
· Een deel vd grafiek verwijderen
· Schaal manipuleren
· Grafische aanpassingen
Zelf leren kritisch lezen!
· Is het geciteerde cijfer correct? Geloofwaardig? Hoe is dit cijfer tot stand gekomen?..
Oorsprong vd statistiek
· Ontstaan midden 18e eeuw
o Info over naties → staatsboekhoudkunde
o Systematische verzameling van demografische en economische data door overheden
· Adolphe Quetelet
o Belg, 19e eeuw, astronoom
Hoofdstuk 1 : Meten en meetschalen
Terminologie en kernbegrippen
1. Onderzoekspopulatie
o alle leden van een groep die je wil onderzoeken, bv : alle VUB-studenten
o statistiek bestudeert kenmerken van die bevolking
2. Statistische eenheid
o cases : elementen uit de bestudeerde bevolking : bv student,
mensen, schapen, woningen
3. Variabele
o Kenmerken van onderzoekseenheden, waarin de
onderzoeker geïnteresseerd is
4. Datamatrix
o cases (waarnemingseenheden): in rijen = records
o variabelen (waarde varieert): in kolommen
5. Parameters
o kerngetallen die de verdeling weergeven ve kenmerk ve populatie
o bv : m = gemiddelde; s = standaardafwijking; p = proportie ve populatie
6. Steekproeven
o onderdeel vd onderzoekspopulatie → steekproef ≠ onderzoekspopulatie ! steekproef
7. Tijdreeks
o reeks waarnemingen in de tijd onderzoekspopulatie
o ogenblik van waarneming is belangrijk voor interpretatie vd gegevens
o bv : evolutie van kijkgedrag doorheen de tijd
8. Dimensie ve reeks
o aantal variabelen die gelijktijdig worden waargenomen of bestudeerd
o unidimensionale reeks : 1 variabele
tweedimensionale (bidimensionaal, bivariaat) : 2 variabele,
multidimensionale reeks : meer dan 2 variabelen
Wat is meten?
· Meten : verdelen ve populatie in equivalentieklassen = deelverzameling vd populatie die alle elementen
groepeert die voor het bestudeerde kenmerk als equivalent (gelijkwaardig) kunnen worden beschouwd
· Schalen : toekennen ve eigen waarde aan elke equivalentieklasse vh ongeschaalde kenmerk
· De verzameling X der waarden wordt de meetschaal vd variabele genoemd
2
, Meten & meetschalen
· Toekennen van getallen aan equivalentieklassen
· Hoe?
o aan elke waarde wordt een eigen, specifieke ‘code’ of getal toegekend : bv : provincies worden
genummerd → Vlaams-Brabant krijgt nr 1, Limburg nr 2,..
o de waarden die aan equivalentieklassen worden toegekend, weerspiegelen de relaties die in realiteit
bestaan tussen equivalentieklassen
Operationalisatie
= meetbaar maken van variabelen in 1 of meerdere vragen
(On)afhankelijke variabelen
· In veel onderzoek wens je een variabele te verklaren of relaties met andere variabelen in kaart te brengen
· bv : effect van opleiding op gezondheid : gezondheid = afhankelijke variabele; opleiding =
onafhankelijke variabele
Eigenschappen van variabelen
Meetniveau
· De manier waarop je een variabele meet, bepaalt het meetniveau of meetschaal vd variabele
· Meetniveau bepaalt welke statistische analyses mogelijk zijn en welke niet
· Er zijn 4 meetschalen : nominaal, ordinaal, interval en ratio
o hiërarchie : NOIR (zoals hierboven)
Meetniveau Informatie Betekenis vd waarden
Nominaal Classificatie : = , ≠ Waarde is slecht naamgeving
bv woonplaats
Ordinaal Ordening : < , = , > Intervallen tussen waarden vd klassen
bv diploma hebben geen betekenis
Interval Ordening + meeteenheid Afstand tussen 2 categorieën is gelijk
bv °C, IQ Intervallen tussen waarden vd klassen
hebben betekenis
Ratio Ordening + meeteenheid + absoluut Afstand tussen 2 categorieën is gelijk
bv inkomen, lengte,.. nulpunt Intervallen tussen waarden vd klassen
hebben betekenis
Je hebt absoluut nulpunt
· 4 criteria om het meetniveau de bepalen : classificatie, ordenbaardheid, het bestaan vd meeteenheid, het
bestaand ve absoluut nulpunt
o Classificatie
= numerieke waarde : slechts een naamgeving
o Ordenbaarheid
* De variabele of meetschaal X is ordenbaar wanneer : voor elk paar elementen x1 en x2 X,
men kan besluiten : x1 > x2 of x1< x2
* bv : leeftijd, lengte, opleidingsniveau, inkomen zijn ordenbaar, woonplaats niet
o Het bestaan vd meeteenheid
* Zelfde verschillen tussen waarden van X zijn zelfde verschillen in de intensiteit vh bestudeerde kenmerk
* Alleen van toepassing op kwantitatieve variabelen
* bv : temp in Celsius, geboortejaar,..
* ! 0 heeft geen bijzondere betekenis & betekent dus niet op de afwezigheid vh kenmerk
o Het bestaan ve absoluut nulpunt
* 0 geeft de afwezigheid vh bestudeerde kenmerk weer
* vb : lengte : 0 cm is geen lengte
* ! geen negatieve waarden
3