INHOUD
Inleiding ........................................................................................................................... 3
1. Empirisch wetenschappelijk onderzoek .......................................................................................... 3
1.1. Regels voor onderzoek ........................................................................................................ 3
1.2. Twee categorieën: exploratief en inferentieel onderzoek ....................................................... 3
1.3. Het begin van een onderzoek ................................................................................................... 3
1.4. Metingen van variabelen .......................................................................................................... 4
1.4.1. Kwalitatieve variabelen ..................................................................................................................... 4
1.4.2. Kwantitatieve variabelen .................................................................................................................. 4
Beschrijvende statistiek .................................................................................................... 5
1. Frequentietabel ............................................................................................................................... 5
2. Staafdiagram .................................................................................................................................... 6
3. Histogram......................................................................................................................................... 6
3.1 Classificeren ............................................................................................................................... 7
4. Frequentieverdeling versus kansverdeling ...................................................................................... 7
5. Tak-blad grafiek ............................................................................................................................... 8
6. Berekeningen ................................................................................................................................... 8
6.1. Centrummaten .......................................................................................................................... 8
6.1.1 Mediaan ............................................................................................................................................. 8
6.1.2 Modus................................................................................................................................................. 9
6.1.3 Gemiddelde ........................................................................................................................................ 9
6.2 Spreidingsmaten ........................................................................................................................ 9
6.2.1. Variatie/Standaarddeviatie ............................................................................................................... 9
6.2.2. Variatiecoëfficiënt/range ................................................................................................................ 10
6.2.3. Interkwartielafstand ........................................................................................................................ 10
7. Samenvatten en waarschuwingen ................................................................................................. 11
7.1. Populatie en steekproef .......................................................................................................... 11
8. Meetniveau van variabelen ........................................................................................................... 12
8.1 Centrummaten .................................................................................................................. 12
8.2 Correlatie of causaliteit? ................................................................................................... 12
8.3 Centrummaten en uitbijters .............................................................................................. 12
8.4 Scheefheid ......................................................................................................................... 13
8.5 Ongelijke klassenbreedte: frequentiedichtheid ................................................................ 13
9. Transformatie ................................................................................................................................ 14
1
, 10. Z-score.......................................................................................................................................... 15
Inferentiële statistiek ...................................................................................................... 15
1. Steekproefgemiddelden ................................................................................................................ 16
1.2 Reductio ad absurdom ............................................................................................................. 16
2. Soorten toetsen .......................................................................................................................... 16
2.1 Formeel kader .......................................................................................................................... 16
2.2 de z-test .................................................................................................................................... 17
2.3 De t-test.................................................................................................................................... 18
3. Opmerkingen bij statistische toetsen ............................................................................................ 19
4. Betrouwbaarheidsinterval ............................................................................................................. 19
5. Twee gemiddelden ........................................................................................................................ 20
5.1 Afhankelijke of gepaarde steekproeven .................................................................................. 20
5.2 Onafhankelijke of ongepaarde steekproeven .......................................................................... 21
5.3 Levene’s test ............................................................................................................................ 21
5.4 Verdelingsvrije/niet-parametrische toetsen ............................................................................ 22
5.4.1 Onafhankelijke groepen: Wilcoxon ransom toets ............................................................................ 23
5.4.2 Afhankelijke groepen: Wilcoxon rangteken toets ............................................................................ 23
6. Samenhang tussen variabelen ..................................................................................... 24
6.1 Een relatie kwantificeren ............................................................................................................. 24
6.1.1 Covariantie ............................................................................................................................ 24
6.1.1.1 Intuïtie ........................................................................................................................................... 25
6.1.1.2 Nadeel ........................................................................................................................................... 25
6.1.2 Pearson correlatiecoëfficiënt ................................................................................................ 25
6.1.2.1 Correlatie testen ................................................................................................................ 26
6.2 Lijn van lineaire relatie schatten .................................................................................................. 26
6.2.1 Lineaire regressie .................................................................................................................. 26
6.2.2 Kleinste-kwadrantenmethode .............................................................................................. 27
6.2.3 Bronnen van variantie ........................................................................................................... 27
6.2.3.1 De som van de kwadraten ............................................................................................................. 27
6.2.4 Uitvoer................................................................................................................................... 28
6.2.5 Gevaar van extrapolatie ........................................................................................................ 28
6.2.6 Hellingshoek en de sterkte van het verband ........................................................................ 28
2
,INLEIDING
1. EMPIRISCH WETENSCHAPPELIJK ONDERZOEK
= houdt zich bezig met de werkelijkheid (empirie) vd natuur, de mens en de maatschappij
• Natuurkunde, biologie, psychologie en economie zijn empirische wetenschappen
• Theologie, filosofie en literatuurwetenschap zijn niet-empirische wetenschappen
Kenmerkend is dat de theorie wordt getoetst aan de feiten/data → in de methodologie speelt de statistiek een
belangrijke rol
1.1. REGELS VOOR ONDERZOEK
• Objectiviteit: De onderzoeker moet integer zijn en hij moet alles doen om te vermijden dat zijn
vooroordelen/belangen de resultaten van het onderzoek vertekenen.
• Openbaarheid: De resultaten vh onderzoek moeten openbaar zijn, zodat anderen er kritisch op
kunnen reageren.
• Toetsbaarheid: De resultaten vh onderzoek moeten zo worden gepresenteerd dat anderen het
onderzoek kunnen controleren, eventueel door het te herhalen.
1.2. TWEE CATEGORIEËN: EXPLORATIEF EN INFERENTIEEL ONDERZOEK
Exploratief onderzoek (beschrijvende statistiek) Inferentieel onderzoek (Inferentiële statistiek)
heeft tot doel de werkelijkheid te verkennen om toetst of wetenschappelijke hypothesen en
daarin wetmatigheden te ontdekken. → Je wilt iets theorieën al of niet in overeenstemming zijn met de
leren, iets nieuws ontdekken. Niet om een bepaalde werkelijkheid. → Je wilt iets toetsen en controleren.
hypothese te toetsen, maar wel om bij te leren.
Centraal staat de vraag: Klopt mijn verklaring?
Deze methode is inductief.
Centraal staat de vraag: Wat is er aan de hand?
Exploratief en inferentieel onderzoek vullen elkaar aan: wetmatigheden die bij exploratief onderzoek worden
ontdekt, leiden tot een wetenschappelijke theorie en vervolgens tot hypothesen, die in interferentieel
onderzoek worden getoetst op hun houdbaarheid.
Bijvoorbeeld systematische registratie van bijwerkingen: Dergelijk onderzoek kan leiden tot hypothesen als de
derde generatie gebruiksters vd anticonceptiepil een groter risico heeft op trombose → die hypothesen moeten
dan getoetst worden in interferentieel onderzoek.
1.3. HET BEGIN VAN EEN ONDERZOEK
• Een goed onderzoek begint met een goede vraagstelling → Wat wil je bereiken? Waarom wil je
onderzoek doen?
• Dataverzameling: Gegevens; Feiten die verzameld worden om antwoord te kunnen geven op vragen
die gesteld worden. Data vormen de basis voor informatie. Twee belangrijke concepten die nodig zijn:
• Onderzoekseenheden: Wat wil je bestuderen? → personen, dieren, planten, patiënten, studenten,
ziekenhuizen, docenten, onderwijsgroepen,…
• Variabelen: Een kenmerk van de onderzoekseenheid → geslacht, gewicht, leeftijd (=
epidemiologische studie), bloeddruk, cholesterol, hemoglobine (= klinische studie), risicovol
gedrag, alcoholconsumptie (= verkeersongevallen)
• Meting van variabelen: een waarde/getal of code die is toegekend aan een variabele.
3
,1.4. METINGEN VAN VARIABELEN
Opgedeeld, want er zijn bepaalde
technieken niet geschikt voor bv
kwalitatieve variabelen.
Bijvoorbeeld: wat is het gemiddelde
van mannen en vrouwen? → kan
niet, gemiddelde = kwantitatief,
mannen & vrouwen = kwalitatief.
1.4.1. KWALITATIEVE VARIABELEN
Nominale variabele Ordinale variabele
= eenvoudigste variabele dat je kan hebben, bv: = nog steeds eenvoudig, maar er is meer structuur
tss variabelen, bv:
• Soort kanker: prostaat, long, darm,..
• Geslacht: man, vrouw • Sportprestatie: 1e, 2e, 3e ,.. plaats
• Afkomst: autochtoon, allochtoon • Sociaal eco. Status: laag, midden, hoog
Basically gewoon een eenzijdig label dat je • Opleiding: lager, middelbaar, universitair
kleeft, zonder bijkomende kwantitatieve Codes moeten structuur, opeenvolging vd data’s
structuur respecteren (lager < midden < hoog)
Je kan de variabelen wel coderen met eender Nog steeds zonder bijkomende kwantitatieve
welk getal, maar deze getallen zijn geen structuur (je kan bv niet gemiddelde van
kwantitatieve gegevens. opleiding berekenen)
1.4.2. KWANTITATIEVE VARIABELEN
Interval variabele Ratio variabele
• Temperatuur: Vandaag is de temperatuur = heeft absoluut nulpunt
in Leuven 20°C en in Ieper 10°C.
• Lengte: in cm of m ➔ 0 cm = 0 km = 0 dm =
• Is 20°C tweemaal zo warm als 10°C? 0 lichtjaren = ….
• Is 68°F tweemaal zo warm als 50°F? • Gewicht: in gram of kilogram
• Intelligentie: IQ scores → je kan niet zeggen • Bloeddruk: in mm HG
dat die van jou 2 x zo hoog is als die van Hierbij kan je het wél hebben over
iemand anders verhoudingen, bv: die tafel is 2x zo lang als de
Waarschuwing! Interval variabelen hebben geen andere ➔ 2m = 2 x 1m
absoluut nulpunt.
Bij interval variabele kan je niet over “2x zo
warm”, “de helft van”, “driemaal zo veel”,..
praten. Want dit klopt niet. Je kan interval
variabelen niet gebruiken voor verhoudingen.
Je kan wel praten over gemiddelde etc.
4
,BESCHRIJVENDE STATISTIEK
= de analyse begint vaak met de samenvatting en beschrijving van de data. De oorspronkelijke uitkomsten
worden samengevat, waardoor details verloren gaan, maar overzicht en inzicht worden gewonnen.
• Verzamelen, classificeren en presenteren van data
• Doel: inzicht verkrijgen, patronen ontdekken.
Tellen van uitkomsten:
• Frequentietabel: Nominaal, Ordinaal
• Staafdiagram: Nominaal, Ordinaal
• Histogram: Interval, Ratio
• Klassenindeling: Interval, Ratio
• Tak-blad-grafiek: Interval, Ratio
1. FREQUENTIETABEL
Frequentieverdeling = De verzameling van alle uitkomsten in een onderzoek en de met die uitkomsten
geassocieerde frequenties wordt frequentieverdeling genoemd. Een frequentieverdeling kan in een
frequentietabel of in een grafiek, bv histogram of staafdiagram, worden weergegeven.
Centrummaten =
De belangrijkste karakteristieken ve frequentieverdeling zijn centrum en spreiding.
- Het centrum geeft aan rond welke centrale waarde de uitkomsten liggen (ongv het
gemiddelde/modus/mediaan → hangt van situatie af)
- De spreiding geeft aan hoe ver de uitkomsten uiteen liggen
Voor deze karakteristieken van centrum en spreiding bestaan diverse kerngetallen → centrummaten en
spreidingsmaten
Bv: Als je in een publiek een enorm rijke man hebt, zal het gemiddelde hoger liggen, maar hierdoor is de
spreiding ook hoger want de rijke man maakt het gemiddelde hoger door zijn bedrag.
Scores = de verschillende waarden
Frequenties = aantal onderzoekseenheden met dezelfde
waarde
Percentages = bv één onderzoekseenheid is 2,27%, 5
onderzoekseenheiden zijn 11,36%
Cumulatieve percentages = bv 15,91% vd
onderzoekseenheden zijn jonger dan 48, 50% vd OE zijn
jonger & ouder dan 54 → = het centrum, de mediaan
5
, 2. STAAFDIAGRAM
= vat de uitkomsten op een variabele grafisch samen
Op de horizontale as staan de waarden van de variabele, de hoogte vd staaf komt overeen met de frequentie
of proportie (percentage) van de bijbehorende waarde. Om aan te geven dat er tss twee discrete waarden
geen andere waarden mogelijk zijn, raken de staven elkaar niet.
Wanneer is het geschikt? → voor discrete (kwalitatieve) variabelen met een beperkt aantal verschillende
waarden. Als het aantal staven te groot wordt, neemt de overzichtelijkheid en daarmee de informatieve
waarde af. De staven staan niet in een dwingende volgorde → staafdiagram is dus ook bruikbaar voor
uitkomsten op nominaal meetniveau.
• Makkelijker om iets te visualiseren, maar minder
informatie mogelijk dan in frequentietabel.
• Staven raken elkaar niet aan, want er is geen
waarde mogelijk tussen de opgegeven leeftijden.
3. HISTOGRAM
= als er veel verschillende uitkomsten zijn, is het overzichtelijker de uitkomsten in klassen onder te brengen en
de frequenties voor ieder vd klassen te bepalen.
• Als we bv praten over gewicht met 3 getallen na de komma van 100 mensen, zal de frequentie zo
goed als altijd 1 zijn, aangezien de waardes zo precies zijn. ➔ categorieën, klassen van gewicht
creëren, zodat het overzichtelijk wordt.
Een histogram vat de uitkomsten van een continue variabele samen.
• De uitkomsten worden door classificeren in intervallen van gelijke klassenbreedte ingedeeld. In
het histogram staan op de horizontale as de klassen. Boven iedere klasse wordt een kolom
getekend. De hoogte van de kolom komt overeen met de frequentie of proportie (percentage) vd
uitkomsten in die klasse. Om aan te geven dat de variabele continu is, grenzen de kolommen aan
elkaar.
6