Statistiek
Hoofdstuk 0: inleiding
Statistiek :
Verzamelen en bestuderen van numerieke gegevens om vervolgens conclusies te trekken uit
deze data.
Opsporen van verbanden/samenhang tussen variabelen.
Nagaan of veranderingen in een onafhankelijke variabele ook veranderingen in de
afhankelijke variabele veroorzaken.
Een kritische evaluatie van cijfers is nodig!
Representatieve steekproef is noodzakelijk!
Tips voor een kritische evaluatie van de cijfers:
Identificeer doel en populatie van het onderzoek
Ga na wie de bron is
Analyseer de steekproefmethode
Controleer de gebruikte variabelen
Ga na of de grafieken de gegevens eerlijk weergeven zodat conclusies gerechtvaardigd zijn
Controleer of de conclusies beantwoorden aan het doel van de studie, zijn ze betekenisvol en
zijn ze bruikbaar/relevant
Hoofdstuk 1: inleidende begrippen
1. Vaste begrippen
Populatie = de verzameling van alle relevante elementen (mensen, gezinnen, producten, kiezers,
aandelen, …) waarop het statistisch onderzoek betrekking heeft en waarover (kwantitatieve)
uitspraken worden gedaan
Steekproef = een gedeelte (een trekking) van de populatie = representatieve deelverzameling van de
populatie
Element = de objecten of personen in de populatie die worden gebruikt.
Variabele = grootheid waarvan de waarde tijdens een experiment of bij een enquête kan worden
vastgesteld. Het kenmerk dat men bestudeert.
Numerieke variabelen = kwantitatief
o Kunnen geteld of gemeten worden.
o Voorbeelden: lengte, gewicht
Discrete variabele = de gegevens zijn het resultaat van een telling.
Vb. het aantal kinderen in een gezin
Continue variabele = de gegevens zijn het resultaat van een meting
Vb. De lichaamslengte van een volwassen persoon
De gemiddelde dagtemperatuur
De levensduur van een gloeilamp
Het nettogewicht van een doos waspoeder
Vaak discontinu in theorie, maar continu behandeld of
gerapporteerd !!!
1
, Bv. Hoeveel kinderen heeft 1 gezin = discreet of discontinu, maar in
gemiddelden –over alle gezinnen heen- spreekt men over 1,6 kind (= continu)
Categorische ( of niet-numeriek) variabelen = kwalitatief
o Worden op een niet-numerieke wijze uitgedrukt.
Vb. kleur ogen, aard van de klacht, geslacht, provincie, …
o De waarden die deze variabelen kunnen aannemen, kunnen beschouwd worden als
"labels" die een naam geven aan een bepaalde categorie objecten uit de populatie.
Vb. X = de kleur van een wagen
X = merknaam van de soort koffie die je gewoonlijk aankoopt
X = geslacht van een persoon
2. Onafhankelijke (X) en afhankelijke variabele (Y)
X op Y
Oorzaak – gevolg
o Bv. Is Geslacht (X) van belang op gamen (Y)?
Provincie (X) op oordeel over nmbs (Y) ?
Lengte (X) van belang op gewicht (Y) ?
Aantal suikers/snoep per dag (X) op aandachtsspan(Y) ?
Geslacht en provincie en koffie (X) op productiviteit(Y) ?
3. Meetniveaus van data
Nominaal = identiteit (= of ≠)
o bv kleur auto, geslacht, nationaliteit,
lievelingsgerecht
→ Kenmerk wordt gecodeerd
Bv. Welke kleur heeft uw wagen ?
1 grijs
2 blauw
3 rood
4 zwart
Ordinaal = rangorde (> < = ≠)
o Het antwoord is nog steeds een woord maar er zit een zekere rangorde in
Bv. Hoe tevreden was je van je reis? Hoeveel keer per maand ga je naar supermarkt?
→ ranggetallen & rangkenmerken
Hoe vaak woon je een eucharistieviering bij ?
1 dagelijks
2 wekelijks (of meermaals per week, maar niet dagelijks)
3 maandelijks (of meermaals per maand, maar niet wekelijks)
4 enkel bij speciale gelegenheden (uitvaart, doopsel,..) en/of kerkelijke
feesten(Kerstmis)
5 nooit
Interval = vaste meeteenheid (verschil tussen 5 en 4 is even groot als tussen 3 en 2)
o Een getal maar je kan er nog niet mee rekenen (wel + & -)
Bv. jaartal, IQ, °C
Een 5 of 6 puntenschaal: intervallen tussen de scores en binnen de scores zijn even
groot 1 2 3 4 5
Ratio = vast nulpunt (4 is 2x groter dan 2)
o En je kan er op vermenigvuldigen en met delen.
Bv. inkomen, lengte, resultaat op een test
2
, 4. Beschrijvende-vergelijkende-verklarende statistiek
Beschrijvende
o Ordenen, bewerken, samenvatten en voorstellen van verzamelde gegevens
Tabellen en grafieken
Kengetallen: o.a. gemiddelde, mediaan, range …
o Eerste analyse
o De gegevens worden dus letterlijk "beschreven" a.d.h.v. een beperkt aantal
typerende parameters.
Vergelijkende & verklarende
o Uitspraken over een heel grote groep gegevens (de populatie) gebaseerd op
meetresultaten van een relatief klein deel gegevens (staal - steekproef) uit deze
grote groep.
o De steekproef moet representatief (betrouwbaar) zijn voor de populatie!
o Keuze van de steekproef is zeer belangrijk!
o Voldoende aantal gegevens is nodig!
5. Werken met Excel
Statistische functies
Matrix functies
Gegevenanalyses functies
Grafieken (taart, kolom, lijn, staat, scatter = spreidingsdiagram met trendlijn)
6. Tips voor het examen
Theorievragen:
Wat is een populatie – steekproef (zelf een definitie geven en/of herkennen uit een case)
Wat is een numerieke variabele (of kwantitatieve) (zelf een definitie geven en/of herkennen)
Wat is een discrete variabele – wat een continue (zelf een definitie geven en/of herkennen)
Wat is een kwalitatieve – kwantitatieve variabele (provincie = … lengte = ...) (zelf een definitie
geven en/of herkennen)
De meetniveaus kennen (zelf een definitie geven en/of herkennen)
3