statistiek
Deel 1: Univariate beschrijvende statistiek
theorie
basisconcepten
onderzoekspopulatie, statistische eenheid
★ (onderzoeks)elementen/(statistische eenheden (cases)
○ onderdelen v realiteit waarop onderzoek betrekking heeft
○ eenduidige definitie noodzakelijk
○ individuen, gebeurtenissen (verkeersongeval, …), collectiviteiten (landen, …)
★ (onderzoeks)populatie
○ verzameling v (onderzoeks)elementen: bij wie?
○ eenduidige definitie noodzakelijk (uitspraken beperkt tot populatie
○ vaak gebonden aan tijd en ruimte
★ analyse-eenheid
○ eenheid waarop analyse gebeurt
○ verwant met onderzoekselement
variabelen, waarden, dataset
★ kenmerk: eigenschap v elementen
★ variabele: kenmerk varieert over eenheden
★ uitkomstenverzameling: verzameling v alle mogelijke uitkomsten ve variabele
★ meten: volgens bepaalde meetprocedure vaststellen vd waarde ve kenmerk bij een
element
○ nauwkeurigheid: exactheid
○ betrouwbaarheid: consistentie bij herhaalde waarneming
○ validiteit: mate v overeenkomst tss indicator en (theorietisch) concept
(= afwezigheid v systematische fouten)
★ waarde: resultaat v meten
input voor statistische analyses
★ gegevensset, dataset, datamatrix
★ kolommen: variabelen (leeftijd, geslacht, …)
★ rijen: waarden en eenheden op de variabelen
★ variabelen hebben ander niveau v meten
meetniveau v variabelen: schaal v meten (hoeveelheid info v minst -> meest)
★ categorische/kwalitatieve variabelen
○ nominaal
■ exhoustieve (volledig) en exclusieve (niet)overlappend) classificatie
■ vb: geslacht, haarkleur, …
○ ordinaal
, ■ ordening mogelijk
■ vb: opleiding, medaille, …
★ metrische/kwantitatieve variabelen
○ interval
■ hoeveel meer/minder (je kan ermee rekenen)
■ geen nulpunt
■ vb: temperatuur in graden Clesius, geboortejaar
○ ratio
■ nulpunt
■ vb: leeftijd, buget
○ afhankelijk v meetprocedure en eventuele transformatie tss meting en
analyse
○ andere klassificatie: obv uitkomstenverzameling
■ continue variabelen: reële getallen
● vb: tijd, exacte leeftijd, inkomen
■ descrete variabelen: natuurlijke getallen
● vb: leeftijd in verstreken jaren, museumbezoek, # kinderen
doelstellingen beschrijvende statistiek voor 1 variabele
★ univariate statistiek: gegevens v 1 variabele op overzichtelijke en synthetische wijze
weergeven: verdelingen beschrijven
○ frequentietabellen
○ grafieken
○ maten v positie
○ maten v spreiding
★ wat kan, is afhankelijk v meetniveau + regel (wat kan op lager meetniveau kan ook
op hogere meetniveau, maar niet omgekeerd)
frequentieverdelingen
alsolute, relatieve en cumulatieve frequenties, klassenindeling
★ absolute frequentie: # elementen met een bepaalde waarde fi
★ relatieve frequentie: # elementen met een bepaalde waarde gedeeld door het aantal
elementen = proportie pi
★ m = # waarden
★ i = waarde
★ n = totaal # waarden
, frequentietabel
★ cumulatieve frequentie: # of proportie eenheden met waarde i of lager (vanaf
ordinaal meetniveau)
★ metrische variabelen: teveel verschillende waarden om overzichtelijk weer te geven
in een frequentietabel
★ formele voorschriften voor tabellen: noodzakelijke elementen
○ waarden/klassen exhaustief en exclusief (25-50 en 50-75 -> waar 50 bij?)
○ titel: kort en bondig inhoud aangeven
○ kolomkoppen, met exacte aanduiding inhoud
○ logische ordenig
○ totalen
○ bronvermelding
★ doelstelling: samenvatten v verdelingen
○ voor: beschrijving en vergelijking
○ samenvatten v
■ positie (centraliteit, ligging): zwaartepunt meer naar links/rechts
■ spreiding (variatie): hoe dicht/ver v elkaar
■ vorm (symmetrie, scheefheid)
grafische voorstellingen (grafieken)
★ taartdiagram
○ direct visueel duidelijk maar aantal waarden beperkt
○ ai = hoek voor waarde i
○ ai = pi x 360°
★ staafdiagram
○ L = lengte van nulpunt tot maximum in grafiek
○ Li = lengte van staaf voor waarde i
○ Li = pi x L
○ losse staafjes
○ meer waarden opnemen en mogelijkheid om verdeling op te splitsen naar
waarden op tweede variabele (bivariaat)
○ nulpunt op grafiek zetten !
★ histogram
○ enkel voor metrische variabelen, in klassen gegroepeerd
○ staafjes tegen elkaar