Statistiek I: statistisch gezien
Inhoudstafel
Inhoud
Table of Contents
Statistiek I: statistisch gezien..................................................................................................................1
Inhoudstafel...........................................................................................................................................1
Inhoud....................................................................................................................................................1
Hoofdstuk 1 Inleiding: over statistiek, statistieken en mathemafobia................................................3
statistiek is …..................................................................................................................................3
Hoofdstuk 2 data statistisch onder de loep genomen........................................................................4
Datamatrix......................................................................................................................................4
onderzoekselementen....................................................................................................................4
variabelen.......................................................................................................................................5
Meetwaarden.................................................................................................................................6
Sommatieteken..............................................................................................................................6
Dubbel sommatieteken..................................................................................................................7
Hoofdstuk 3: visuele inspectie van verdelingen op basis van ruwe data............................................7
Rangorde kengetallen.....................................................................................................................7
Grafieken kwalitatieve variabelen..................................................................................................8
Stam-bladdiagram : diepte.............................................................................................................9
Kwartielen vs scharnierwaarden.....................................................................................................9
Centrale tendentie........................................................................................................................10
Spreiding.......................................................................................................................................11
Vorm.............................................................................................................................................11
overzicht kengetallen...................................................................................................................12
Uitschieters...................................................................................................................................13
Hoofdstuk 4: eerste analyseniveau, centrale tendentie...................................................................13
Rekenkundig gemiddelde.............................................................................................................13
Specifiek gemiddelde....................................................................................................................15
Logaritmen...................................................................................................................................17
Overzicht gemiddelden.................................................................................................................18
Hoofdstuk 5: tweede analyseniveau, spreiding................................................................................18
Standaardafwijking (.....................................................................................................................19
Variantie ).....................................................................................................................................19
Interkwartiele spreidingscoëfficiënt:............................................................................................22
Kengetallen...................................................................................................................................23
1
, Spreiding kwalitatieve variabelen.................................................................................................23
Informatietheorie.........................................................................................................................25
entropie H.....................................................................................................................................26
Hoofdstuk 6: derde en vierde analyseniveau, vorm van verdeling...................................................27
Van spreiding naar scheefheid......................................................................................................28
Scheefheidscoefficient van Pearson.............................................................................................28
Scheefheidscoefficient van Yule...................................................................................................29
Merkwaardig product...................................................................................................................29
Scheefheidsmaat van Gamma......................................................................................................30
scheefheidsmaat : rekenwerk.......................................................................................................32
Gepiektheid of kurtosis.................................................................................................................34
Scheefheidsmaat..........................................................................................................................34
Gepiektheidsmaat : rekenwerk.....................................................................................................35
Totaaloverzicht kengetallen..........................................................................................................36
Hoofdstuk 7: werken met geclassificeerde data...............................................................................36
Geclassificeerde frequentietabel..................................................................................................36
Kengetallen voor een geclassificeerde frequentietabel................................................................39
Hoofdstuk 8: basisbegrippen kansberekening..................................................................................41
Regel voorwaardelijke kans..........................................................................................................42
Regel totale kans..........................................................................................................................42
Regel van Bayes............................................................................................................................43
Overzicht nieuwe kansregels:.......................................................................................................43
Hoofdstuk 9: Valt te bezien of wordt verwacht................................................................................43
Stochast........................................................................................................................................43
Hoofdstuk 10: binomiale verdeling...................................................................................................46
De verjaardag paradox..................................................................................................................46
De binomiale coëfficiënt...............................................................................................................46
De binomiale verdeling.................................................................................................................47
Hypergeometrische verdeling.......................................................................................................49
Verwachte waarde en variantie....................................................................................................49
hoofdstuk 11: De normale verdeling................................................................................................49
Introductie....................................................................................................................................50
Eigenschappen van de normale verdeling....................................................................................50
de normale dichtheidsfunctie.......................................................................................................51
Standaardnormale verdeling........................................................................................................51
Normaliteitstoetsing.....................................................................................................................54
Continuïteitscorrectie...................................................................................................................55
H12: normale verdeling van binomiale verdeling.............................................................................57
Rodedraadprobleem.....................................................................................................................57
CLS................................................................................................................................................57
2
, Vereiste n.....................................................................................................................................58
Effect van p...................................................................................................................................58
Normale benadering van de binomiale verdeling.........................................................................58
Rodedraadprobleem: verdere uitwerking....................................................................................58
H13: Schatten...................................................................................................................................59
Puntschatting voor p.....................................................................................................................62
Een zuivere puntschatting............................................................................................................62
Een efficiënte puntschatting.........................................................................................................62
Intervalschatting voor p................................................................................................................63
Steekproefgrootte bepalen in functie van foutmarge..................................................................66
Eindigheidscorrectie.....................................................................................................................66
Steekproefverdeling van...............................................................................................................67
Hoofdstuk 14: Hypothesetoetsing....................................................................................................73
Hoofdstuk 1 Inleiding: over statistiek, statistieken en mathemafobia
statistiek is …
Hoe verwerk je de leerstof?
Stap 1: theorie begrijpen en eenvoudige oefeningen
Stap 2: leerstof inoefenen tijdens werkcolleges
Stap 3: theorie studeren en extra oefeningen maken
Beschrijvende statistiek: beschrijven van steekproef/populatiegegevens m.b.v. tabellen, grafieken en
kengetallen (deel 1)
Inferentiële statistiek: o.b.v. steekproefgegevens uitspraken doen over de populatie (deel 2)
begrippen
Statistiek = de wetenschap van het verzamelen, organiseren, presenteren, analyseren en
interpreteren van gegevens of data volgens een numerieke logica.
Populatie N = de grep wrover het onderzoek een uitspraak wil doen (bv. Amerikaanse mannen)
Steekproef n = een selectie uit de totale populatie, wrop je het onderzoek uitvoert. (bv. Het
daadwerkelijke aantal Amerikaanse mannen die je hebt ondervraagd)
Problemen bij dataverzameling:
3
, Problemen bij de presentatie van data:
Misleidende grafieken
Populatie v gemiddelde is risky, gevoelig vr uitschieters
Hoofdstuk 2 data statistisch onder de loep genomen
Datamatrix
- Onderzoekselement
- Variabelen
- Meetwaarden
Enkelvoudig sommatieteken
Dubbel sommatieteken
Rangorde kengetallen
Datamatrix
Kolommen
Variabelen: kenmerken van
de onderzoekselementen
Rijen
Meetwaarden of observaties: waarde van een onderzoekselement op een variabele
Onderzoekselementen of cases: Datgene waar we iets over willen zeggen
onderzoekselementen
Aggregatieniveaus
- Micro: individuen (burgers, studenten, tieners)
- Meso: organisaties, beroepsgroepen, scholen
- Macro: gemeenten, landen, provincies
4
, Ecologische meetfout: op basis van gegevens op macro (/meso) niveau uitspraken doen over
het micro-niveau (Simpson paradox)
variabelen
Meten van variabelen
Conceptualisering: wat wil je meten?
Indicering: hoe het theoretisch concept empirisch meten? – validiteit: meet je wat je wil
meten?
Operationalisering: hoe ga je het registreren?
o Belang v antwoordschalen
o Betrouwbaarheid: leveren verschillende metingen hetzelfde resultaat op?
(interpersoonlijk: meerdere indicatoren of intertemporeel: op verschillende momenten)
Kwalitatieve/ categorische meetniveaus
Ordinaal: linkert-schaal (eens-oneens), onderwijsniveau, aantal sterren hotel
Vb: resultaat wedstrijd (winnen-gelijk-verliezen)
Nominaal: geslacht, politieke partijvoorkeur, haarkleur, regio
Vb: soorten olympische diciplines
Kwantitatieve meetniveaus
Ratio: afstand, leeftijd, aantallen, inkomen
Vb: leeftijd eendagsvlieg, aantal politieke partijen
Interval: jaartelling, IQ, temperatuur (Celsius, Fahrenheit)
Kwantitatieve variabelen (interval/ratio) kunnen discreet of continue zijn
Discreet = variabele kan een beperkt aantal waarden aannemen
Vb: gezinsomvang, leeftijd gemeten in hele jaren, aantal radio zenders, resultaat wedstrijd,
soorten olympische disciplines
Continue = variabele kan een oneindig aantal waarden aannemen
5
, Vb: leeftijd eendagsvlieg, inkomen in euro, km, lengte
Belang van meetniveaus:
Meetniveaus bepalen analysemogelijkheden
Downscaling kan nuttig zijn
Upscaling nooit toegelaten, buiten deze twee uitzonderingen
o Dichotome variabelen (2 variabalen)
o Dummymethode (provincies)
Univariate analyse = analyse van één variabele
Bivariate/multivariate analyse = analyse van een relatie/vergelijking tussen twee (bivariaat)
of meer dan twee variabelen
Meetwaarden
Zie datamatrix p3
Onafhankelijke variabele = oorzaak (antecedent), variabele die invloed uitoefent op de afhankelijke
Afhankelijke variabele = gevolg, effect, variabele die de invloed ondergaat
Sommatieteken
Manier om lange som kort te schrijven
Symbool Σ
n
∑i (i: startwaarde, n: eindwaarde van i)
i=1
Reikwijdte of bereik =
n
∑ a
i = 1
¿
( n− b )
+ ¿ ¿ 1
¿ :
b
¿
g
e
t
a
l
w
a
a
r
d
e
¿ a
c
h
t
e
r
¿ i
Rekenregels
n
∑ 2 x i
Cte waarde wet je vóór het sommatieteken:
i=1
¿
2
n
∑ x i
i=1
n
∑ 2
Werkloze sommatietekens vervang je door het bereik :
i =1
¿
2
n
∑ ¿ 2 n
i=1
Sommatie van een som/verschil = som/verschil van 2 enkelvoudige sommaties
n n n
∑ ( xi±y i )=∑ x i±∑ y i
i=1 i=1 i=1
6