Eline Opsommer 1e jaar Toegepaste ICT-Apps & Gamification
Statistiek
1 Frequentieverdelingen en hun grafische voorstelling (pg 1)
1.1 Inleiding (pg 1)
1.1.1 Wat is statistiek? (pg 1)
- Gegevens verzamelen, verwerken & interpreteren
- Verzamelende statistiek: Gegevens verzamelen -> tabel & grafiek
- Beschrijvende statistiek: Analyse van gegevens
- Verklarende (of wiskundige) statistiek: Op basis van parameters conclusies trekken voor de volledige
populatie
1.1.2 Populatie en steekproef (pg 2)
- Populatie = groep van personen of objecten
- Steekproef = aantal elementen kiezen uit een populatie
- Vb. bepaling kijkcijfers:
o Populatie: 2 5000 000 Vlaamse TV-abonnees
o Steekproef: paar honderd abonnees
1.1.3 Representativiteit van een steekproef (pg 3)
- = elk element van de populatie moet dezelfde kans hebben om geselecteerd te worden voor de
steekproef
- Aselect of willekeurig kiezen
- Standaardprocedures:
o Selectie met randomgetallen: iedereen krijgt nummer & selectie op basis van toevallig gekozen
getallen
o Gestratifieerde steekproef: populatie op voorhand in groepen verdelen
Populatie indelen in deelgroepen/strata/subpopulaties & uit elk stratum wordt steekproef
genomen
Er gaat pilootstudie aan vooraf (populatie bestuderen)
o Getrapte steekproef: subpopulaties worden ingedeeld in groepen (vb. West-Vlaamse vrouwen in
35) en die groepen worden nog eens in deelpopulaties gedeeld & uit die deelpopulaties wordt
dan aselecte proef genomen
Gevaar: je maakt jezelf te gemakkelijk, je kent niet voldoende over populatie -> foute
beslissingen
o Systematische steekproef: iedere keer met bepaald interval wordt iemand gekozen (vb. om de 10
min koekjes wegen)
- Gevaar: non-respons bij schriftelijke enquête -> altijd bepaald soort mensen gaan antwoorden -> niet
representatief
1.2 Statistische verbanden (pg 5)
1.2.1 Soorten variabelen en hun meetniveau (pg 5)
- Statistische variabele = wat je onderzoekt (mensen met bruin haar bij 18jarigen)
- Variabelen met hoofdletters noteren (X, Y, Z)
- Waarden voor die variabelen (X1, X2, ..)
1.2.1.1 Kwantitatieve of numerieke variabelen (pg 5)
- = kunnen geteld of gemeten worden
- Discrete variabele = resultaat van telling (vb. schoenmaat)
o Aantal defecte stukken in dagproductie
o Aantal kinderen in gezin
o Aantal verkeersdoden in weekend
- Continue variabele = resultaat van meting -> genoteerd als afgerond decimaal getal
o Lichaamslengte van volwassen persoon
o Gemiddelde dagtemperatuur
o Levensduur gloeilamp
Wordt gemeten op 2 niveaus:
o Rationiveau: er moet nulpunt zijn & er zijn gelijke verschillen in schaalverdeling -> verhouding
blijft gelijk
o Intervalniveau: geen natuurlijk nulpunt & geen ratio kunnen geven -> geen verhoudingen
(niet belangrijk) vb. temperatuur
1
,Eline Opsommer 1e jaar Toegepaste ICT-Apps & Gamification
1.2.1.2 Kwalitatieve of niet-numerieke variabelen (pg 8)
- Gaat over kwalitatieve eigenschap & niet over teleigenschap (vb. kleur auto’s)
- Ordinaal niveau = op een natuurlijk & logische manier ordenen
o Logische volgorde in (hoe voel je op school 1 = slecht .. 5 = zeer goed)
o Geen verhoudingen
- Nominaal niveau = geen logische volgorde (vb. geslacht, kleur, afkomstig van welk land)
1.2.1.3 Samenvatting
1.2.2 Het sommatieteken (pg 10)
- i = sommatie-index
- sommatieteken is lineair = sommatie van een lineaire combinatie van termen kan geschreven worden als
lineaire combinatie van sommaties
o
o Bewijs:
1.3 Discrete frequentieverdelingen (pg 11)
1.3.1 Discrete frequentietabel (pg 11)
- Als ze niet teveel verschillende waarden hebben -> plaatsen volgens grootte
- fi = absolute frequentie = hoeveel keer een bepaalde waarde voorkomt
- som van fi = n
- cfi = absolute cumulatieve frequentie = totale frequentie van alle X-waarden kleiner of gelijk aan een
gegeven waarde
X fi cfi hi chi
0 2 2 0,016 0,016
1 7 9 0,056 0,072
2 16 25 0,128 0,200
3 21 46 0,168 0,368
4 25 71 0,200 0,568
5 20 91 0,160 0,728
6 14 105 0,112 0,840
7 7 112 0,056 0,896
8 5 117 0,040 0,936
2
, Eline Opsommer 1e jaar Toegepaste ICT-Apps & Gamification
9 4 121 0,032 0,968
10 3 124 0,020 0,992
11 1 125 0,008 1,000
1.3.2 Grafische voorstelling: het staafdiagramma (pg 13)
- Goed geschikt voor grafische voorstelling van kwalitatieve variabelen
1.4 Continue frequentieverdelingen (pg 14)
1.4.1 Continue frequentietabel (pg 14)
- Ordenen:
o Eerst nagaan hoe groot variatiebreedte is = verschil tussen grootste & kleinste waarnemingsgetal -
> rekening houden met afrondingsfouten
o Intervalbreedte oneven kiezen
o Intervalmidden/klassenmidden = midden tussen beginwaarde en eindwaarde van interval
o Kies startwaarde van juiste interval
- Vb. gemiddeld aantal uur TV-kijken per week bij 120 studerende jongeren tussen 18 & 20 jaar
o Xmin = 2 & Xmax = 30 -> variatiebreedte: 30,5 – 1,5 = 29
o Intervalbreedte kiezen: 3 -> start 1e interval bij 0,5
o Je kan ook anders voorstellen, maar belangrijk dat ondubbelzinnig voorgesteld wordt
- Open intervallen: aan uiteinden worden de onder- en bovengrenzen niet echt vermeld -> uiterste waarden
worden toch weinig gescoord
Levensduur X frequentie
(in uren)
< 2700 3
[2700 , 2900[ 5
[2900 , 3100[ 8
[3100 , 3300[ 13
[3300 , 3500[ 6
[3500 , 3700[ 4
≥ 3700 1
o Hebben geen variatiebreedte & midden
1.4.2 Grafische voorstelling: histogram en frequentiepolygoon (pg 17)
- Meest gebruikt voor continue frequentieverdeling
- Histogram is zelfde als staafdiagram, maar op horizontale as staan intervalgrenzen ipv verschillende
waarnemingsgetallen & staan vlak bij elkaar
3