Universiteit Antwerpen (UA)
Beschrijvende Statistiek en
Kansrekenen
1ste bachelor
Academiejaar 2021-2022
,Inhoudstafel
Hoofdstuk 1: Wat is statistiek? (Les van 14/2/2022) .............................................................................. 5
1.1 Waarom statistiek? ................................................................................................................. 5
1.2 Definitie van statistiek ................................................................................................................... 5
1.3 Voorbeelden .................................................................................................................................. 5
1.4 Onderwerp van de statistiek ......................................................................................................... 5
1.5 Kansrekening ................................................................................................................................. 5
1.6 Software ........................................................................................................................................ 6
Hoofdstuk 2: Data en hun voorstelling (Les van 14/2/2022) .................................................................. 7
2.1 Soorten gegevens en meetschalen ............................................................................................... 7
2.1.1 Categorische of kwalitatieve variabelen ................................................................................ 7
2.1.2 Kwantitatieve variabelen........................................................................................................ 7
2.1.3 Hiërarchie van meetschalen ................................................................................................... 8
2.1.4 Meetschalen in JMP ............................................................................................................... 9
2.2 De datamatrix ................................................................................................................................ 9
2.3 Voorstellen van univariate kwalitatieve variabelen ...................................................................... 9
2.4 Voorstellen van univariate kwantitatieve variabelen ................................................................. 10
2.4.1 Stam-en bladdiagram ........................................................................................................... 10
2.4.2 Naalddiagram voor univariate discrete kwantitatieve variabelen ....................................... 10
2.4.3 Histogrammen en frequentiepolygonen voor continue variabelen .................................... 11
2.4.4 Empirische cumulatieve verdelingsfuncties ......................................................................... 11
2.5 Het voorstellen van bivariate variabelen .................................................................................... 12
2.5.1 Kwalitatieve variabelen ........................................................................................................ 12
2.5.2 Kwantitatieve variabelen...................................................................................................... 12
2.6 Het voorstellen van tijdreeksen .................................................................................................. 13
2.7 Het gebruik van kaarten .............................................................................................................. 13
2.8 Nog meer grafische mogelijkheden............................................................................................. 13
Hoofdstuk 3: Beschrijvende statistieken van steekproefgegevens (Les van 21/2/2022) ..................... 14
3.1 Kengetallen van centrale ligging of locatie.................................................................................. 14
3.1.1 Mediaan................................................................................................................................ 15
3.1.2 Modus ................................................................................................................................... 15
3.1.3 Rekenkundig gemiddelde ..................................................................................................... 16
3.1.4 Meetkundig of geometrisch gemiddelde ............................................................................. 17
3.2 Maatstaven van relatieve ligging................................................................................................. 17
1
, 3.2.1 Ordestatistiek, kwantiel, percentiel, deciel .......................................................................... 17
3.2.2 Kwartiel................................................................................................................................. 18
3.3 Kengetallen van spreiding ........................................................................................................... 18
3.3.1 Spreidingsbreedte ................................................................................................................ 18
3.3.2 Interkwartielbreedte ............................................................................................................ 18
3.3.3 Gemiddelde absolute afwijking ............................................................................................ 19
3.3.4 Variantie ............................................................................................................................... 19
3.3.5 Standaarddeviatie ................................................................................................................ 21
3.3.6 Variatiecoëfficiënt ................................................................................................................ 22
3.3.7 Spreidingsindices voor nominale en ordinale variabelen .................................................... 22
3.4 Kengetallen van scheefheid......................................................................................................... 24
3.5 Gepiektheid of kurtosis ............................................................................................................... 25
3.6 Transformatie en standaardisatie van gegevens ........................................................................ 25
3.7 Boxplot ........................................................................................................................................ 25
3.8 Bivariate variabelen ..................................................................................................................... 26
3.8.1 Covariantie ........................................................................................................................... 26
3.8.2 Correlatie .............................................................................................................................. 27
3.8.3 Rangcorrelatie ...................................................................................................................... 27
3.9 Complementariteit van kengetallen en grafische voorstellingen ............................................... 28
3.10 Beschrijvende statistiek met behulp van JMP ........................................................................... 28
Hoofdstuk 4: Kansrekenen .................................................................................................................... 29
4.1 Kansexperimenten....................................................................................................................... 29
4.2 Definitie van kans ........................................................................................................................ 30
4.4 Voorwaardelijke kans .................................................................................................................. 31
4.5 Onafhankelijke en afhankelijke gebeurtenissen ......................................................................... 32
4.6 Totale kans en de regel van Bayes .............................................................................................. 33
4.7 Het simuleren van kansexperimenten ........................................................................................ 34
Hoofdstuk 5: Bijkomende aspecten van kansrekening ......................................................................... 35
Hoofdstuk 6: Univariate kansvariabelen ............................................................................................... 36
6.1 Kansvariabelen en verdelingsfuncties ......................................................................................... 36
6.2 Discrete kansvariabelen en kansverdelingen .............................................................................. 36
6.3 Continue kansvariabelen en kansdichtheden ............................................................................. 38
6.4 Functies van kansvariabelen ....................................................................................................... 40
6.4.1 Functies van een discrete kansvariabele .............................................................................. 41
6.4.2 Functies van een continue kansvariabele ............................................................................ 41
6.5 Families van kansverdelingen en kansdichtheden ...................................................................... 41
2
, 6.6 Simulatie van kansvariabelen ...................................................................................................... 42
Hoofdstuk 7: Kengetallen van populaties en processen ....................................................................... 43
7.1 Verwachte waarde van een kansvariabele.................................................................................. 43
7.2 Verwachte waarde van een functie van een kansvariabele ........................................................ 43
7.3 Speciale gevallen ......................................................................................................................... 44
7.4 Variantie en standaarddeviatie van een kansvariabele .............................................................. 44
7.5 Andere kengetallen ..................................................................................................................... 46
7.6 Momentgenererende functie ...................................................................................................... 48
Hoofdstuk 8: Belangrijke discrete kansverdelingen .............................................................................. 50
8.1 De uniforme verdeling................................................................................................................. 50
8.2 De Bernoulli-verdeling ................................................................................................................. 51
8.3 De binomiale verdeling................................................................................................................ 52
8.3.1 Kansverdeling ....................................................................................................................... 52
8.3.2 Verwachte waarde en variantie ........................................................................................... 54
8.4 De hypergeometrische verdeling ................................................................................................ 55
8.5 De Poisson-verdeling ................................................................................................................... 56
8.6 De geometrische verdeling.......................................................................................................... 58
8.7 De negatief binomiale verdeling ................................................................................................. 58
8.8 Kansen en kansverdelingen in JMP ............................................................................................. 59
8.9 het simuleren van discrete kansvariabelen met JMP .................................................................. 59
Hoofdstuk 9: Belangrijke continue kansdichtheden (les van 28/03/2022) ........................................... 60
9.1 De continue uniforme dichtheid ................................................................................................. 60
9.2 De exponentiële dichtheid .......................................................................................................... 62
9.2.1 Definitie en kengetallen ....................................................................................................... 62
9.2.2 Enkele interessante eigenschappen ..................................................................................... 64
9.3 De gamma dichtheid ................................................................................................................... 67
9.4 De Weibull-dichtheid ................................................................................................................... 68
9.5 De Beta-dichtheid .................................................................................................................... 69
9.6 Andere dichtheden .................................................................................................................. 70
9.7 Grafische voorstellingen JMP .................................................................................................. 70
9.8 Het stimuleren van continue kansvariabelen JMP .................................................................. 70
Hoofdstuk 10: De normale verdeling .................................................................................................... 71
10.1 De dichtheid .............................................................................................................................. 71
10.2 Berekening van kansen voor normaal verdeelde variabelen .................................................... 75
10.2.1 Standaardnormaal verdeelde variabelen ........................................................................... 75
10.2.2 Normaal verdeelde variabelen ........................................................................................... 75
3
, 10.2.3 JMP ..................................................................................................................................... 76
10.2.4 Voorbeelden ....................................................................................................................... 76
10.3 Lognormale kansdichtheid ........................................................................................................ 77
Hoofdstuk 11: Multivariate kansvariabelen (les van 2/05/2022) ......................................................... 80
11.1 Inleidende begrippen ................................................................................................................ 80
11.2 Gezamenlijke (discrete) kansverdeling ..................................................................................... 81
11.3 Marginale of onvoorwaardelijke (discrete) kansverdeling........................................................ 81
11.4 Voorwaardelijke (discrete) kansverdeling ................................................................................. 83
11.6 De multinomiale kansverdeling ................................................................................................. 84
Hoofdstuk 12 : Functies van meerdere kansvariabelen (les van 2/05/2022) ....................................... 85
12.1 Een functie van meerdere kansvariabelen ................................................................................ 85
12.2 Verwachte waarde van functies van meerdere kansvariabelen ............................................... 85
12.3 Voorwaardelijke verwachte waarden ....................................................................................... 88
12.4 Kansverdeling van functies van kansvariabelen ........................................................................ 89
12.4.1 Discrete kansvariabelen ..................................................................................................... 89
12.5 Functies van onafhankelijke Poisson, normaal en lognormaal verdeelde kansvariabelen ....... 89
Hoofdstuk 13: Covariantie, correlatie en variantie van lineaire functies (les van 9/05/2022) ............. 91
13.1 Covariantie en correlatie ........................................................................................................... 91
13.2 Variantie van een lineaire functie van twee kansvariabelen .................................................... 94
13.3 Variantie van een lineaire functie van meer dan twee kansvariabelen .................................... 95
13.4 Variantie van een lineaire combinatie van onafhankelijke kansvariabelen .............................. 96
13.5 Lineaire combinatie van normaal verdeelde kansvariabelen ................................................... 96
13.6 Bivariate en multivariate normale kansdichtheid ..................................................................... 97
Hoofdstuk 14: De centrale limietstelling ............................................................................................. 102
14.1 Kansdichtheid van het steekproefgemiddelde uit een normaal verdeelde populatie ........... 102
14.2 Kansverdeling of -dichtheid van het steekproefgemiddelde uit een niet-normaal verdeelde
populatie ......................................................................................................................................... 103
14.3 Toepassing ............................................................................................................................... 105
14.4 Normale benadering van de binomiale verdeling ................................................................... 105
4
, SAMENVATTING STATISTIEK
Hoofdstuk 1: Wat is statistiek? (Les van 14/2/2022)
1.1 Waarom statistiek?
Met statistiek kan men data verwerken tot bruikbare informatie.
1.2 Definitie van statistiek
Statistiek= het geheel van methodologieën voor het verzamelen, voorstellen, analyseren en
interpreteren van data of gegevens. Statistiek laat ons toe om gegevens of data te verwerken tot
bruikbare informatie.
1.3 Voorbeelden
Vb. aandeel:
Indien het aandeel gemiddeld procentueel sterker stijgt of daalt dan de markt, dan noemt men het
aandeel risicovol.
1.4 Onderwerp van de statistiek
➔ Er worden telkens een of meerdere vragen onderzocht over een populatie van objecten of
elementen of over een proces dat objecten of elementen genereert.
➔ Gegevens over de populatie of het proces worden bekomen door een of meerdere
eigenschappen of karakteristieken van hun elementen te registreren.
Deze eigenschappen of karakteristieken worden variabelen genoemd (de waarde van de
eigenschap varieert van element tot element → statistiek: de studie van de variabiliteit).
➔ Steekproef= men werkt slechts met een deel van de elementen
GIGO= Garbage in, garbage out= het feit dat de meest geavanceerde statistische methoden weinig
tot geen betrouwbare informatie kunnen halen uit gegevens van slechte kwaliteit.
Stap 1: Beschrijvende of descriptieve statistiek= het voorstellen van steekproefgegevens
Stap 2: Het analyseren en interpreteren van de steekproefgegevens
Inferentie= antwoorden en conclusies worden veralgemeend naar de populatie of het proces
➔ inferentiële statistiek, wiskundige statistiek, verklarende statistiek, steekproeftheorie
1.5 Kansrekening
Kansrekening: bestudeert processen of experimenten waarbij de uitkomst onzeker is.
5
,Verschil tussen kansrekening en statistiek: kansrekening bestudeert populaties en processen
rechtstreeks, terwijl de statistiek dit doet via steekproefgegevens.
1.6 Software
JMP
6
,Hoofdstuk 2: Data en hun voorstelling (Les van 14/2/2022)
Data of gegevens: bevatten informatie omtrent een of meerdere variabelen van een aantal
elementen van een populatie of een aantal objecten gegenereerd door een proces.
(Gegevens worden verzameld over meerdere eigenschappen of variabelen.)
2.1 Soorten gegevens en meetschalen
Nominale en ordinale variabelen= categorische of kwalitatieve variabelen
Daarnaast zijn er ook nog kwantitatieve variabelen
2.1.1 Categorische of kwalitatieve variabelen
Nominale variabelen:
➔ De waarde van de variabele plaatst een element in een bepaalde klasse of categorie
➔ Vb.: geslacht (man/vrouw), nationaliteit, godsdienst, het al dan niet bezitten van een wagen,
gemeente (Antwerpen/Mechelen/…), hoogste opleidingsniveau (middelbaar/Bachelor/…)
➔ Cijfercodes
✓ Man = 0, vrouw = 1
✓ Postnummers van gemeenten
→ Cijfercodes impliceren geen volgorde en/of hoeveelheid! → niet mee rekenen! (behalve
absolute en relatieve frequenties (percentages))
Ordinale variabelen:
➔ Nominale variabelen waarbij er een ordening is tussen de klassen of categorieën
➔ Vb.: enquêtes (antwoorden op enquêtes: “1: helemaal eens”, “2: eerder eens”, “3: noch
eens, noch oneens”, “4: eerder oneens” of “5: helemaal oneens”), aantal sterren van hotels,
aantal Michelinsterren van restaurants
➔ Rekenkundige bewerkingen zinloos (behalve absolute en relatieve frequenties (percentages))
2.1.2 Kwantitatieve variabelen
(Kwantitatieve variabelen hebben een meetniveau met numerieke waarden, zoals leeftijd, aantal
broers en zussen, inkomen.)
Worden uitgedrukt in een aantal vaste meeteenheden!
Bijna alle rekenkundige bewerkingen zinvol!
Vb’en: lengte, gewicht, aantal verkochte auto’s, temperatuur, duurtijd, aantal Kb per tijdseenheid…
Intervalschaal:
➔ Geen natuurlijk nulpunt → geen natuurlijke ondergrens
➔ Verschil tussen 2u en 4u is gelijk aan het verschil tussen 21u en 23u
➔ Verhoudingen: niet zinvol
o 4u (’s nachts) is niet dubbel zo laat als 2u (’s nachts)
o (Het temperatuurverschil tussen 5 en 10 graden Celsius is even groot als het verschil
tussen 30 en 35 graden. We kunnen niet zeggen dat 20 graden twee keer zo warm is
dan 10 graden.)
➔ Vb.: temperatuur (°C en Fahrenheit), tijd afgelezen op een klok
7
,Ratioschaal:
➔ Absoluut nulpunt
➔ Verhoudingen: zinvol! (2 meter is dubbel zo lang als 1m)
➔ Vb.: lengte, gewicht, temperatuur in Kelvin…
Andere mogelijkheid voor opdeling van kwantitatieve variabelen:
Discrete variabele: 1
➔ Kan slechts een eindig of oneindig aftelbaar aantal verschillende waarden aannemen
➔ Vb.: het aantal passagiers op een lijnvlucht, het aantal kinderen in een gezin of het aantal
verzekeringspolissen dat een gezin afsloot
Continue variabele:
➔ Kan een continuüm van waarden aannemen2
➔ Vb.: lengte, duurtijd, gewicht en body mass index…
In de praktijk: alle waarnemingen van een continue variabele zullen discreet zijn. Een continue lengte
wordt in de praktijk gemeten tot op een bepaalde nauwkeurigheid (bijvoorbeeld een millimeter) en
aldus discreet gemaakt. Toch zullen we die lengte dan bestuderen alsof het een continue variabele
betrof.
2.1.3 Hiërarchie van meetschalen
Ratioschaal
Intervalschaal
Ordinale meetschaal
Nominale meetschaal
➔ Ratioschaal is de hoogste of meest informatieve meetschaal
➔ Gegevens gemeten op een hogere schaal kunnen omgezet worden in gegevens op een lagere
schaal, maar niet omgekeerd!
➔ Statistische methoden voor lagere meetschalen kunnen gebruikt worden voor hogere
meetschalen, maar niet omgekeerd!
1
Zaken als lengte, gewicht, tijdsduur, inhoud, oppervlakte, leeftijd... e.d. zijn allemaal continu. Discreet zijn
bijvoorbeeld: posttarieven, aantal mensen, aantallen in het algemeen, cijfers op je diploma, aantal ogen met
een dobbelsteen, enz... Bij een discrete variabele bestaan de waarden alleen uit gehele getallen. Discrete
variabelen staan 'los van elkaar'; het gaat om losse waarden die sprongsgewijs veranderen.
2
Continuüm= ononderbroken lijn of reeks
8
, 2.1.4 Meetschalen in JMP
Nominaal: Nominal
Ordinaal: Ordinal
Kwantitatief: Continuous
2.2 De datamatrix
Matrix waarbij:
Rijen (= observatievector): de elementen of waarnemingen van een steekproef
Kolommen: verschillende gemeten variabelen
Univariate voorstelling: heeft betrekking op 1 variabele
Bivariate voorstelling: heeft betrekking op 2 variabelen
Multivariate gegevens: data bestaande uit meerdere variabelen
2.3 Voorstellen van univariate kwalitatieve variabelen
➔ Frequenties en relatieve frequenties
➔ Staafdiagram
➔ Paretodiagram
9