Statistiek I
EENDIMENSIONALE STATISTIEK
Inleiding
Examen
- 2 testen voor het examen: 07/11 en 14/12
o Tellen voor 10% van de punten mee
o Vragen zoals op het examen
- 50 % schriftelijk examen (9 theorievragen en 11 oefeningen)
o Theorievragen: foute stelling aanduiden (je krijgt 9 stellingen)
o Staat op 20 punten en dat wordt herrekend naar 10 punten
▪ 9/20 theorievragen
▪ 11/20 oefeningen
- 40 % praktisch gedeelte bestaande uit een praktische proef op PC met gebruik van rekenblad
& SPSS
o Is openboek
o Open vragen
o Excel (2/8)
o SPSS (6/8)
- Opmerking: je dient voor beide onderdelen apart geslaagd te zijn
- Formuleblad en rekenmachine mogen we altijd gebruiken
- Afronden in oefening mag altijd!
Wat is statistiek
- “Statistics is the art and science of learning from data”
o Data: gegevens die je verkrijgt door onderzoek te doen
o Verschillende bronnen van gegevens:
▪ Registeres die door de overheid aangelegd worden (bv. rijksregisternummer)
▪ Data die we zelf verzamelen op basis van survey’s/enquêtes
▪ Bigdata: data die er zijn doordat wij gebruik maken van onze gsm/computer
- Statistiek is gegevens vertalen in kennis en inzicht
o Dus: gegevens analyseren, interpreteren en presenteren
- Statistiek als wetenschappelijke discipline
- Kennismethode om de wereld beter te kennen en te begrijpen
- Methode om aan empirisch onderzoek
o Gegevens observeren en verzamelen en daarna statistisch weergeven = empirisch
onderzoek
- Statistiek als werktuig, instrument, methode
- Kijken naar gegevens en verdelingen
o Weergeven op een manier om beter te begrijpen: grafisch, kengetallen
1
, o Onderzoeken en vergelijken van verdelingen
o Verdeling = bv. opleiding, dan spreken we van de verdeling van de bevolking naar
opleiding, het aantal mensen met een diploma lager onderwijs, secundair onderwijs
en hoger onderwijs
Waarom statistiek
- Om beweringen te staven
o Beweringen op zich niet voldoende, nood aan empirie dus nood aan data en
gegevens
- Data verzamelen volgens de regels van de kunst
o Onderzoeksmethoden
- Data analyseren volgens de regels van de kunst
o Statistiek
→ Als we dus empirisch onderzoek willen doen om een antwoord te bieden op een
vraagstelling, dan
o Dienen we data te verzamelen
o Data te analyseren
Fasen in sociaal-wetenschappelijk onderzoek
- Onderzoeks -empirische cyclus
1. Probleemstelling
o Vergt substantiële (i.e. inhoudelijke) kennis van het
vakgebied
2. Onderzoeksontwerp & Dataverzameling
o Welke onderzoeksmethoden in functie van probleem-
en vraagstelling?
3. Data-analyse
o Beschrijvende statistiek, inductieve statistiek,
multivariate analyse,…
o In deze fase gebruik maken van statistiek
4. Rapportering
o Interpreteren, literatuur opzoeken, refereren, wetenschappelijk taalgebruik
Soorten statistiek
- Er zijn 3 soorten statistiek
1. Beschrijvende statistiek
o Gaan wij doen dit jaar
o De wereld in cijfers beschrijven
▪ We denken spontaan vaak kwantitatief (veel, weinig, meer,...)
▪ Cijfers geven die hoeveelheden precies weer
o Basis: frequentievragen
▪ Bv. Hoeveel keer ga ik naar de cinema per jaar? Hoeveel mensen hebben
extreemrechts gestemd?
o Samenvatten in “kengetallen”
▪ Gemiddelde, mediaan, standaardafwijking, variatie, variantie
2
, • Zijn samenvattende parameters die ons helpen om een verdeling van
een bepaalde variabele samen te vatten in een paar parameters (zo
kunnen we snel kennis hebben van een verdeling)
o Gebruik van grafische technieken
▪ Grafieken en tabellen
o Ordenen en synthetiseren van (een grote hoeveelheid) gegevens (bv. 12000
enquêtes,…)
o Bv.: Belgische brutolonen 2019
▪ Voltijds tewerkgestelde werknemer: gemiddeld 3.758 euro bruto per maand.
• Je hebt de verdeling niet dus dit zegt weinig, je hebt er die veeel mer
verdienen en je hebt er die veeel minder verdienen
▪ De helft werknemers (mediaan): meer dan 3.486 euro
• Zegt hier al meer dan gemiddelde
▪ Gemiddeld maandloon voltijds tewerkgestelde vrouw: 5% lager
▪ 10% ontvangt minder dan 2.295 euro; 10% ontvangt meer dan 5.886 euro
▪ Directeurs van grote ondernemingen hebben het hoogste loon; obers en
diensters het laagste
▪ Studeren heeft een positieve invloed op het loon: houders van een master-
diploma verdienen 48 % meer dan de gemiddelde werknemer
2. Inferentiële statistiek
o Middel om met een beperkt aantal gegevens uitspraken te doen over een breder
geheel, over een volledige populatie
o Extrapolatie: uitspraken over de volledige bevolking op basis van een steekproef uit
die bevolking (bv. Veiligheidsmonitor, verkiezingsonderzoek, ESS, …)
o Veralgemeenbaarheid steekproefresultaten
▪ Dus steekproef moet representatief zijn voor de rest van de bevolking
▪ Je moet dus een aselecte steekproef trekken (toeval laten spelen)
o Voorspellingen op basis van een steekproef
3. Verklarende statistiek
o Statistische analyse
o Gericht op de verklaring van verschillen & samenhang
▪ Dus niet louter beschrijven
o Bivariate regressie, multivariate regressie, dummy regressie, logistische regressie,
survival analyse …
▪ Regressietechnieken: variabele y voorspellen op basis van variabele x
o Voorbeeld samenhang- en verschilvragen
▪ Wat is de relatie tussen opleidingsniveau en inkomen?
▪ Wat is de relatie tussen opleidingsniveau, inkomen en
onveiligheidsgevoelens?
▪ Wat is de relatie tussen opleiding en gezondheid?
▪ Wat is de relatie tussen opleidingsniveau en kijkgedrag (TV)?
Hans Rosling (professor global health): a few quotes
- There’s nothing boring about statistics: especially not today, when we can make the data
sing, with statistics we can really make sense of the world, with statistics the data lead to a
3
, greater understanding of life on earth and the universe beyond, thanks to the tremendous
power of computers in the world, it may transform the process of scientific discovery,
statistics is now the sexiest subject around…
- Being a statistician, you don’t want to tell your profession at a diner party, but really
statisticians shouldn’t be shy because everyone wants to understand the world we live in.
Statistics give us a perspective on the world we live that we can’t get in any other way.
Misleidende statistiek
- Vaak geciteerd, oorsprong niet echt bekend
- Kernidee:
o Cijfers zijn enorm overtuigend
o Worden vaak gebruikt of misbruikt om zwakke of foute argumenten te ondersteunen
▪ “met statistiek kan je alles bewijzen”
- Statistieken worden regelmatig gebruikt om mensen te misleiden
o Uitkomsten van een onderzoek kunnen gemanipuleerd worden bij
1. Verzamelen van gegevens
▪ Slechte selectie van onderzoekspersonen, niet representatief voor de
bevolking die je wil onderzoeken
▪ Te klein aantal onderzochte personen
▪ Slechte vraagstelling: gestuurd
▪ Slechte operationalisatie: COVID-19 in België vs. andere landen
2. Presentatie van de uitkomsten
▪ Een deel van de grafiek verwijderen
▪ Schaal manipuleren
▪ Grafische aanpassingen
→ Zelf leren kritisch lezen!
▪ Is het geciteerde cijfer correct? Geloofwaardig?
▪ Hoe is dit cijfer tot stand gekomen?
▪ Hoe moet je dat cijfer interpreteren?
▪ Hoe wordt dat cijfer voorgesteld?
3. Omschrijven van de conclusies
Oorsprong statistiek
- Ontstaan midden de 18de eeuw
o Informatie over naties (staat)
▪ Staatsboekhoudkunde
o Systematische verzameling van demografische en economische data door overheden
o Fiscale en militaire doeleinden
▪ Daarom nood aan gegevens burgers
o Term statistics
▪ Latijn: statisticum collegium (‘council of state’)
▪ Italiaans: statista (’statesman’ ‘politician’)
▪ Duits: statistik (‘science of the state’) –
- Midden 19de eeuw
4