Statistiek I - samenvatting
H1: inleiding
= gegevens synthetiseren, analyseren, interpreteren en presenteren
(veel databronnen: surverygegevens, administratieve data, big data= veel registratie zonder
besef, bv. Sensoring in verkeer/smartphones etc.)
= statistiek als wetenschappelijke discipline – kennismethode om wereld beter te kunnen
begrijpen – empirisch OZ
kennis obv wetenschappelijk OZ: dataverzameling
Soorten statistiek
1) Beschrijvende statistiek
de wereld in cijfers beschrijven
basis: frequentievragen
samenvatten in ‘kengetallen’
gebruik van grafische gegevens
ordenen en synthetiseren van (grote hoeveelheid) gegevens – herleiden tot
– samenvattende maten (bv. Percentages, mediaan, kwantielen…)
– grafieken
2) inferentiële statistiek
middel om met beperkt aantal gegevens uitspraken te doen over breder
geheel/volledige populatie (generaliseren/extrapoleren)
extrapolatie: uitspraken over volledige bevolking obv steekproef (
representatief: aselect + genoeg ondervragen)
voorspellingen
veralgemeenbaarheid steekproefresultaten
3) verklarende statistiek
gericht op verklaring van verschillen en samenhang
bivariate regressie, multivariate regressie; survival anaylse…
bv.: Wat is de relatie tussen opleidingsniveau en inkomen?
Hans Rosling: Zweedse dokter, ‘statisticus’ – ontwikkkelaar ‘gapminder’ = organisatie die
misvattingen over mondiale onwtikkelingen wil tegengaan obv data
Misleiden door statistiek?
Uitkomsten van OZ kunnen gemanipuleerd worden bij (stadia van misleiding bij stat):
1. verzamelen van gegevens
– slechte selectie OZspersonen (niet representatief – probleem bij
online surveys verspreid via sociale media)
– te klein aantal OZSpersonen
– slechte vraagstelling (gestuurd/subjectief)
1
, – slechte operationalisatie (= vertaling van concepten naar
meetinstrumenten) of vergelijking van verschillende
operationalisaties (bv. Metingen COVID-19 in België vs andere
landen)
2. presentatie van de uitkomsten
– deel grafiek verwijderen (bv. Oorsprong)
– schaal manipuleren
– grafische aanpassingen
3. omschrijven van de conclusies
Oorsprong van statistiek
à ontstaan midden 18e eeuw
à 19e eeuw: steeds grotere verzameling gegevens – ook analyse en presentatie van data
– Royal Statistical Society (1834)
à Adolphe Quetelet: organiseert eerste internationale conferentie over statistiek (1853)
à Florence Nightingale:
o Grondlegster moderne verpleegkunde en sociaal hervormster
o Introduceert gebruik van statistieken in gezondheidszorg, uitvindster
pooldiagram
o Eerste vrouwelijke lid RSS
Belang nieuwe cijfersymbolen
(huidig systeem: Hindu-Arabisch systeem)
– Efficiënt voor complexe bewerkingen
– Getallen in cijfersymbolen sneller te lezen
– Enige universele taal
– Cruciaal voor start wetenschappelijke revolutie in EU en opkomst moderne
natuurwetenschap vanaf 17e E
H2: Meten en meetschalen
Terminologie en kernbegrippen
Onderzoekspopulatie: alle leden van een welomschreven groep die je wil
onderzoeken
Statistische eenheid of case: element uit de bestudeerde bevolking (mensen,
woningen, landen…) – statistiek bestudeert de kenmerken van die bevolking
Let op: statistische eenheid bepaalt je analyseniveau (binnen analyseniveau blijven
wanneer besluiten nemen)
– Microniveau: individuen
– Tussenniveau: scholen
– Macroniveau: landen
– Ecological fallacy: bevindingen op hoog niveau toepassen op individuen
Variabele: kenmerken van onderzoekseenheden waarin we geïnteresseerd zijn
– bij sommige kenmerken zijn de waarden al een getal, bij andere
kenmerken dit niet het geval (bv. Geslacht)
datamatrix:
2
, – cases (waarnemingseenheden/statistische eenheid): in rijen = records
– variabelen/kernmerken (waarde varieert): in kolommen
– waarden: in cellen
parameters: kengetallen die de verdeling weergeven van een kenmerk in een
populatie (volledige populatie parameters – steekproef statistische
maten/schatters)
steekproeven: onderzoek mtb specifieke bevolkingsgroep (populatie) vaak
onmogelijk te onderzoeken steekproef: deel van de populatie (inferentiële
statistiek: conclusies trekken over volledige populatie pbv steekproefOZ)
steekproefstatistieken (statistics): statistische kengetallen van een steekproef of
schatters = een numerieke samenvatting van de steekproef uit de populatie
statistische reeks: reeks waarnemingen
tijdreeks: reeks waarnemingen in de tijd – ogenblik van waarneming is belangrijk
voor de interpretatie van de gegevens (bv. Evolutie van iets doorheen de tijd – vaak
trendsanalyses)
dimensie van een reeks: aantal variabelen dat simultaan wordt waargenomen of
bestudeerd
– unidimensionale of univeratie reeks 1 variabele bekijken
– tweedimensionale of bivariate reeks vergelijken tussen 2 groepen
– multidimensionale of multivariate reeks meerdere variabelen in
rekening brengen
Waarom meten?
à Laat ons toe om vergelijkingen te maken
à Standaarden nodig om te vergelijken (bv. Cm, km…)
à Statistiek heeft nood aan standaarden; gestandaardiseerde meetschalen en
gestandaardiseerde indicatoren = meetschaal die toelaat meetwaarden op een
consistente en vergelijkbare manier te interpreteren, ongeacht context
Wat is meten?
Operationalisatie:
– Meetbaar maken van variabelen dmv 1 of meerdere vragen
– Bepalend voor rest van OZ
– Meesatl obv voorafgaand OZ of obv een theorie
– Sommige variabelen hoeven niet onderbouwd te zijn (bv. geslacht),
andere wel (bv. armoede, seksisme…)
Variabele: een afbeelding van een bevolking P in een verzameling X van warden
gemeten eigenschap of kenmerk
Afhankelijke en onafhankelijke variabelen:
– In OZ variabele verklaren obv een andere/relaties met andere
variabelen in kaart brengen (afhankelijke = variabele die je wil
verklaren)
Meten: verdelen van de populatie P in equivalentieklassen = deelverzameling van P
die alle elementen groepeert die equivalent (gelijk) zijn voor het bestudeerde
kenmerk
3
, Schalen: toekennen van een eigen waarde (kwalitatief of kwantitatief) aan elke
equivalentieklasse van het ongeschaalde kenmerk
Meetschaal (van de variabele): de verzameling X van waarden
Meten & meetschalen
à Toekennen van getallen aan equivalentieklassen
à Hoe? 2 regels:
1) Aan elke waarde van het ongeschaalde kenmerk een unieke, specifieke
‘code’ toekennen
2) De toegekende waarden aan equivalentieklassen weerspiegelen de relaties
die in realiteit bestaan tussen de equivalentieklassen, en énkel die relaties
Kwantitatieve vs kwalitatieve waarden
à In sociale wetenschappen vaak kwantitatieve waarden
à Voordelen?
o Eenduidiger dan kwalitatieve waarden
o Verwerking van kwantitatieve waarden via computer vlotter
o Meer mogelijkheden tot analyse
Gegevens kunnen worden samengevat in simpele beschrijvende maten
Relaties tussen kenmerken kunnen als algebraïsche functies uitgedrukt
worden
Eigenschappen van variabelen en meetniveaus
Meetniveau: de manier waarop je een variabele meet, bepaalt het meetniveau of de
meetschaal van de variabelen
meetniveau bepaalt welke statistische analyses mogelijk zijn en welke niet
4 meetschalen:
1) Nominaal
2) Ordinaal
3) Interval
4) Ratio
hiërarchie van de meetschalen/meetniveaus: NOIR; bewerkingen toegelaten voor
variabelen v/e bepaald meetniveau mogelijk worden toegepast op variabelen van een
hiërarchisch hoger meetniveau, maar niet op variabelen van een lager meetniveau
Eigenschappen van variabelen
Nominale variabelen:
– Classificatie
– Numerieke waarde = slechts een naamgeving (je kunt niet rekenen met de waarden
die je aan de variabelen gegeven hebt)
Ordinale variabelen:
– Classificatie + rangorde
– De variabele of meetschaal X is ordenbaar wanneer voor elk baar elementen x1 en x2
van X, men kan bepalen of x1 > x2 dan wel x2 < x1
– Bv. opleidingsniveau
– Opmerking:
4
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur silkelievens2005. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €13,66. Vous n'êtes lié à rien après votre achat.