STATISTIEK – Samenvatting 2019 – 2020
INLEIDING
Statistiek is één stap in het onderzoeksproces
- Statistiek is een methodologische ondersteuning (hulpmiddel) van het wetenschappelijk onderzoek.
- Statistiek is een middel om de gegevens (DATA) van kwantitatief onderzoek weer te geven.
o Kwantitatief = gaat om het VERKLAREN van gedrag.
o Onderzoek = op basis van waarnemingen ware en algemene uitspraken doen over de werkelijkheid.
De uitspraken die humane wetenschappers doen, verschillen van de uitspraken van natuurwetenschappers
- Natuurwetenschappers doen deterministische uitspraken.
o Vb: de wet van de zwaartekracht is een wetmatigheid die ervoor zorgt dat als ik een voorwerp
loslaat, dit naar beneden valt. Dat is voor ALLE voorwerpen het geval.
- Humane wetenschappers (vb: psychologen, veiligheidsadviseurs,…) doen probabilistische uitspraken.
o Vb: We hebben vastgesteld dat frustratie agressie bevordert, maar dat is geen deterministische wet.
Het is waarschijnlijk dat als mensen gefrustreerd geraken ze agressief zullen reageren. Niets is zo
veranderlijk als de mens en zo afhankelijk van de context.
o Waarschijnlijk? Statistiek is een hulpmiddel om te bepalen hoe waarschijnlijk dit is!
HOOFDSTUK 1: Hoe bereid ik mij voor op statistiek met Excel
Fasen van de onderzoekscyclus
- Statistiek = bruikbaar in de laatste fase van jouw onderzoekscyclus:
o Laatste fase van de onderzoekscyclus = analyseren van data en rapporteren over de analyses.
o Onderzoekscyclus om hypotheses te toetsen.
o Nagaan of vooropgestelde verwachtingen (o.a. literatuurstudie) bevestigd worden of niet.
- Het doel is om inzicht te krijgen.
Hoe analyseer ik mijn data? Een gebruikswijzer…
- Voor de keuze van een statistische analyse techniek zijn de antwoorden op volgende vragen van belang:
o Gaat het in de vraagstelling om frequenties, een verschil of een samenhang. Of een combinatie?
o Wat is het meetniveau van de gegevens die je hebt verzameld?
o Gaat het om een steekproef of een populatie?
1
,- Gaat het in de vraagstelling om frequenties, een verschil of Voorbeeldvragen:
-Hoeveel Nederlanders krijgen zorgtoeslag?
een samenhang. Of een combinatie daarvan? -Hoeveel Nederlanders ontvangen huurtoeslag?
o Frequentie: vragen waarbij het gaat over hoe vaak of -Hoe eenzaam voelen Nederlanders zich?
-Is er een verschil in tevredenheid over het keven dat men
in welke mate iets voorkomt. leidt tussen: mensen met en zonder partner.
o Verschilvraag -Is er een verschil in eenzaamheid tussen mannen en
vrouwen?
o samenhangvraag -Is er tussen mannen en vrouwen een verschil in
- Een variabele = een eigenschap/kenmerk van de tevredenheid over het leven dat men leidt?
-Is er een relatie tussen de mate van tevredenheid over het
onderzoekseenheid (proefpersoon, huishouden, groep,…) leven en leeftijd?
-Bestaat er een relatie tussen geld en geluk?
o Er kunnen verschillende waardes toegekend worden
aan dit kenmerk. → Het kenmerk varieert = een VARIABELE.
- Meetniveaus
o Nominaal : alleen onderscheidend.
▪ Er is zijn twee categorieën/ waarden, dus er is wel een verschil, maar het ene is niet
meer/minder dan het andere. Een nominale variabele is vaak dichotoom.
▪ Enkel modus (= meest voorkomende waarneming) berekenen.
o Ordinaal : onderscheidend en ordening aanbrengen.
▪ Er is sprake van meer/minder, maar dit kan niet in getallen uitgedrukt worden.
▪ Enkel modus en mediaan (= middelste getal van oplopende getallenreeks) berekenen.
o Interval : onderscheidend en ordening aanbrengen.
▪ Er is een verschil tussen categorieën en het kan in getallen uitgedrukt worden. Er is geen
nulpunt (vb: IQ).
▪ Zowel modus, mediaan en gemiddelde berekenen.
o Ratio : onderscheidend en ordening aanbrengen.
▪ Er is een verschil tussen categorieën en het kan uitgedrukt worden in getallen. Er is een
absoluut nulpunt (vb: leeftijd, gewicht).
▪ Zowel modus, mediaan en gemiddelde berekenen.
- Gaat het om een populatie of een steekproef?
o Beschrijvende = deductieve statistiek: onderzoek bij een populatie en als alle eenheden waarover je
uitspraak wil doen, deelnemen aan het onderzoek. Het doel van beschrijvende statistiek is om op
een overzichtelijke en inzichtelijke manier de gegevens te presenteren.
▪ Parameters van positie/centraliteit: bepalen aan de hand van het meetniveau.
▪ Parameters van spreiding: best met interval - en ratio meetniveau:
• Variantie: gemiddelde afstand van de waarnemingen tot het gemiddelde.
• Standaardafwijking (= SD)
o Verklarende = inductieve = inferentiële statistiek: het maakt een kansberekening op basis van een
steekproef (= onderzoekseenheden die geselecteerd werden). Op basis van een beperkt aantal
gegevens wordt getracht om algemene uitspraken te formuleren over de gehele populatie.
▪ Steekproef: onzekerheid! Is het wel representatief? → voorzichtig zijn met uitspraken!
2
,Enkele algemene statistische begrippen
Hypothese
- Hypothese is (in de een empirische wetenschap) een stelling die (nog) niet bewezen is en die dient als
uitgangspunt voor een experiment of voor een gerichte waarneming.
- 0-hypothese: geen verband. Vb: er is geen verband tussen stress en immuniteit.
- Alternatieve hypothese: er is wel een verband. Vb: langdurige blootstelling aan stress leidt tot
aantasting van immuniteit.
➔ Bewijs voor de alternatieve hypothese is er wanneer we de 0-hypothese kunnen verwerpen MAAR … er
is altijd onzekerheid. Statistiek dient om de ‘mate van onzekerheid’ in kaart te brengen.
Normaalverdeling = Gausscurve
- Belang van spreiding + positie/centraliteit!!
- Het gemiddelde kun je dus NIET gebruiken om afdelingen/ziekenhuizen te vergelijken → mediaan wel.
Vrijheidsgraden
- Degrees of Freedom = DF.
- In de statistiek houdt het aantal vrijheidsgraden verband met het aantal onafhankelijke waarnemingen
waarmee een steekproefgrootheid wordt bepaald.
o Steekprofgrootheid = een functie op de uitkomsten in een steekproef. Meestal (niet altijd!) een
schatter van populatieparameters. Vb: gemiddelde, variantie, …
- Het geeft dus de mate aan waarin scores kunnen variëren.
Standaardfout
- In Excel kan je de standaardfout berekenen: de fout geeft aan in hoeverre
het gevonden steekproefgemiddelde een betrouwbare schatting is van het populatiegemiddelde.
- De standaardfout wordt bepaald door (1) de steekproefgrootte (= aantal samples) en (2) de
homogeniteit (= standaarddeviatie) van de steekproef.
- Hoe groter de steekproef, hoe nauwkeuriger we uitspraken kunnen doen.
Significant
- Significant verschil = de kans dat je het geobserveerde verschil in de steekproef ook terug zou vinden in de
populatie groot genoeg is. Het gaat dus om de aannemelijkheid dat een correlatie niet op toeval berust.
- p-waarde is een waarde die aangeeft hoe uitzonderlijk en consistent de resultaten van jouw onderzoek zijn.
In elk onderzoek heeft toeval een effect op de verkregen resultaten. Hoe kleiner de p-waarde, hoe groter de
kans dat jouw resultaten NIET te wijten zijn aan toeval.
- In dit OPO houden we de minimale grens van 5% aan, dus je mag systematisch significantie rapporteren
vanaf 0,05 (p < 0,05). D.w.z.: bekom je een p-waarde die kleiner is dan 5% of 0,05 OF STRENGER NOG een
p-waarde die kleiner is dan 1% of 0,01, dan zeggen we dat het bekomen resultaat (verschil of verband)
statistisch significant is (en dus niet het gevolg van toevallige fluctuaties in de steekproef).
3
, Excel en de statistische functies ervan Installeren
- Klik linksboven in je Excel op ‘Bestand’.
- Klik op ‘Opties’.
- Klik dan op ‘Invoegtoepassingen’
- Klik onderaan in het kader op ‘start’.
- Vink daarna de invoegtoepassingen “analysis toolpak” en “analysis toolpak VBA” aan en druk op ‘OK’.
- Excel installeert nu de benodigde statistische functies.
- In te tabblad gegevens is nu een nieuw tabblad ingevoegd: ‘Gegevensanalyse’.
HOOFDSTUK 2: Hoe breng ik mijn gegevens in de computer?
Hoe maak ik een codeerschema of codeboek?
Kwalitatieve (= discrete) variabele Kwantitatieve (= continue) variabele
Categorisch = categorie als antwoord op de vraag Numeriek = numerieke gegevens als antwoord
Ordinaal en nominaal Interval en ratio
Vb: hoogst behaalde opleiding Vb: leeftijd
Mutueel exclusief: door deel uit te maken van een
categorie, sluit je automatisch de andere
categorieën uit.
- Het moet duidelijk zijn hoe gegevens gelezen moeten worden:
o Dat geef je aan in een codeboek (= legende)
o Gegevens worden best altijd numeriek verwerkt (dus als een getal).
- Bij een nominale variabele los je dit op door een cijfer toe te kennen eraan. Vb: geslacht →man (1) en een
vrouw (2). Dit kan ook met (a) of (b) of (x) en (y) → Dit zijn codes en die leg je best vast in een codeboek,
anders zou je d betekenis ervan kunnen vergeten.
- Voorbeeld codeboek:
- System missing values: vraag is
niet van toepassing voor
respondent.
- User missing values: respondent
antwoord niet, ook al is de vraag
- Coderen van toepassing voor hem.
o ONTBREKENDE GEGEVENS: het is het makkelijkst is om de cel LEEG te laten → dus blanco en
geen 0 intypen!
o Tip: codeer zoveel mogelijk in de lees- en schrijfrichting. Vb: bij een vijpuntsschaal = absoluut
niet = code 1 en bij absoluut wel = code 5
o Het is belangrijk om de gegevens zo ruw mogelijk in te voeren! Zo worden minder fouten
gemaakt. Dus: geen klassen op voorhand opmaken (vb: bij leeftijd).
4
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur goedelecarton. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €2,99. Vous n'êtes lié à rien après votre achat.