In deze samenvatting wordt een korte herhaling gegeven over statistiek 1 & 2, die de basis vormen voor de rest van de theorie die behandeld wordt in statistiek 3. In deze samenvatting komen belangrijke begrippen terug, die wellicht een beetje zijn weggezakt. Altijd fijn om een samenvatting als deze...
Statistiek is de wetenschap van het verzamelen, organiseren en interpreteren van
numerieke feiten, die we data noemen.
Stappen voor het toepassen van statistiek:
1. Selecteren van een steekproef uit de populatie.
2. Beslissen of een steekproef representatief is.
3. Het doen van beschrijvende statistiek of inferentiële statistiek.
4. Meetniveaus (NOIR) en typen variabelen (categorisch/kwantitatief).
5. Kiezen van de juiste statistische analyse.
6. Experimenteel onderzoeksdesign versus een niet-experimenteel onderzoeksdesign
Methoden vakken gaan over design van onderzoek, statistiek is je toolkit voor het uitvoeren
van onderzoek.
Statistiek is van belang in pedagogische wetenschappen, er is belang bij goed empirisch
onderzoek.
→ In de pedagogiek kan je te maken krijgen met regression to the mean, dit houdt
in dat als onderzoek nogmaals wordt uitgevoerd, de effecten minder extreem zijn
(meer gemiddeld) dan in eerste instantie leek. Dit statistische feit kan ertoe leiden dat
interventies voor zeer effectief worden aangenomen, maar die na een tweede keer
testen minder effectief zijn dan in eerste instantie werd gedacht.
Statistiek bestaat uit methoden voor het verzamelen en analyseren van data om…:
→ Een onderzoeksstudie op te zetten → Uitkiezen van een design (dit is wat je leert
bij methodologie vakken)
→ Data te beschrijven (beschrijvende statistiek)
→ Conclusies te trekken o.b.v. de data (inferentiële statistiek)
Belangrijke concepten in statistiek
Beschrijvende statistiek (descriptive statistics): De populatie/steekproef samenvatten
d.m.v. grafieken, tabellen, etc.
Inferentiële statistiek (inferential statistics): Doet voorspellingen over populatie parameters,
a.d.h.v. (random) steekproefdata (je wilt uitspraken doen over de populatie en deze
uitspraken baseer je op een willekeurige steekproef).
Populatie: De totale set van participanten die relevant zijn voor de onderzoeksvraag
→ Bijv. Populatie parameter: Gemiddelde uur aan zelfstudie per week voor alle
studenten.
Steekproef (sample): Een subset van de populatie waar je data van verzameld (ofwel een
willekeurige selectie van je populatie).
→ Bijv. Steekproef statistiek: Gemiddelde uren aan zelfstudie per week van een
random geselecteerde steekproef van 800 studenten.
Om correcte uitspraken te doen over je populatie is het van belang dat je goede data hebt en
dus ook een goede steekproef, dit kan je samenvatten in 2 verschillende dimensies:
→ Betrouwbaarheid (reliability): Gaat over precisie / mate van consequentie
→ Validiteit (validity): Gaat over bias / storing (meet je gemiddeld genomen wat je
wilt meten?)
,Beschrijvende statistiek
Variabele: Meet kenmerken die kunnen verschillen tussen subjecten.
Meetschalen (NOIR):
Categorisch/kwalitatief:
→ Nominaal: Ongeordende categorieën, volgorde in categorieën maakt niet uit (bijv.
oogkleur, geslacht, etc.)
→ Ordinaal: Geordende categorieën, volgorde speelt wel een rol bij de categorieën
(bijv. niet mee eens/neutraal/mee eens)
Kwantitatief/numeriek:
→ Interval: Gelijke afstand tussen waarden (bijv. graden Celsius)
→ Ratio: Absoluut nulpunt (bijv. leeftijd)
Range = bereik van een de variabele
→ Discreet: Meeteenheid die ondeelbaar is, je kan geen halve hebben (bijv. aantal
broers of zussen; je kan niet anderhalve broer hebben)
→ Continue: Oneindig deelbare meeteenheid (ofwel oneindig nauwkeurig meten;
heel veel cijfers achter de komma zijn mogelijk) (bijv. lichaamslengte)
Drie belangrijke dimensies bij beschrijvende statistiek:
→ Central tendency: Typische observatie, wat komt het meest voor? (als je naar je
data kijkt en je zou er een observatie uit moeten pikken die het meest zegt over je
data)
Maten: Gemiddelde, Modus, Mediaan
→ Dispersion (spreiding): Variatie in observaties
Maten: Standaard deviatie, Variantie, Interkwartiel range
→ Position: Relatieve positie van observatie(s) (als je twee observaties eruit pikt wat
is dan de relatieve positie?)
Maten: Percentiel, Kwartiel
, Deze twee verdelingen hebben hetzelfde gemiddelde (central tendency) maar verschillen in
spreiding (dispersion); land A heeft meer spreiding dan land B (variantie en
standaarddeviatie verschillen dus).
Inferentiële statistiek
Doel van inferentiële statistiek: Betrouwbare en valide verklaringen/conclusies over de
populatie gebaseerd op de steekproef.
→ Steekproef statistiek zou hierbij niet moeten verschillen van de populatie
parameters.
Problemen bij inferentiële statistiek
Problemen die we hebben bij inferentiële statistiek hebben vooral betrekking op de
steekproef die gebruikt wordt.
→ Sampling error: Fout in de steekproef (denk aan standaardfout). Dit is de
natuurlijke variatie omdat je willekeurig een steekproef trekt. De ene keer zit je iets
dichter bij de populatie parameter dan de andere keer. Dit is gewoon de fout omdat je
een steekproef gebruikt en dit is ook niet zo’n groot probleem.
→ Sampling bias: Een storing in het trekken van je steekproef door selectief een
steekproef te trekken (Bijv. Je wilt de politieke voorkeur van de Nederlandse
bevolking achterhalen, maar je bevraagt hierover alleen Nederlanders in de
Randstad. Dit geeft jou geen representatief beeld van de politieke voorkeur van de
gemiddelde Nederlander).
→ Response bias: Participanten geven onjuiste antwoorden (Bijv. participant geeft
aan dat hij op partij A stemt, terwijl hij in werkelijkheid op partij B stemt).
→ Non-Response bias: Selectieve participatie (Bijv. jongeren zijn minder geneigd je
vragenlijst in te vullen, waardoor je gemiddelde leeftijd hoger ligt dan in je populatie)
Er is een belangrijk verschil tussen betrouwbaarheid (error) en validiteit (bias).
→ Betrouwbaarheid gaat meer over je standaardfout en statistische power
(onderscheidend vermogen van je test en de grootte van je steekproef).
→ Validiteit gaat echt over een storing (bias) in je steekproef
Verschillende verdelingen
Populatieverdeling (population distribution): Bijv. de proportie studenten die extra onderwijs
nodig hebben voor wiskunde (deze schat je a.d.h.v. je steekproef d.m.v. inferentiële
statistiek).
Data verdeling in je steekproef (sample data distribution): Bijv. de proportie studenten in de
steekproef (n = 1000) die extra onderwijs nodig hebben voor wiskunde
→ A.d.h.v. de steekproef schat je de populatieverdeling
Steekproevenverdeling (sampling distribution): Verdeling van de schatters (elke keer dat je
een verschillende steekproef trekt heb je een bepaalde schatter, elke keer is deze schatter
net iets anders en een verdeling van al deze schatters is je steekproevenverdeling).
→ De standaarddeviatie van de steekproevenverdeling noem je ook wel de
standaardfout en dit zegt iets over de betrouwbaarheid van je schatter.
Standaarddeviatie
π = proportie
√ π (1−π )
n
Deze formule staat op het formuleblad
Centrale limiet theorie (voor steekproevenverdeling)
Als je gaat testen wil je een standaard normaal verdeling gebruiken
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur lisaroos2001. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €6,49. Vous n'êtes lié à rien après votre achat.