1.1 Welke plaats heeft statistiek in onderzoek en wat is het kernprobleem van inductieve statistiek?
Stel: onderzoek naar het effect van muziek op depressie
• deelnemers luisteren 1u naar melancholische rock of 1u naar popfunk
o melancholie: score van 102 op depressieve gevoelens
o popfunk: score van 99 op depressieve gevoelens
• vaststelling: “melancholie luisteraars zijn meer depressief dan popfunk luisteraars”
o stel dat de gegevens 120 vs 92 zijn, dan voelt het comfortabeler om te zeggen dat er
een verschil is; maar stel nu dat het 105 vs 97 is, dan twijfel je weer
• Kan dat toevallig zijn? Is het niet waarschijnlijk om zo een verschil te observeren ook al is er
geen invloed van muziek?
Probleem: Wanneer is een verschil groot genoeg?
• Wat als onze steekproeven toevallig onevenwichtig zijn samengesteld? Wanneer trekken we
een conclusie van verschil/verband?
• statistiek biedt regels om te beslissen; berekeningen zijn nodig om regels toe te passen
• hypothesetoetsing is nodig om tot significantie te komen
De empirische cyclus
• theorie: melorock = popfunk
• hypothese: melorock meer depressie dan popfunk
• dataverzameling: neem vragenlijst af na luisteren naar melorock of popfunk
• beschrijvende statistiek: melorock = 102 en popfunk = 99
• inductieve statistiek: Is 102 significant groter dan 99?
Statistisch significant
• Wanneer is een verschil groot genoeg? = het kernprobleem van de inductieve statistiek
• Wanneer kunnen we het verschil generaliseren naar de populatie?
• statistiek biedt regels om te beslissen via hypothesetoetsing en significantie
1.2 Wat is de rol van kansberekening en toetsen in de statistiek?
Kansberekening
• statistische significantie nagaan dmv kansberekening
• Is het geobserveerde verschil groot genoeg om significant te zijn?
Denkoefening waarin we kansen gebruiken
• 1: we gaan ervan uit dat er in werkelijkheid géén verschil is (omgekeerde redenering)
o populatie A = populatie B
• 2: we gaan de kans berekenen dat we in dat geval die observatie gaan doen (beide bv 102)
o steekproef A > steekproef B
• 3: grote kans → wellicht is het verschil geen echt verschil
• 3: kleine kans → mogelijk is het verschil ook een echt verschil
1
,Nieuwe vragen
• Hoe moeten we die kans berekenen?
o op basis van kansverdelingen (bv standaardnormale verdeling)
o met behulp van verschillende toetsen verder verwerken
• Wat is dan een “grote” en een “kleine” kans?
o 5% of 0.05 is het meest courant (zie later)
Zekerheid?
• we zijn nooit 100% zeker van de conclusie
• onzekerheid is geen probleem, als we maar de mate van onzekerheid kennen
• vb: “We concluderen met 95% zekerheid dat popfunk zorgt voor een betere gemoedstoestand
dan melancholische rock”
• zekerheid neemt wel toe naarmate er meer en meer studies hetzelfde bevestigen
Toetsen: toetsingssituaties zijn heel uiteenlopend
• Verschil in depressie bij verschillende muziek?
• Verschil in depressie vóór en na beluisteren van muziek?
• Verschil in depressie bij verschillende muziek en 2 methoden gedragstherapie?
• 500 deelnemers of slechts 20?
1.3 Hoe kan statistiek misbruikt worden en wat doen we daaraan?
Misbruik van statistiek
• onduidelijke steekproef: “95% van de Belgen is tevreden over Activia”
• gebrek aan context: “Duracell-batterijen gaan tot 5 maal langer mee”
• interne validiteit: Laat het onderzoeksopzet toe om causale conclusies te trekken?
Om alternatieve verklaringen uit te sluiten: experimenteel onderzoek
• randomiseren
• voormeting
• nameting
• controleren voor storende variabelen
• = methodologie: noodzakelijk om juiste conclusies te trekken, statistiek alleen is onvoldoende!
Correcte statistieken: laat anderen het harde werk doen en haal cijfers bij
Samengevat
• toetsende statistiek volgt op beschrijvende statistiek in de empirische cyclus
• de bedoeling is om obv verzamelde data een onderbouwde beslissing te nemen over verband
of verschil
• dat we over deze beslissing nooit 100% zeker zijn is niet erg, zo lang we maar de mate van
onzekerheid kennen
• om die mate van onzekerheid te bepalen, hebben we kansberekeningen nodig
• op basis daarvan kunnen we significantie berekenen
• statistiek is geen wetenschap op zich
• statistische conclusies zijn pas waardevol als ook aan de randvoorwaarden voldaan is en
statistiek niet misbruikt wordt
2
,Hoofdstuk 2. Kansverdeling en kansberekening
2.1 Wat is een kansverdeling en hoe kunnen we haar kenmerken berekenen?
Waarom hebben we kansen nodig?
• er zijn twee soorten vragen bij het bestuderen van de populatie obv steekproefgegevens
o hypothesetoetsing: met 95% zekerheid verschilt groep 1 met groep 2 in IQ-score
o interval-estimatie: het gemiddelde lijkt met 95% zekerheid tussen … en …
Frequentieverdeling
• kansverdeling lijkt heel erg op frequentieverdeling
• het uitzetten van geobserveerde data in een frequentieverdeling
• vb: frequentieverdeling van variabele ‘aantal ogen bij werpen van 2 dobbelstenen’ bij N = 50
Kansverdelingen
• nadenken over wat er kan gebeuren wanneer we 50 keer een dobbelsteen gooien
• vb: kansverdeling van variabele ‘aantal ogen bij het werpen van 2 dobbelstenen’ bij N = 50
Frequentieverdeling vs kansverdelingen
• verloop van de kansverdeling: gemiddelde en standaard-
afwijking bij kansverdeling niet echt mogelijk wegens
geen observaties, maar wél obv kansberekening
• kansverdeling is analoog aan de frequentieverdeling
o frequentieverdeling = geobserveerde waarden
o kansverdeling = hypothetische waarden
Gemiddelde kansverdeling
• gemiddelde van een kansverdeling = ‘verwachte waarde’ →
• vb: bij het gooien van 1 dobbelsteen →
Variantie kansverdelingen
• variantie van een kansverdeling →
• vb: bij het gooien van 1 dobbelsteen →
Kansverdelingen
• kansen zijn van groot belang in onderzoek omdat ze ons in staat stellen om te beslissen of een
observatie heel uitzonderlijk is of eerder heel gewoon
• om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen
van mogelijke waarden en bijhorende kansen van een variabele
• sommige kansverdelingen kunnen we perfect kennen (bv dobbelsteen gooien), andere
kansverdelingen moeten we eerder schatten (bv intelligentie)
3
, 2.2 Wat is de steekproevenverdeling van het gemiddelde en hoe kunnen we de vorm van deze
verdeling kennen?
Steekproevenverdelingen van … (gemiddelde)
• een bijzondere kansverdeling: de steekproevenverdeling van het gemiddelde
o uit heel de populatie blijven we maar steekproeven trekken van 100 deelnemers en
die vormen een nieuwe verdeling
o je bekomt dus uit iedereen zijn individuele score een gemiddelde van de 100
deelnemers uit de steekproef, die gemiddeldes samen vormen een nieuwe grafiek
o Wat is dan de kans om een bepaald gemiddelde te observeren?
• verwachte waarde van steekproevenverdeling = populatiegemiddelde …
• →
Steekproevenverdelingen van … (gemiddelde)
• vb: populatie = 2, 4, 6
• we gaan een steekproef trekken van N = 2
• er zijn 9 mogelijke uitkomsten dus de kans is 1/9
• het gemiddelde van de populatie →
• het gemiddelde van de kansverdeling →
• dus: de verwachte waarde van de steekproevenverdeling = populatiegemiddelde …
• gemiddelde van de steekproef is een zuivere schatter van het gemiddelde van de populatie
• schatter: we schatten met behulp van het steekproefgemiddelde het populatiegemiddelde
• zuiver: geen systematische afwijkingen
4
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur steylsmariet0702. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €10,99. Vous n'êtes lié à rien après votre achat.