Samenvatting van de volgende hoofdstukken van The Practice of Statistics in the Life Sciences: 19, 20, 22 t/m 24 en 26. Bevat tevens hoofdstuk 5 van het boek Measurement in Medicine over betrouwbaarheid en bevat daarnaast een stuk over poweranalyse en groepsgrootteberekening. Ik heb een 9,4 gehaald...
Hoofdstukken: 19, 20, 22 t/m 24 en 26
12 juillet 2021
42
2020/2021
Resume
Sujets
statistiek
onderzoek
psls
Livre connecté
Titre de l’ouvrage:
Auteur(s):
Édition:
ISBN:
Édition:
Plus de résumés pour
Summary Research in Biomedical Sciences (AB_1142) partial exam 1+2
Summary Statistics and Methodology (AB_1201)
Research in Biomedical Sciences (AB_1142): Complete Summary (VU Amsterdam)
Tout pour ce livre (12)
École, étude et sujet
Universiteit Utrecht (UU)
Klinische Gezondheidwetenschappen
Klassieke statistische methoden
Tous les documents sur ce sujet (2)
3
revues
Par: saapkelisannebakker • 2 année de cela
Par: senorita__01 • 2 année de cela
Par: Isabelbek • 2 année de cela
Traduit par Google
It covers almost all the themes needed for the KSM test! Very happy with it.
Vendeur
S'abonner
aloeffen
Avis reçus
Aperçu du contenu
Samenvatting stof Klassieke Statistische Methoden
Hoofdstuk 19: interference about a population proportion
Wanneer het gaat om het bestuderen van categorische variabelen.
Het schatten van één populatieproportie middels een steekproefproportie.
Het vergelijken van twee populatieproporties komt in hoofdstuk 20 aan de orde.
We gaan weer uit van de steekproefverdeling, maar dan voor proporties.
De steekproefverdeling van p̂
X = random variabele, is een telling van de voorvallen van een categorische variabele in een bepaald aantal
𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑒𝑛 𝑖𝑛 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓 𝑋
observaties. Bij n voorvallen is de steekproefproportie: p̂ = =
𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓𝑔𝑟𝑜𝑜𝑡𝑡𝑒 𝑛
De steekproevenverdeling van de steekproefproportie bij een categorische variabele werkt op dezelfde manier
als de steekproevenverdeling van x̄: je neemt een grote steekproefgrootte en veel steekproeven →
steekproevenverdeling van de steekproefproportie.
- Het gemiddelde van de steekproefverdeling is p (daadwerkelijke proportie). Daarom is p̂ een zuivere
schatter van p.
- De standaarddeviatie is √𝑝(1 − 𝑝)/𝑛. Dit geldt alleen wanneer de populatie veel (minstens 20 keer)
groter is dan de steekproef. De standaarddeviatie wordt kleiner met de snelheid van √𝑛. Als we de
standaarddeviatie met 10 willen verkleinen hebben 100 keer zo veel observaties nodig.
- Als de steekproefgrootte toeneemt wordt de steekproefverdeling bij benadering normaal (geen
normale benadering gebruiken wanneer de steekproef klein is). Deze is het minst accuraat wanneer p
dicht bij 0 of 1 ligt (dan zijn grotere steekproeven nodig) als je normaal wil benaderen.
- Hoe groter de steekproefgrootte, hoe kleiner de spreiding, hoe dichter bij p.
Voorwaarden voor inferentie van een proportie:
- We hebben een SRS uit de populatie;
- De steekproefgrootte n is groot genoeg om zeker te zijn dat de steekproefverdeling van p̂ dicht bij
normaal ligt;
- De populatie is vele malen groter dan de steekproef (is bijna altijd zo).
Betrouwbaarheidsintervallen voor een proportie bij grote steekproeven
Betrouwbaarheidsinterval = p̂ ± foutmarge
Foutmarge m = kritische waarde × SE
We weten p niet. We gebruiken de standaardfout van p̂ .
Dit is alleen te gebruiken als zowel het aantal successen als het aantal mislukkingen minimaal 15 zijn.
We gebruiken hier dus kritieke z-scores en gaan niet uit van de t-verdeling (wat we wel doen wanneer we
inferentie willen doen van een gemiddelde waarbij de populatiestandaarddeviatie onbekend is).
,Voorbeeld:
Successen en mislukkingen zijn beiden groter dan 15.
p̂ = 0.27
n = 1921
0.27(1−0.27)
SEp̂ = √ = 0.01
1921
Z* voor een 95% BHI is 1.96 (tabel C).
m = 1.96 × 0.01 = 0.02
95% BHI voor p: p̂ ± m = 0.27 ± 0.02 = 0.25-0.29
Hiermee kunnen we zeggen dat we 95% zeker zijn dat de ware populatieproportie ergens tussen 0.25% en
0.29% ligt.
Liever niet afronden tussendoor, afronden op 4 decimalen in de meeste gevallen.
Bekijk ook altijd of er sprake is van non-respons en of dit tot bias leidt.
Meer accurate berekening van het betrouwbaarheidsinterval voor een proportie
Hier volgt een accurater betrouwbaarheidsinterval voor een proportie. In principe moet je deze altijd
gebruiken, maar je kunt het eens tegenkomen dat de manier voor grote steekproeven, zoals hierboven
beschreven, gebruikt is.
Dit noemen we de plus vier methode. Er worden 4 waarnemingen bij opgeteld, waarvan 2 successen en 2
mislukkingen. De plus vier schatter van p bereken je als volgt:
𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑒𝑛 𝑖𝑛 𝑑𝑒 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓+2
p~ =
𝑛+4
Het betrouwbaarheidsinterval is precies hetzelfde, maar dan met de nieuwe steekproefgrootte en het nieuwe
aantal successen. Dus hiermee het BHI voor grote steekproeven gebruiken.
Je kunt dit gebruiken bij minimaal een 90% BHI en een minimale steekproefgrootte van 10. Het aantal
successen en mislukkingen maakt niet uit.
De plus vier methode is accurater omdat deze ervoor zorgt dat de geschatte proportie p̂ dichter naar 0.5
getrokken wordt en weg van 0 of 1 (welke dichterbij ligt).
𝑝~(1−𝑝~)
De SE wordt dan: √
(𝑛+4)
Het kiezen van de steekproefgrootte
Op deze manier zowel voor de methode van grote steekproeven als de plus vier methode.
Steekproefgrootte kiezen voor een gewenste foutmarge (je wil bijv. een 95% BHI):
𝑧∗ 2
n = ( ) p* (1-p*)
𝑚
z* is de kritische waarde voor het niveau BHI dat we willen.
𝑝̂(1−𝑝̂)
m = z* √ → er wordt meestal dus gegeven hoe groot de m maximaal mag zijn, deze vul je dan in
𝑛
bovenstaande formule in. De m ligt altijd ver onder de 1.
,We hebben om n te berekenen dus vooraf een geschatte waarde van p̂ nodig (p*), omdat we die voor het
kiezen van de steekproef dus nog niet weten. Dit kan op de volgende manieren:
- Gebruik p* = 0.5, m is het grootst wanneer p̂ = 0.5, dus bij iedere andere waarde van p̂ zullen we een
kleinere m krijgen dan gepland. Dit kun je doen wanneer je verwacht dat p̂ ergens tussen 0.3 en 0.7 zal
liggen.
- Kies een schatting op basis van een pilotstudie of een voorgaande ervaring met vergelijkbare studies.
Doe dit wanneer je verwacht dat p̂ onder 0.3 of boven 0.7 zal liggen. Anders zul je een veel grotere n
krijgen dan je eigenlijk nodig hebt als je dan p* = 0.5 gebruikt.
Voorbeeld:
Je wil weten hoe groot de sample moet zijn om een m=0.04 (4%) en 95% betrouwbaarheid te krijgen. Je
verwacht dat p̂ tussen 0.3 en 0.7 zal liggen, dus gebruikt p* = 0.5
1.96 2
Dit geeft: n = ( ) (0.5)(1 - 0.5) = 600.25 → altijd naar boven afronden dus n = 601.
0.04
Hoe kleiner je de m wilt, hoe groter je steekproef moet zijn. Let wel op dat de populatie een stuk groter moet
zijn dan je steekproef.
Hypothesetoets voor een proportie
Wanneer H0 waar is, is de steekproefverdeling voor p̂ ongeveer normaal verdeeld met p0 in het centrum en
standaarddeviatie √𝑝0(1 − 𝑝0)/𝑛
De toets statistiek voor H0: p = p0 is de steekproefproportie p̂ gestandaardiseerd door gebruik te maken van de
waarde onder p0 (omdat H0 ons een hypothetische waarde geeft hoeven hier verder geen aanpassingen
gedaan te worden):
̂−p0
p
z=
√𝑝0(1−𝑝0)
𝑛
De z-waarde is ongeveer normaal verdeeld wanneer H0 waar is. De p-waarde kun je als volgt weer aflezen in
tabel B.
Toets stappen:
- Neem een SRS uit een grote populatie met onbekende proportie van successen.
- Neem H0: p = p0
̂ −p0
p
- Bereken de z-waarde: z =
√𝑝0(1−𝑝0)
𝑛
- De p-waarde van een toets van H0 tegen:
Ha: p > p0 is P(Z ≥ z)
Ha: p < p0 is P(Z ≤ z)
Ha: p ≠ p0 is 2P(Z ≥ |z|)
Gebruik deze toets wanneer n is zo groot dat np0 en n(1-p0) gelijk of groter zijn dan 10.
Dit zijn de verwachte successen en mislukkingen wanneer H0 waar is.
Voorbeeld:
N=20
H0: p = 0.5, Ha: p > 0.5
p̂ = 0.95
p-waarde: dit is het gebied rechts van z = 4.025. Normalcdf (4.025, 1e99, 0, 1) = 2.85e-5, wat ongeveer
neerkomt op 0.00003. Tabel C vertelt alleen dat P kleiner is dan 0.0005 omdat z = 4.025 groter is dan de
grootste kritische waarde 3.291 in de rij met de z-waardes.
Hoofdstuk 20: het vergelijken van twee proporties
Het vergelijken van de proporties van successen in twee populaties bij categorische variabelen.
We vergelijken de populaties middels inferentie over het verschil p1-p2, deze schatten we met p̂ 1- p̂ 2.
De steekproefverdeling van een verschil tussen proporties
- Wanneer de steekproeven groot zijn is de verdeling van p̂ 1- p̂ 2 ongeveer normaal verdeeld.
- Het gemiddelde van de steekproefverdeling van p̂ 1- p̂ 2 is p1-p2. Dat betekent dat de het verschil
tussen de steekproefproporties een zuivere schatter is voor het verschil tussen de
populatieproporties.
𝑃1 (1−𝑃1 ) 𝑃2 (1−𝑝2 )
- De standaarddeviatie van de steekproefverdeling: √ +
𝑛1 𝑛2
Betrouwbaarheidsinterval voor grote steekproeven voor het vergelijken van proporties
De bovenstaande standaarddeviatie bevat de onbekende parameters p1 en p2. Deze moeten we vervangen
met de schatters. We kunnen deze vervangen voor de steekproefproporties, zo krijgen we de standaardfout
van de statistiek p̂ 1- p̂ 2:
p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
SE = √ +
𝑛1 𝑛2
Het betrouwbaarheidsinterval bereken je weer op dezelfde manier als in het vorige hoofdstuk:
(p̂ 1 - p̂ 2) ± z*SE
Gebruik dit alleen wanneer het aantal successen en het aantal mislukkingen in beide groepen minimaal 10 is.
95% BHI voor p1 – p2 : 0.0983 ± 0.0734 = 0.0249 tot 0.1717
We zijn voor 95% zeker dat het percentage [successen] in groep 1 tussen de 0.0249% en 0.1717% (of 2 en 17
procentpunten) hoger ligt dan het percentage [successen] in groep 2.
Accuratere betrouwbaarheidsintervallen voor het vergelijken van proporties
Plus vier betrouwbaarheidsinterval: voeg vier fictieve observaties toe, één succes en één mislukking in beide
steekproeven. Bereken met deze nieuwe waarden het betrouwbaarheidsinterval volgens de grote
steekproeven methode. Gebruik dit wanneer de steekproefgrootte van beide groepen minimaal 5 is. Het aantal
successen of mislukkingen maakt niet uit.
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur aloeffen. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €6,49. Vous n'êtes lié à rien après votre achat.