Notities: Biostatistiek professor Molenberghs
Notities: Biostatistiek ................................................................................................................ 1
Chapter 3: What is statistics? ................................................................................................ 6
3.1 Example: captopril data ............................................................................................... 6
3.2 Population versus random sample ............................................................................... 8
3.3 The aim of statistics...................................................................................................... 9
Chapter 4: Summary statistics ............................................................................................... 9
4.1 Introduction ................................................................................................................. 9
4.2 Measures of location .................................................................................................... 9
4.3 Measures of spread .................................................................................................... 10
4.4 Percentages ................................................................................................................ 11
4.5 Example from the biomedical literature .................................................................... 12
Chapter 5: Confidence intervals & hypothesis testing ......................................................... 12
5.1 Random variability ..................................................................................................... 12
5.2 The confidence interval .............................................................................................. 12
5.3 Interpretation of the confidence interval .................................................................. 13
5.4 Hypothesis testing ...................................................................................................... 13
5.5 Hypothesis testing versus confidence intervals ......................................................... 14
5.6 Example from the biomedical literature .................................................................... 14
Chapter 6: Use and misuse of statistics ............................................................................... 14
6.1 Possible errors in decision making ............................................................................. 14
6.2 Two types of errors .................................................................................................... 15
6.3 Multiple testing .......................................................................................................... 16
6.3.1 Example: A classroom experiment ...................................................................... 16
6.3.2 Example: Testing many relations ......................................................................... 16
6.3.3 Example: Subgroup analyses ............................................................................... 16
6.3.4 Example: Searching for the most significant results ............................................ 16
6.3.5 Conclusion ........................................................................................................... 17
7.2 Multivariate AnalysisDIA 87 ....................................................................................... 21
7.3 General Multivariate Setting ...................................................................................... 22
7.5 Longitudinal Data: The Vorozole Study ...................................................................... 23
8.1 Contingency Tables .................................................................................................... 25
8.7 Validity of the Approximation .................................................................................... 30
8.8 Confidence Interval for the Difference....................................................................... 30
1
, 8.9 Overview .................................................................................................................... 31
8.10 Extension Requested!............................................................................................... 32
8.12 Analysis of Example 1 ............................................................................................... 33
8.13 Example 3: pre-clinical test ...................................................................................... 34
8.14 X^2 test versus Fisher’s exact test............................................................................ 34
8.15 Estimator for the Association ................................................................................... 34
8.16 R x C Contingency Tables .......................................................................................... 35
8.17 Example 5 ................................................................................................................. 35
8.18 Example 6 ................................................................................................................. 35
8.19 Several 2 x 2 Tables .................................................................................................. 35
8.20 Example 7 ................................................................................................................. 36
8.21 Mantel-Haenszel Statistic ......................................................................................... 36
8.22 Analysis of Example 7 ............................................................................................... 36
8.23 Omitting the Stratifying Variable ............................................................................. 37
8.24 Matched Pairs: McNemar’s Test .............................................................................. 37
8.24.1 Example 8 .......................................................................................................... 37
8.25 Independent Allergy Tests........................................................................................ 38
Chapter 9: Comparing Groups with Continuous Outcomes: the t-test................................ 39
9.1 Example: Captopril data ............................................................................................. 39
9.2 Difference in DBP ....................................................................................................... 39
9.3 Two-sample t-test ...................................................................................................... 40
9.4 Paired t-test ................................................................................................................ 41
9.5 t-tests: Concluding Remarks ....................................................................................... 41
Chapter 10: Introduction ..................................................................................................... 41
10.1 Problem Setting ........................................................................................................ 42
10.2 Sample ...................................................................................................................... 42
10.3 Data Collected .......................................................................................................... 42
10.3.1 Pre-operative Evaluation ................................................................................... 42
Chapter 11: Simple (Single) Linear Regression .................................................................... 43
11.1 Introduction ............................................................................................................. 43
11.2 The Least Squares Method ....................................................................................... 43
11.3 Illustration + Interpretation...................................................................................... 44
11.4 Statistical Inference .................................................................................................. 45
11.4.1 Introduction ....................................................................................................... 45
11.4.2 The simple linear regression model ................................................................... 46
2
, 11.4.3 Significance tests for ......................................................................................... 47
11.4.4 The ANOVA table ............................................................................................... 48
11.4.5 Illustration + Interpretation ............................................................................... 50
Chapter 12: Model Diagnostics ........................................................................................ 50
12.1 Example .................................................................................................................... 51
12.2 Model Assumptions.................................................................................................. 51
12.3 The Assumption of Linearity..................................................................................... 51
12.4 Example: Length of Stay versus ADL......................................................................... 53
12.5 The Assumption of Constant Variance ..................................................................... 53
12.6 Example: Length of Stay versus ADL......................................................................... 54
12.7 The Assumption of Normality .................................................................................. 54
12.7.1 A histogram of residuals .................................................................................... 54
12.7.2 The normality test ............................................................................................. 55
12.7.3 Histogram ó normality test ................................................................................ 55
12.8 Example: Length of Stay versus ADL......................................................................... 55
12.9 General Conclusion .................................................................................................. 56
Chapter 13: Influential Observations ................................................................................... 57
13.1 Example .................................................................................................................... 57
13.2 Cook’s Distance ........................................................................................................ 59
13.3 Application ............................................................................................................... 59
13.4 What to Do With Influential Subjects? ..................................................................... 60
Chapter 14: 1-way ANOVA ................................................................................................... 61
14.1 Example .................................................................................................................... 61
14.2 Pairwise t-tests ......................................................................................................... 62
14.3 1-way ANOVA ........................................................................................................... 64
14.4 Illustration ................................................................................................................ 66
14.5 Model Diagnostics .................................................................................................... 66
14.5.1 Assumption of constant variance ...................................................................... 66
14.5.2 Assumption of Normality ................................................................................... 67
14.6 Influential Observations ........................................................................................... 68
Chapter 15: Logistic Regression ........................................................................................... 69
15.1 A Proportion ............................................................................................................. 69
15.2 Formulation of Logistic Regression .......................................................................... 69
15.2.1 Effect of a Covariate x ........................................................................................ 70
15.2.2 Odds Ratio ......................................................................................................... 70
3
, 15.2.3 General Form Of Logistic Model............................................................................ 70
15.2.4 Odds Ratio ......................................................................................................... 71
15.2.5 The Covariates x? ............................................................................................... 71
Chapter 16: Use of Logistic Regression ................................................................................ 71
16.1 Possible Settings ....................................................................................................... 72
16.2 Effect of Stratum ...................................................................................................... 72
16.2.1 Stratum as Covariate ......................................................................................... 73
16.3 Several Strata ........................................................................................................... 74
16.4 Stratum Efffect: General Situation ........................................................................... 74
16.5 Prospective ó Retrospective ..................................................................................... 75
16.6 Retrospective Logistic Regression ............................................................................ 75
16.7 Analogy: 2 x 2 tables................................................................................................. 75
Chapter 17: Case Study: Ille- et- Villaine .............................................................................. 75
17.1 Ille- et- Villaine Study ............................................................................................... 75
17.2 The Data for a Single Binary Exposure ..................................................................... 75
17.3 The Data ................................................................................................................... 76
17.4 Modeling a Single Binary Exposure .......................................................................... 76
17.4.1 Degrees of Freedom .......................................................................................... 76
17.4.2 Model 0.............................................................................................................. 76
17.4.3 Model 1.............................................................................................................. 77
17.4.4 Model 2.............................................................................................................. 77
17.4.5 Model 3.............................................................................................................. 78
17.4.6 Model ................................................................................................................ 78
17.4.7 Summary ............................................................................................................ 78
17.5 Residuals .................................................................................................................. 78
17.5.1 Values for the Example ...................................................................................... 79
17.6 Qualitative Analysis .................................................................................................. 79
17.6.1 Degrees of Freedom .......................................................................................... 79
17.6.2 Alcohol ............................................................................................................... 79
17.6.3 Steps .................................................................................................................. 80
17.6.4 Modeling ............................................................................................................ 80
17.6.5 Model Fit............................................................................................................ 80
17.6.6 Comparison........................................................................................................ 81
17.6.7 Fitting ................................................................................................................. 81
17.6.8 Comparison........................................................................................................ 81
4
,17.6.9 Model 2.............................................................................................................. 81
17.6.10 Model 4............................................................................................................ 81
17.6.11 Questions ......................................................................................................... 82
5
,PART I: FUNDAMENTAL CONCEPTS
Chapter 3: What is statistics?
DIA 7
• Steekproef is niet de hele populatie
• Een tweede steekproef verschilt vd eerste => wel dezelfde conclusies (is de
bedoeling) => zorgt voor ruis = random variability = randomness= prijs die je moet
betalen omdat je een steekproef neemt uit een grote populatie
• Steekproefgrootte verhogen kan ruis doen verlagen => steekproefgrootte selectie
• Tweede aspect dat tot ruis leidt: zelfs als je de hele populatie ondervraagt => je hebt
de meting => je neemt een correct gemiddelde => bv bloeddruk meten => bloeddruk
schommelt => lezing vd meting ligt dicht bij de werkelijke waarneming, is toch niet
exact gelijk => meetfout
• Meetfout en eindige steekproef (= kleine steekproef) => populatie is oneindig groot
(bv iedereen die vatbaar is voor een bepaalde ziekte, ook kinderen die nog geboren
moeten worden morgen), populatie is onbeperkt, niet makkelijk om een limiet te
plaatsen => je neemt kleinere, beperkte steekproef, eindige steekproef => 2 bronnen
van variabiliteit, ruis
DIA 8
3.1 Example: captopril data
• Steekproef van 15 uit populatie van patiënten met hypertensie
• Populatie moet goed gedefinieerd worden! (bv mensen met hypertensie of gezonde
mensen + definiëren wat hypertensief is & wat niet (eenheden en dergelijke moeten
vermeld worden))
DIA 9
• Metingen die zeer variabel zijn, onderhevig aan schommelingen => grotere
steekproeven nodig om ruis onder controle te krijgen (hoe wilder de ruis hoe meer
variatie tussen de metingen)
• Vrij kleine steekproef (15)
• Voor meting en na meting => voor meting wordt genomen zonder behandeling =>
tussen de twee metingen is behandeling gebeurd => na meting is genomen onder
nieuwe condities => voor en na vergelijken
• Systolische en diastolische bloeddruk heeft 3 informatie stukken => elk info op zich +
feit dat ze samenhangen => een zeker belang in de samenhang tussen de twee =>
diastolisch boven systolisch => kan niet, dan is er iets niet juist => sterke associatie
tussen de 2 => afstand tussen beide is ook van belang => er mag geen te groot
verschil, te klein verschil zijn => afh vd afstand tussen diastolisch en systolisch kan je
weten of het goed is of niet => 3 informaties: waarde van systolisch, diastolisch +
afstand tussen beide waarden (elke meting + samenhang tussen de metingen zijn van
belang)
• 4 metingen => 6 paren kunnen vergeleken worden met elkaar => correlaties kunnen
ook iets zeggen (sys voor en dia achter en omgekeerd hebben ook associatie, maar
6
, niet elk stukje informatie die je verkrijgt moet je gebruiken, kan je iets mee doen, is
nuttig)
• Design = opzet van de studie
• Stel voor groep krijgt placebo, na groep krijgt actieve behandeling => 30 patiënten
worden gebruikt => 2 groepen kan je vergelijken = 2 groepsopzet => veel meer in
gebruik dan vergelijking binnen 1 patiënt (zoals studie is op deze dia) => is
eenvoudiger uit te voeren, er moet minder gecontroleerd worden => een vd zeer
fundamentele principes van het experimenteel gerandomiseerd onderzoek:
willekeurig krijgen 15 patiënten behandeling 1 en 15 behandeling 2 => probleem:
door toevalligheden meer zware gevallen bij 1 en bij 2 => onevenwichten => kan
onder controle gehouden worden door grotere steekproef => toevalligheden wegen
dan minder door
• 15 patiënten willekeurig uit populatie => eerst placebo = nulmeting => dan actieve
behandeling => verschil bekijken => hopen dat het daalt na actieve behandeling => je
bekijkt verschillen binnen 1 patiënt (patiënt 1 heeft zeer hoge bloeddruk, daalt wel
na behandeling, maar nog steeds hoog) => vooral interesse in verschil nulmeting en
actieve behandeling, niet perse in de waardes op zich => voor alle patiënten: eerste
meting – tweede meting = afgeleide waarneming die je gebruikt in statistische
analyses (delta = voor – na) => je hoopt dat de waarde gemiddeld positief is en sterk
verschillend van 0 => dan heb je een duidelijk dalend effect (je verwacht dat de
voormeting hoger is zonder de behandeling) => als het behandeling geen effect heeft
=> je verwacht dat verschil voor en na gelijk is gemiddeld aan 0 = nulhypothese =>
voordeel dit type studies: toevalligheden in patiëntengroep worden uitgeschakeld =>
toevalligheid van een patiënt speelt zowel in voor als na meting = efficiënt design =
efficiënt opzet => zelfde waarde van conclusie bereiken met een kleinere steekproef
=> op basis van gegevens weet je niet of het door de behandeling is dat de bloeddruk
daalt ofdat het natuurlijk is dat de bloeddruk staat => je kan geen statistische
uitspraak doen over waarom de bloeddruk daalt => bloeddruk daling is zeer traag,
kan niet zo snel dalen natuurlijk, maar dit is geen statistische redenering, wel een
medische, epidemiologisch redenering => je hebt achtergrondinformatie nodig om
het resultaat te duiden & een conclusie te maken => toch wordt vaak een
randomisatie uitgevoerd: 10 krijgen placebo, dan actief + 10 patiënten krijgen actief,
dan placabo = cross over design = studie waar je van ene naar andere behandeling
overstapt maar niet voor iedereen in dezelfde volgorde => als er een sterke stijging
blijft in beide gevallen dan kan je de mogelijkheid dat de bloeddruk natuurlijk is
gedaald uitschakelen (van actief naar placebo => fellere stijging van bloeddruk want
behandeling wordt weggenomen) => natuurlijke evolutie in de tijd van bloeddruk en
daling door behandeling kan op deze manier onderscheden worden => maar er is
reversibiliteit nodig => bij veel behandelingen, operaties, ingrepen is er niet altijd een
reversibel effect bv chemotherapie => mogelijke behandelingen moeten in
verschillende volgorde kunnen worden uitgevoerd binnen eenzelfde patiënt, zonder
dat ze elkaar beïnvloeden (carry over) => effect van vorige behandeling mag niet
meer merkbaar zijn wanneer volgende behandeling wordt gestart
• Samengevat: t-toets => binnenin patiënt vergelijking doen => gepaarde waarneming,
paired waarneming => 2 waarnemingen die met elkaar gekoppeld zijn omdat ze in
dezelfde patiënt zijn
7
, DIA 10
• Voormeting is in bijna alle gevallen hoger dan nameting => sommige stijgen, maar
minder snelle dalingen kunnen lijken op stijging, maar dalen in werkelijkheid
• Niet alle patiënten dalen => wil niet zeggen dat experiment gefaald heeft => we
kijken naar populatie, niet naar individuele gevallen => botst met ethiek van arts, arts
is verantwoordelijk voor een bepaalde patiënt => geneesmiddelen werken niet voor
alle patiënten
• Er kan een minderheidsgroep zijn bv door genetisch defect die zich anders gedraagt
=> subgroep isoleren => buiten geneesmiddel houden en zorgen dat behandeling niet
wordt toegepast
• Middel zal niet perfect werken, maar er is niets beter voor handen
• Rode lijnen dalen => er is formeel een daling vastgesteld in de steekproef
DIA 11
• Belangrijke paradigma in statistiek: hoe kunnen we conclusie van de steekproef
vertalen naar de populatie? Kun je de onzekerheid klein genoeg houden?
• Als steekproef klein, niet voldoende representatief is => niet goed => keuze
steekproef is zeer belangrijk => maar je bent nooit in staat om met zekerheid een
uitspraak te doen over de populatie ookal heb je een goede steekproef
DIA 12
• Steekproef nemen van patiënten met hypertensie => metingen nemen, bestuderen,
beschrijven => getallen ook toepassen op populatie => voorzichtigheid, omzichtigheid
nodig => schattingsparadigma, toetsingsparadigma => schatten van parameter,
toetsingsparadigma vertelt of er bv een significante daling is => breng je in kaart
3.2 Population versus random sample
DIA 13
• Populatie = groep waarover ik een uitspraak wil doen, is niet altijd even makkelijk te
bereiken
• Steekproefneming = deelgroep uit populatie => hieruit willen we extrapoleren naar
de populatie
• Als we een steekproef hebben => je kan het weggooien en nieuwe nemen => dit kan,
maar wordt in praktijk bijna nooit gedaan => je hoopt dat de conclusies dicht bij
elkaar liggen van de verschillende steekproeven (de afwijking zou zodanig moeten
zijn dat ze medisch niet relevant is)
• Je wilt dat steekproef iets zegt over populatie => steekproef als dusdanig is niet echt
interessant
• Reproduceren = steekproef wordt door iemand geanalyseerd => iemand anders
analyseert & vindt dezelfde getallen => op eerlijke, correcte manier analyse
uitgevoerd
• Reproduceren betekent statistisch nog iets anders: je neemt de steekproef, legt ze
aan de kant, je doet het experiment volledig opnieuw => je hoopt dat je tot
kwalitatief dezelfde conclusies komt => een conclusie dat je kan vertrouwen, dat je
kan toepassen op de volledige populatie
8