LES 1 (H1 & H2.1-2.5 & H2.8.1)
HOOFDSTUK 2
Vorm van vertekening die ontstaat doordat de analyse op een niet-
SELECTIE BIAS representatieve groep subjecten wordt uitgevoerd en de resultaten daardoor
systematisch afwijken van wat men voor de studiepopulatie zou bekomen
hebben.
Ontbrekende gegevens
MISSING DATA
Reeks observaties die gemaakt worden onder conditites
EXPERIMENT
Bijzonder type experiment met als doel medische behandelingen te testen bij
KLINISCHE STUDIE mensen
Reeks observaties die gemaakt worden zonder tussenkomst van een
OBSERVATIONELE onderzoeker. De onderzoeker doet niets om de mogelijke uitkomsten te
beïnvloeden, maar observeert enkel de huidige praktijk
STUDIE
Studies mét controlegroep (om effect van een interventie te bepalen moet
GECONTROLEERDE men respons vergelijken tussen test-en controlegroep)
STUDIES
Bepaalde karakteristiek gemeten wordt bij een groep individuen, die
PRE-TEST/POST-TEST vervolgens onderworpen worden aan een zekere behandeling of interventie,
en bij wie diezelfde karakteristiek tenslotten opnieuw gemeten wordt.
STUDIES (metingen na behandeling vergelijken met die van voor behandeling)
Nadeel: geen controlegroep
terugkeer naar een evenwicht vanuit een extreme waarde
REGRESSION-TO-THE- (bv. Bekendheid aids neemt sws toe met tijd (ondanks extra campagne))
MEAN
Bij onderzoek naar het effect van een zekere blootstelling op een zekere
CONFOUNDER uitkomst is een confounder een variabele die geassocieerd is met de
blootstelling en de uitkomst, maar door geen van beiden zelf beïnvloed wordt.
(kan vermeden worden door randomnisatie)
(=VERWARRING)
Het verwachte aantal nieuwe gevallen van die ziekte dat optreedt gedurende
INCIDENTIE een vooraf bepaald tijdsinterval, uitgedrukt per eenheid van een ziektevrije
populatie
De proportie individuen met de ziekte in een bepaalde populatie op een
PREVALENTIE bepaald punt in de tijd
2 groepen vergelijken op een zelfde moment in de tijd
PARALLELLE STUDIE
Experiment waarbij de toewijzing van subjecten aan de verschillende
GERANDOMNISEERDE interventiegroepen of -armen volledig lukraak gebeurt zodat de toewijzing van
een gegeven subjects onmogelijk op voorhand voorspeld kan worden
STUDIE (50%-50%)
De reden om niet deel te nemen aan de studie verschillend is voor de test- en
DIFFERENTIËLE controlegroep
(als dit optreedt NA randomnisatie -> geen vergelijkbare groepen meer
UITVAL garanderen)
, Noch arts, noch patiënt weet welke behandeling wordt toegediend
DUBBEL BLIND
Enkel de patiënt weet niet welke behandeling wordt toegdiend
ENKEL ( SINGLE )
BLIND
Zowel patiënt als arts weten welke behandeling wordt toegediend
OPEN LABEL
= louter toevallige allocatie
SYSTEMISCHE Toewijzingsmethode die mogelijks op een lukraak mechanisme lijkt, maar
waarbij men de toewijzing van patiënten op voorhand kan voorspellen
ALLOCATIE
Patiënten lukraak toegewezen aan behandeling A of B door het opgooien van
(1) EENVOUDIGE een muntje, dobbelsteen,… (computer)
- Nadeel? -> beide groepen niet noodzakelijk even groot
RANDOMNISATIE
= beperkte randomnisatie
(2) GEBALANCEERDE Gelijke aantallen patiënten worden toegewezen aan behandeling A of B per
blok van bijvoorbeeld 4 patiënten (bv. AABB, ABAB,BAAB,…)
RANDOMNISATIE - Voordeel? -> gelijke aantallen in elke groep
Gebalanceerde randomnisatie die afzonderlijk wordt uitgevoerd per groep
(3) patiënten met gelijkaardige prognostische factoren (bv. Uit hetzelfde medisch
centrum)
GESTRATIFICEERDE -> zo prognostische factoren niet per toeval ongelijk verdeeld
RANDOMNISATIE -> door toeval kan gebrek van vergelijkbaarheid -> minder nauwkeurig
Variabele die geassocieerd is met de bestudeerde uitkomst. Een confounder is
PROGNOSTISCHE dus in het bijzonder een prognostische factor die ook met de bestudeerde
blootstelling of behandeling geassocieerd is
FACTOR
= gestratificeerde randomnisatie
GERANDOMNISEERD
COMPLEET BLOK
DESIGN
Idee dat alle patiënten die in een gerandomniseerde klinische studie
INTENTION-TO-TREAT gerandomniseerd werden, moeten geanalyseerd worden volgens de
behandelingsgroep waaraan ze toegewezen zijn, ongeacht of ze aan de
toelatingsvoorwaarden tot de sutie voldeden, ongeacht of ze ermee gestop
zijn,…
-> levert geen antwoord op de vraag “wat zou het behandelingseffect zijn bij
perfecte therapietrouw?”
Fenomeen waarbij de meest zieke mensen snelst geneigd zijn om de
SICK STOPPER EFFECT behandeling te stoppen (<-> healthy user effect)
,
,LES 2 (H2.8.2-2.11 & H4.1-4.2.2)
HOOFDSTUK 2
= prospectieve, longitudinale studie
COHORT STUDIE Studie waarbij men start met een groep of cohort individuen die vrij zijn van
coronaire hartziekten en vervolgens worden opgevolgd
Bv. vitE en voorkomen van coronaire hartziekte op 1 ogenblik simultaan gemeten
CROSS-
SECTIONELE
STUDIE
Fenomeen waarbij de richting van de oorzaak-gevolg relatie die men uit de
REVERSE gegevens denkt te zien tegen de verwachting ingaat
(bv. Leeftijd heeft effect op lengte -> lengte heeft effect op sterfte, en dus leeftijd)
CAUSALITY
= per groep
PER STRATUM
Corrigeren kan een associatie van richting doen veranderen
SIMPSON’S (relaties tussen percentages kunnen omkeren naarmate men ze al dan niet in
subgroepen bekijkt)
PARADOX
= case-control studie of case-referent studie
RETROSPECTIEVE Observationele studies waarin men de associatie tussen een blootstelling en een
bepaalde aandoening bepaalt door eerst een groep subjecten met de aandoening
STUDIE en een groep subjecten zonder de aandoening te identificeren en vervolgens op te
(2 types (A&B)) sporen welke blootstelling ze in het verleden ondervonden hebben
-> nadeel? -> gevoelig aan confounding en recall bias
= cross table
KRUISTABEL
Controlegroep = goedgekozen steekproef uit de populatie individuen zonder de
A.NIET- aandoening
GEMATCHTE
CASE -CONTROLE (wij bestuderen enkel deze)
STUDIES
Zoekt men voor elke case 1 of meerdere controlesubjecten die vergelijkbaar zijn
B.GEMATCHTE met de case in termen van belangrijke prognostische variabelen voor de
bestudeerde aandoening, zoals leeftijd en geslacht
CASE -CONTROLE
STUDIES -> elke case is nu beter vergelijkbaar met zijn/haar controle
treedt op als respondenten worden gevraagd zich gebeurtenissen uit het verleden
RECALL BIAS te herinneren (en het eigenlijk mss niet goed meer weten)
,HOOFDSTUK 4
Soms van de observaties gedeeld door het aantal n
(REKENKUNDIG) -> voordeel? -> blijft relatief stabiel bij nieuwe, even grote steekproeven
(= meer precieze samenvattingsmaat)
GEMIDDELDE -> nadeel? -> zeer gevoelig voor outliers (drm enkel interessant bij +/-
symmetrisch…)
In R: mean(x)
= 50% percentiel = 50% kwantiel = x50
MEDIAAN -> voordeel? -> (bijna) niet gevoelig voor outliers
In R: median(x)
De modus van een reeks observaties is de waarde die het meest frequent is, of
MODUS wanneer de gegevens gegroepeerd worden, de klasse met de hoogste frequentie
(niet vaak gebruikt)
= niet-symmetrische verdeling
SCHEVE VERDELING -> rechtsscheef -> waarden lopen meer uit nr R, gemidd. > mediaan
-> linksscheef -> waarden lopen meer uit nr L, gemidd. < mediaan
in scheve situaties zal de log-
GEOMETRISCH transformatie de scheefheid
wegnemen. Geom. Gemidd. Ligt
GEMIDDELDE dan dichter bij mediaan dan gwn
gemidd.
= afstand tussen 1ste en 3de kwartiel = IQR = X75 – X25
INTERWARTIEL
Bv. 3-19 (= x25 – x75)
AFSTAND (RANGE) Betekent voor 25% diagnose 3j of minder lang geleden, voor 50% tussen 3j en 19j,
voor 25% langer dan 19j geleden
CATEGORISCHE Beschrijven we als aantallen (%)
GEGEVENS
Beschrijven we als:
CONTINUE -> gemiddelde +/- standaarddeviatie indien symmetrisch
-> mediaan (IQR) indien scheef
GEGEVENS -> geometrisch gemiddelde indien symmetrisch op log-schaal
1sd = 68%
STANDAARDEVIATI 2sd = 95%
3sd = 99,7%
E
X25
25% PERCENTIEL Minstens 25% van die waarnemingen kleiner of gelijk zijn aan X 25 en minstens 75%
van die waarnemingen groter of gelijk zijn aan X25
X75
75% PERCENTIEL Minstens 75% kleiner of gelijk zijn aan X 75 en minstens 25% van die
waarnemingen groter of gelijk zijn aan X75
,LES 3 (H4.2.3-4.5 & H5.1-5.3)
HOOFDSTUK 4
VARIANTIE
= S2
In R: var(x)
= standaardafwijking
STANDAARDEVIATIE handiger om mee te werken dan variantie
(met 68% en 95% referentie-intervallen (geldt
enkel als normaal verdeeld (=symmetrisch))
In R: sd(x)
geen eenheid
VARIATIECOËFFICIËNT ongevoelig voor herschaling van de gegevens
DECENTIEL X10 In R: qnorm(0.10)
Verschil tussen de grootste en kleinste geobserveerde waarde
BEREIK (RANGE)
Hoe groter n, hoe groter het bereik dat men mag verwachten
= normale dichtheidsfunctie (normaal verdeelde observatie)
NORMALE CURVE
µ = gemiddelde
σ = standaarddeviatie
= Standaardnormale dichtheidscurve
STANDAARDNORMAL
Als het gemiddelde 0 is en de standaarddeviatie 1 is
E CURVE
Cursus p.82
KANSBEREKENING
Functie die voor elk getal x uitdrukt wat de kans is dat een lukrake meting X
DISTRIBUTIEFUNCTIE met gekende verdeling kleiner of gelijk is aan x
In R: pnorm(x,mu,sd) (of indien kans erboven ligt: 1-pnorm(…))
Linkergrens in R: qnorm(alpha/2,mu,sd)
Rechtergrens in R: qnorm(alpha/2,mu,sd)
Welk percentage valt binnen 1.5sd’s van gemiddelde?
In R: Pnorm(1.5)-pnorm(-1.5)
(1-α)100% referentie-interval of predictie-interval zo gekozen dat het met
REFERENTIE- (1-α)100% kans de observatie voor een lukraak individu uit die populatie
bevat
INTERVAL
Cursus p.85
FALSE POSITIVE/
NEGATIVE RISK
, = gemiddelde verschillen worden berekend op basis van ‘vergelijkbare’
ADJUSTED MEAN patiënten
DIFFERENCE
met Sx en Sy de
PEARSON standaarddeviatie van de rij
getallen x en y
CORRELATIE
correlatie = 0? -> x en y onafhankelijk van elkaar
correlatie tussen -1 en 1 (maar niet 0)? -> x en y NIET onafhankelijk van elkaar
In R: cor(…)
Het relatief risico op die gebeurtenis voor populatie T versus C wordt met RR
RELATIEF RISICO genoteerd en gedefinieerd als
RR = pT/pC
RR van 1 betekent dat gebeurtenis evenveel kans op voorkomen heeft in beide
populaties
Bv. RR=1.2 -> risico op A is relatief gezien 20% hoger dan risico op B
(cursus p.96)
Het absoluut risico op die gebeurtenis voor populatie T versus C wordt met
ABSOLUUT RISICO ARV genoteerd en gedefinieerd als het verschil
ARV= pT – pC
ARV van 0 drukt uit dat gebeurtenis evenveel kans op voorkomen heeft in
beide populaties
Aangeraden: ofwel 2 risico’s pT en pC afzonderlijk rapporteren ofwel relatief
risico als het absoluut risicoverschil te rapporteren
‘procentpunt’ is steeds een verwijzing naar een absoluut risicoverschil
Het NNT voor die gebeurtenis voor populatie T versus C wordt gedefinieerd als
NUMBER NEEDED TO het omgekeerde van de absolute waarde van het absolute risicoverschil
TREAT = hoeveel patiënten men verwacht te moeten behandelen in elke groep opdat
er 1 succes meer zou geobserveerd worden op de experimentele arm dan op
de controle arm
Fractie van de individuen met de aandoening in de populatie die zouden
POPULATION verdwijnen indien de risicofactor verdween
ATTRIBUTABLE RISK AR = (p-pC) / p (Cursus p.99)
Odds op een gebeurtenis wordt gedefinieerd als
ODDS P / (1-p) (waarbij p de kans is op die gebeurtenis)
-> waarde tussen 0 en oneindig, odds=1 dan is kans ½, odds neemt toe als de
kans toeneemt
Bv. Odds op winnen gelijk aan 0,9 betekent dat per 10 verliesbeurten, 9
winstbeurten verwacht worden
odds ratio = 1 drukt uit dat de
ODDS RATIO gebeurtenis evenveel kans op
voorkomen heeft in beide
populaties
meestal is RR = vkw OR
, Dwz dat de studie typisch individuen zal omvatten voor wie de kritische
RECHTS- gebeurtenis (bv.sterfte) nog niet heeft plaatsgevonden op het einde van de
studie, of voor wie dat alvast niet geobserveerd werd
GECENSUREERD -> als overlevingstijden gecensureerd zijn moet analyse daarmee rekening
houden!
Drukt effect uit op kans dat bepaalde gebeurtenis zich voordoet tegen
KAPLAN-MEIER bepaalde tijd
CURVE
= aantal mensen dat nog in de studie zit
NO. AT RISK (en nog geen 1e terugval heeft gehad of uit studie zijn)
Als op tijdstip t>0 de deelnemers die de studie op dat ogenblik verlaten en bij
NIET-INFORMATIEVE wie de gebeurtenis nog niet heeft plaatsgevonden vergelijkbaar zijn met de
deelnemers die de studie op dat ogenblik niet verlaten en bij wie de
CENSURERING bestudeerde gebeurtenis eveneens nog niet heeft plaatsgevonden
Drukt effect uit op korte termijn risico
HAZARD RATIO (HR)
Hazard op gebeurtenis = risico dat gebeurtenis zich
op bepaald tijdstip voordoet voor iemand die die
gebeurtenis nog niet voor had
Hazard ratio = verhouding van hazards tussen 2 groepen
Administratief -> studie wordt stopgezet
CENSURERING Gevolg van drop-out
Gevolg van competing events (bv. Sterfte)
HOOFDSTUK 5
REPRESENTATIEF = veralgemeenbaar naar een ruime patiëntenpopulatie
VARIABEL = door toeval doorgaans andere resultaten zou vinden indien men een
andere, vergelijkbare groep proefpersonen zou analyseren
VERTEKEND = systematisch (gemiddeld) te hoog
= feit dat herhalen van het experiment tot andere resultaten leidt
IMPRECISIE = mate waarmee de schatter varieert van steekproef tot steekproef
Oplossen? -> meer homogene populatie OF grotere steekproef nemen
STEEKPROEF = de metingen die we in een studie verzameld hebben, met in begrip van
wie en wanneer
POPULATIE = theoretisch concept, betreft alle metingen die we in de meest ideale
studie zouden verzamelen
STEEKPROEFGEMIDDELD
E
POPULATIEGEMIDDELDE µ
,STEEKPROEFVARIANTIE
POPULATIEVARIANTIE σ2
Als het gemiddelde van die oneindig vele schattingen gelijk is aan (theta),
ONVERTEKENDE dan zeggen we dat (theta^) een onvertekende schatter voor (theta) is.
-> minimale voorwaarde: vertrekken van lukrake steekproef
SCHATTERS
Een vertekende schatter voor (theta) wijkt systematisch af van (theta) in
die zin dat ze gemiddeld te hoog of te laag uitkomt.
In R: sample(1:100,5) (bv)
EENVOUDIGE LUKRAKE
STEEKPROEF
, LES 4 (H5.3.2-5.5)
HOOFDSTUK 5
De standaarddeviatie van een schatter, dewelke
STANDAARD ERROR uitdrukt in welke mate deze schatter varieert
van steekproef tot steekproef
-> enkel te bepalen als studie herhaald wordt
-> grote SE? -> resultaat moeilijk te reproduceren
In R: sd(…) / sqrt(n)
De SD op de observaties is een maat voor de variabiliteit tussen individuen
SE VS SD met betrekking tot een bepaalde meetwaarde. De SE van een schatter
meet de onzekerheid in die schatter voor een bepaalde parameter, of nog,
de mate waarin die schatter varieert van steekproef tot steekproef
Als de gegevens onderling onafhankelijk en normaal verdeeld zijn met
95% gemiddelde mu, dan bevat het interval
BETROUWBAARHEIDS-
INTERVAL VOOR HET
met 95% kans het populatiegemiddelde mu
GEMIDDELDE -> 95% = betrouwbaarheidsniveau
-> steekproef groot? -> 1.96 (voor n klein -> grotere waarde dan 1.96)
Hoe tn-1,alpha/2 berekenen? -> In R: qt(0,975;n-1)
Algemeen:
Hoe breder BI? -> meer onzekerheid over waar populatiegemiddelde zich
bevindt
Lengte bepaald door 3 factoren:
1) Naarmate steekproef toeneemt, krimpt BI
2) Naarmate standaarddeviatie van de oorspr. Observaties
toeneemt, neemt lengte BI toe
3) Naarmate betrouwbaarheidsniveau toeneemt, BI langer