TDAT
LES
4
(
2015
–
2016
)
Lesnotities
Hoofdstuk
4
:
Mixed
Models
(
1
)
1. Motivatie
Mixed
models
=
recentere
technieken
(
laatste
20
tot
25
jaar
ontwikkeld
)
1.1Hiërarchische
data
Slide
3
:
Kijken
vandaag
naar
hiërarchische
data
!
kan
op
verschillende
manieren
• Herhaalde
metingen
binnen
personen
(
=
within
subject
factoren
)
Dit
kan
al
dan
niet
onder
verschillende
condities
Bv.
BMI
op
verschillende
tijdstippen
bij
dezelfde
personen
Bv.
accuraatheid
van
verschillende
emoties,
binnen
eenzelfde
persoon
meten
• Werken
met
leden
uit
eenzelfde
familie
Hier
gaan
we
ipv
individuen
in
de
steekproef
opnemen,
families
opnemen
en
dan
binnen
die
families
alle
familieleden
opnemen
(
zo
krijg
je
een
hiërarchie
van
familieleden
binnen
een
familie
)
• Verschillende
scholen
samplen
Bv.
kijken
naar
examenresultaten
van
studenten
uit
een
steekproef
van
verschillende
scholen.
Dus
hier
worden
scholen
gesampeld
en
dan
binnen
de
scholen
aparte
leerlingen.
Slide
4
Krijgen
zo
dus
een
hiërarchische
structuur.
Bovenstaande
voorbeelden
=
allen
2-‐level
data
Het
hoogste
niveau
,
bijvoorbeeld
als
je
herhaalde
metingen
hebt,
dan
ga
je
bijvoorbeeld
binnen
pp
1
drie
herhaalde
metingen
doen
(
op
3
tijdstippen
BMI
gaan
meten).
Ook
bij
pp
2
heb
je
die
3
herhaalde
metingen.
Herhaalde
metingen
(
within
subject
factoren
)
• Het
laagste
niveau
(
level
1
)
=
de
momenten
waarop
je
die
metingen
gaat
doen
(
tijdstip
1,2
en
3
)
De
momenten
“tijstip
1
,
2
en
3”
zijn
dus
de
level
1-‐variabelen.
• Het
hoogste
niveau
(
level
2
)
=
de
proefpersonen
zelf
De
proefpersonen
=
level
2-‐variabelen
Ander
voorbeeld
(
bv.
families
)
!
daar
zal
Level
2
=
families
• Laagste
niveau
(
level
1
)
=
aparte
familieleden
• Hoogste
niveau
(
level
2
)
=
de
families.
(
Daarbinnen
heb
je
dan
telkens
enkele
familieleden
en
die
zijn
dan
het
laagste
niveau.
(
PS
:
dit
aantal
kan
variabel
zijn
–
in
de
ene
familie
zal
je
meer
leden
hebben
dan
in
de
andere
)
,Wij
gaan
ons
in
de
cursus
beperken
tot
level
2
structuren
maar
meer
kan
ook
Bijvoorbeeld
:
kijken
naar
tevredenheid
van
werknemers
in
bedrijven
• Level
1
:
werknemers
• Level
2
:
afdelingen
binnen
bedrijven
• Level
3
:
bedrijven
We
zagen
al
dat
als
je
dergelijke
hiërarchische
data
hebt,
dat
we
rekening
moeten
houden
met
de
correlatie
die
we
hebben
binnen
die
hiërarchische
structuur.
• Bv.
verwachten
dat
metingen
binnen
individuen
gecorreleerd
zijn
• Bv.
tevredenheid
van
werknemers
binnen
eenzelfde
afdeling
>
gecorreleerd
dan
uit
verschillende
afdelingen
Slide
5
Hernemen
voorbeeld
vorige
les
:
Als
je
kijkt
naar
evolutie
van
lengte
van
kinderen
en
je
ging
dat
elk
jaar
gaan
meten,
dan
doen
we
daar
herhaalde
metingen
binnen
eenzelfde
kind
(
dus
level
1
=
tijdstippen/
leeftijden
van
metingen
,
level
2
=
verschillende
individuen).
Merk
op
:
maken
wel
de
veronderstelling
dat
die
individuen
op
zich
dan
wel
onafhankelijk
zijn
(
bv.
broer
en
zus
uit
zelfde
klas
mogen
niet
meedoen).
(
de
metingen
binnen
die
persoon
dus
niet
want
het
gaat
om
een
meting
binnen
dezelfde
persoon
)
Veronderstellen
bij
hiërarchische
structuren
onafhankelijkheid
van
level2-‐variabelen
(
hier
onafhankelijkheid
van
verschillende
deelnemers
)
Maar
als
iemand
al
groot
is
op
leeftijd
6
zal
die
ook
groter
zijn
dan
de
rest
op
tijdstip
7
dus
lengtes
binnen
eenzelfde
individu
zullen
wel
gecorreleerd
zijn
(
typisch
voor
within
subject
)
Dit
is
wat
we
met
multi-‐level
modellen
of
mixed
models
gaan
doen
:
Gaan
die
structuur
expliciet
gaan
modelleren.
Die
verschillende
hiërarchische
niveau’s
die
we
hebben.
Reden
:
gaan
rekening
houden
met
de
correlaties
binnen
hiërarchische
structuren.
Dit
kan
dus
gaan
over
herhaalde
metingen,
clusters,
koppels,
bedrijven…
2. Het
random-‐intercept
model
2.1Populariteisvoorbeeld
Slide
6
Kijken
naar
populariteit
bij
schoolkinderen.
Hoe
zouden
we
dit
aanpakken?
!
willen
testen
of
gemiddelde
populariteit
gelijk
is
bij
jongens/meisjes
"
=
Gelijkheid
van
2
gemiddelden
nagaan
(
bv.
onafhankelijke
T-‐test
of
independent
sample
t-‐test)
Reden
:
hebben
onafhankelijke
groep
van
jongens
en
meisjes
(
gaat
niet
over
broers/zusjes
ofzo
)
Dus
normaal
zouden
we
onafhankelijke
t-‐test
doen.
,Slide
7
Descriptieve
analyse
:
data
eens
grafisch
voorstellen
(
boxplot
)
• Links
:
figuur
van
jongens,
rechts
:
meisjes
• Zwarte
lijn
=
mediaan
(
Jongens
:
6,
meisjes
:
7
)
Merk
op
:
bij
meisjes
!
med
(
P50
)
=
P75
hoe
kan
dat
?
Bovenkant
box
=
75e
percentiel.
stel
100
waarnemingen
dan
is
med
=
50e
meting
(
en
p75
is
dan
de
75e
meting).
Als
we
waarden
dan
ordent
van
klein
naar
groot
dan
kan
het
zijn
dat
50e
of
75e
waarneming
hetzelfde
zijn
(bv.
heel
veel
meisjes
die
een
7
geven).
Dan
kan
de
mediaan
of
het
75e
percentiel
gelijk
zijn.
Dit
is
hier
ook
zo.
• Obv
figuur
leiden
we
af
:
med
hoger
bij
meisjes
(
dus
zullen
hogere
score
hebben
denken
we
)
Kunnen
hier
een
independent
samples
t-‐test
op
loslaten.
• Bij
beschrijvende
statistieken
zien
we
de
gemiddelden
binnen
de
2
groepen
(
zien
we
al
dat
die
groter
is
bij
meisjes
dan
bij
jongens
–
met
een
verschil
van
0.5
).
• Bij
de
t-‐test
zelf
:
-‐ Doen
eerst
test
of
varianties
gelijk
zijn
:
is
zo
!
dus
kijken
naar
eerste
lijn
-‐ Besluit
van
de
t-‐test
(
obv
p-‐waarden
of
BTB
interval
)
!
H0
niet
verwerpen.
-‐ H0
was
:
de
gemiddelden
in
de
twee
groepen
zijn
gelijk.
Slide
8
Detail
:
die
81
kinderen
die
deelnamen
zijn
eigenlijk
niet
allemaal
onafhankelijk
van
elkaar.
Want
:
hebben
enkele
klassen
bekeken
(
4
)
!
dus
mogelijk
klas-‐effect
aanwezig
Bv.
klas
met
betere
sfeer
=
iedereen
ervaart
zichzelf
goed
=
hogere
populariteitsscores
!
Hier
houdt
t-‐test
geen
rekening
mee
!
-‐-‐>
hoe
dit
wel
doen?
(volgende
slides)
,Slide
9
en
10
Grafische
voorstelling
:
• X-‐as
:
verschillende
klassen
(
1
tot
4
)
• Y-‐as
:
gemiddelde
populariteitsscore
bij
jongens
(
blauw
)
en
meisjes
(roze)
Bevindingen
hierbij
• In
elke
klas
is
de
gemiddelde
populariteit
bij
de
meisjes
hoger
dan
bij
de
jongens.
• Hoofdeffect
van
Bij
de
ene
klas
is
dit
iets
meer
dan
in
de
andere
klas
maar
we
zien
het
effect
wel
in
elke
klas.
Wat
we
ook
zien
:
zeer
groot
klas-‐effect
!
gemiddelde
populariteit
(klas
1)
>>>
(
klas
2)
2.2Two-‐way
ANOVA
Slide
11
Moeten
dit
in
rekening
brengen
(
klasseneffect
)
!
Hoe
:
kunnen
eigenlijk
een
two-‐way
anova
doen.
We
kunnen
de
volgende
factoren
beschouwen
:
geslacht
(
J/M
)
en
klas
(
1,
2,
3,
4
).
Kunnen
een
two-‐way
anova
doen
met
deze
2
factoren
(
vandaar
two-‐way)
(
in
plaats
van
een
t-‐test
met
enkel
de
factor
geslacht).
Bij
two-‐way
anova
stellen
we
dat
de
uitkomst
(
populariteit
)
voor
de
k-‐de
leerling
uit
de
i-‐de
klas,
die
van
het
j-‐de
geslacht
is
,
dat
die
gelijk
is
aan
een
soort
globaal
gemiddelde
+
..
(
zie
slides)
Eens
we
de
klas
in
rekening
brengen
(
we
controleren
dus
eigenlijk
voor
geslacht
en
klas
in
ons
model
)
mogen
we
dus
wel
veronderstellen
dat
die
residuen
onafhankelijk
zijn
van
elkaar.
Dus
eens
we
binnen
een
klas
kijken
mogen
we
stellen
dat
de
observaties
onafhankelijk
zijn
van
elkaar.
Want
hebben
klaseffect
weggenomen
en
wat
overschiet
(
het
residu
)
mag
onafhankelijk
van
elkaar
verondersteld
worden.
Slide
12
Hoe
gaan
we
dat
nu
gaan
fitten?
!
2
mogelijkheden
:
effect-‐codering
of
dummy-‐codering
Wij
gebruiken
vaak
dummy.
Bij
effect-‐codering
is
mu
het
globale
gemiddelde
(
over
alle
groepen
en
geslachten
heen).
Bij
dummy
is
mu
=
het
gemiddelde
van
de
referentiegroep.
Dummy
:
• Voor
alle
leerlingen
die
in
klas1
zitten,
zal
D1
=
1
(
en
voor
alle
anderen
is
dit
0
)
• Voor
alle
leerlingen
die
in
klas2
zitten,
zal
D2
=
1
…
D1
geeft
dus
het
effect
weer
van
klas
1
tov
het
referentieniveau
(
klas
4
)
D2
geeft
effect
van
klas
2
tov
referentieniveau
(
klas
4
)
D3
geeft
effect
van
klas
3
tov
referentieniveau
(
klas
4
)
Slide
13
NOTATIE
:
Yij
=
de
j-‐de
meting
in
de
i-‐de
klas.
Dit
is
een
ander
notiatie
dan
bij
2-‐way
anova,
om
het
multi-‐level
model
straks
te
kunnen
introduceren.
Tus
vanaf
nu
als
we
spreken
over
mixed
models
gaan
we
dit
altijd
gebruiken
(
Yij).
Die
eerste
index
(i)
gaat
altijd
slaan
op
het
hoogste
niveau
in
de
hiërarchie
(
level
2-‐variabele
,
dus
in
ons
voorbeeld
:
klas).
Als
je
herhaalde
metingen
hebt
binnen
een
individu
dan
zou
die
eerste
index
slaan
op
het
individu.
De
tweede
,index
(
j)
zal
altijd
slaan
op
het
laagste
niveau
(
level
1-‐variabele,
dus
in
ons
voorbeeld
:
de
leerlingen
!
dus
j
metingen
in
elke
klas).
Merk
op
:
soms
zie
je
ook
het
omgekeerde
in
de
literatuur
maar
wij
gebruiken
het
dus
zo.
We
weten
dat
SPSS
altijd
laatste
groep
als
referentieniveau
gebruikt.
• Voor
klas
:
klas
4
• Voor
geslacht
:
geslacht
1
We
kunenn
dit
dan
ook
invoeren
:
xij
=
0
indien
jongen,
xij
=
1
indien
meisje.
Dan
wordt
het
model
dat
we
daarnet
zagen
herschreven
als
volgt
(
zie
slides
)
met
:
Yij
=
we
kijken
nog
altijd
naar
de
populariteit
van
het
j-‐de
kind,
naar
de
i-‐de
klas).
mu
=
gemiddelde
uit
referentiegroep
(
klas
4
en
geslacht
=
1
)
Alfa1
=
effect
van
klas
1
tov
referentieklas
(
klas
4
)
Alfa
2
=
effect
van
klas
2
tov
referentieklas
Alfa
3
=
effect
van
klas
3
tov
referentieklas
Beta
=
effect
van
jongens
tov
meisjes
in
populariteit
(
referentiegroep
zijn
meisjes
,
dus
als
xij
=0
gaat
het
over
de
jongens
,
dus
als
beta
groter
is
dan
nul,
dan
zou
dat
betekenen
dat
de
gemiddelde
populariteit
bij
jongens
groter
is.
Als
het
kleiner
is
dan
0
dan
zal
de
populariteit
bij
jongens
gemiddeld
kleiner
zijn).
Slide
14
We
kunnen
dit
ook
als
indicatorfunctie
schrijven
(
zie
slide
14).
Dus
wanneer
geslacht
nul
is
(
als
we
het
hebben
over
meisjes)
krijgt
de
indicatorfunctie
de
waarde
‘1’
(
als
de
uitspraak
tussen
haakjes
correct
is
krijgt
indicatorfunctie
de
waarde
1
,
anders
0).
We
kunnen
die
dummy’s
ook
zo
herschrijven
met
indicatorfuncties
(
is
daar
volledig
equivalent
mee).
Als
klas
=
1
(
als
die
uitspraak
waar
is
),
is
die
dummy
of
indicatorfunctie
gelijk
aan
1.
We
kunnen
dit
eigenlijk
ook
korter
gaan
schrijven
,
waarbij
we
restricties
opleggen
voor
alfa1
alfa
2
en
3.
Dan
hebben
we
dit
(
gele
fluo
).
Onderzoeksvraag
:
Hypothese
die
we
willen
testen
:
is
gemiddelde
populariteit
bij
J
en
M
dezelfde
?
Is
beta
=
0
?
!
als
Beta
=
0
dan
is
er
geen
verschil
in
populariteit
tussen
J
en
M.
Maar
in
dit
model
houden
we
nu
wel
rekening
met
de
klassen
(
<>
t-‐test
van
daarnet).
Dus
:
is
gemiddelde
populariteit
gelijk
bij
J
en
M
(
controlerend
voor
een
eventueel
klaseffect).
Slide
15
en
16
H0
gaan
testen
in
SPSS
met
Two-‐way
ANOVA
:
“Analyze
–
general
linear
model
–
univariate”
• Reden
!
Herinner
u
:
we
veronderstelden
de
residuen
onafhankelijk
van
elkaar
want
we
brachten
school
in
rekening
,
dus
daarom
is
het
univariate.
• Afhankelijke
variabelen
=
Populariteit
• Factoren
in
ons
model
=
school
en
geslacht
(
2
factoren
die
we
in
rekening
brengen).
, • Model
specifiëren
:
full
factorial
!
dan
zouden
we
hoofdeffecten
en
interactie
tussen
alle
factoren
in
rekening
brengen.
Maar
ons
model
heeft
eigenlijk
geen
interacties
!
we
kijken
niet
of
er
nog
eens
een
verschillend
effect
is
van
geslacht
per
school.
Wij
kijken
enkel
nr
de
hoofdeffecten.
Dus
:
custom
model
en
dan
de
2
factoren
invoegen
• Options
:
parameter
schatters
willen
we
zien
(
aanvinken
)
OUTPUT
:
TABEL:
test
of
between
subjects
effects
• Vrijheidsgraden
-‐ We
hebben
in
totaal
81
observaties
(
df
=
81
bij
totaal
)
-‐ Df(
school
)
=
3
(
3
parameters
alfa
hiervoor
,
want
3
dummy’s
)
-‐ Df(geslacht)
=
1
(
1
parameter
beta
voor
effect
van
geslacht
)
-‐ Df
(
corrected
model
)
=
3
+
1
=
4
• Beide
(hoofd)effecten
zijn
significant
(
van
geslacht
en
van
klas
)
(
zie
roze
)
TABEL
:
parameter
estimates
• Wat
is
nu
precies
het
effect
van
geslacht
en
klas
?
-‐ Geslacht
:
gemiddeld
populariteit
van
-‐0.48
bij
jongens
ivm
meisjes
(
minder
dus
)
Significant?
JA
want
p<
0.05
en
0
niet
in
BTB
interval
-‐-‐>
(
ps
:
als
we
geen
interactietermen
hebben
gaan
de
p-‐waarden
altijd
hetzelfde
zijn
van
de
anova
tabel
als
van
de
t-‐testen
!
)
Conclusie
:
populariteit
tussen
J/M
verschilt
wel
degelijk
(andere
conclusie
dan
bij
t-‐test
!
dit
is
de
juiste
conclusie
nu
,
want
nu
hebben
we
klaseffect
in
rekening
gebracht
,
en
daarnet
niet
)
.
-‐ Intercept
=
6.6
=
gemiddelde
populariteit
in
referentieniveau
(
met
school
4
en
seks
1
)
dus
voor
meisjes
van
klas
4
is
de
gemiddelde
populariteit
6.6
-‐ Klas
:
# (school1)
:
verschil
van
school
1
tov
referentieniveau
(
meisjes
uit
school
4).
=
Gemiddelde
populariteit
bij
meisjes
is
1.15
HOGER
dan
in
school
4
(
significant)
# (school2):
gemiddelde
populariteit
bij
meisjes
is
2,3
MINDER
dan
in
school
4
(significant
)
# (school3):
gemiddelde
populariteit
bij
meisjes
is
0.35
MEER
dan
in
school
4
(
dit
is
toch
niet
sign
?????
).
Effecten
even
grafisch
voorstellen
:
Bekijken
populariteit
bij
jongens
en
meisjes
in
die
4
scholen.
Dus
kunnen
die
geschatte
effecten
nu
eens
grafisch
voorstellen.
X-‐as
=
meisjes
(
referentiegroep
).
Het
intercept
in
school4
was
6.6.
De
zwarte
lijn
stemt
overeen
met
school
4.
We
hadden
gezien
dat
in
school
1
de
populariteit
1.1
hoger
ligt
dus
in
school
1