TDAT
Les
3
(
2015-‐2016
)
Lesnotities
Hoofdstuk
3
:
Repeated
Measures
ANOVA
1. Inleidend
voorbeeld
Slide
3
en
4
Je
ziet
hier
al
een
verschil
tussen
die
2
factoren
die
we
net
besproken
hebben.
Factor
1
(
emoties
)
:
alle
kinderen
krijgen
alle
emoties
te
zien.
Maar
type
foto’s
werd
verdeeld
over
3
groepen
van
kinderen.
!
Factor
1
(
emoties
)
:
krijgt
iedereen
te
zien
=
within
subject
factor
(
zie
OMP
)
=
binnenfactor
factor
:
je
krijgt
de
3
emoties
te
zien
binnen
elke
persoon
!
Factor
2
(
type
foto
)
:
verdeeld
over
groepen
kinderen
=
between
subjects
factor
=
tussensubject
factor
:
de
ene
krijgt
gezichten,
de
ander
enkel
het
lichaam,
…
Waarom
maken
we
soms
gebruik
van
within
dan
wel
between
factoren?
Bv.
waarom
hier
voor
het
ene
een
within,
en
voor
de
andere
factor
een
between?
(zie
volgende
slides)
Eerst
gaan
we
onderzoeksvragen
formuleren.
OV
1
:
gaat
enkel
over
factor
1
OV
2
:
gaat
over
beide
factoren
(
bv.
makkelijker
verbazing
dan
fierheid
herkennen
als
je
het
gezicht
ziet,
zie
je
ditzelfde
effect
ook
als
je
enkel
het
lichaam
ziet
?
)
Slide
5
Data
eerst
grafisch
bekijken.
Bevindingen
:
• Als
zowel
lichaam
en
gezicht
getoond
worden
,
zie
je
hoogste
score
voor
verbazing.
Verbazing
kan
je
het
best
aflezen
als
je
zowel
lichaam
als
gezicht
ziet
• Het
minst
goed
kan
je
trots
herkennen
als
je
zowel
lichaam
als
gezicht
ziet
(
ivm
de
andere
emoties)
• Trots
valt
moeilijk
af
te
leiden
uit
het
gezicht
alleen
(
en
blijheid
al
helemaal
niet
uit
het
lichaam
)
• Trots
kan
je
het
best
afleiden
als
enkel
het
lichaam
getoond
werd
Hoe
onze
onderzoeksvragen
oplossen?
OV
1
=
3
emoties
gaan
vergelijken
!
gemiddelde
accuraatheid
is
die
gelijk
over
die
3
emoties?
Dus
is
de
gemiddelde
accuraatheid
hetzelfde
als
de
kinderen
emotie
trots,
emotie
blijheid
dan
wel
emotie
verbazing
te
zien
krijgen?
!
Waarom
kan
je
hier
geen
one-‐way
anova
(
voor
Onderzoeksvraag
1
dus
ivm
1
factor
)
en
two-‐way
anova
(
voor
Onderzoeksvraag
2
dus
met
2
factoren)
op
toepassen?
(
one
way
anova
=
voor
het
vergelijken
van
gemiddelden
in
verschillende
groepen,
two
way
anova
=
voor
het
vergelijken
van
gemiddelden
van
verschillende
factoren,
in
verschillende
groepen
).
Maar
hier
zijn
de
drie
metingen
(
trots
,emotie
en
blijheid
)
afhankelijk
van
elkaar
want
het
zijn
dezelfde
kinderen
die
telkens
die
metingen
hebben
gedaan
(
geen
onafhankelijke
groepen).
Je
kan
die
3
gemiddelden
dus
niet
zomaar
vergelijken
met
one
way
anova.
(
te
vergelijken
met
independent
t-‐test
en
paired
t-‐test
).
Analoog
two-‐way
anova:
ook
als
we
de
2
factoren
gaan
bekijken,
dat
kunnen
we
ook
niet
gebruiken
alweer
omdat
het
nog
altijd
geen
onafhankelijke
metingen
zijn.
,Op
basis
van
de
figuur
zie
je
al
dat
het
effect
van
emotie
niet
gelijk
is
naargelijk
het
type
foto
dat
je
toont.
Bv.
bij
“beide”
is
pride
het
slechtste,
terwijl
bij
“torso”
is
pride
net
het
beste.
2. Between-‐subject
vs.
within-‐subject
designs
Slide
7
Wanneer
geen
keuze
:
Bv.
test
waarbij
je
links-‐
en
rechtshandigen
wilt
vergelijken
!
moet
wel
between
(
je
bent
links
OF
rechts)
Bv.
als
je
leer-‐effect
wil
nagaan
dan
ga
je
een
evolutie
na
binnen
een
bepaalde
persoon
!
within
Voordelen
within
:
1)
Bij
een
within
subject
design
dient
elke
persoon
als
zijn
eigen
controle.
Je
gaat
kijken
binnen
een
persoon
wat
de
accuraatheid
is
om
bijvoorbeeld
fierheid
te
herkennen
vs.
accuraatheid
om
blijheid
te
herkennen.
Je
kan
die
vgl
binnen
elke
persoon
gaan
maken
en
dit
maakt
dat
er
geen
andere
factoren
een
rol
kunnen
spelen
die
individugebonden
zijn
(bv.
het
IQ
of
geslacht
of
leeftijd
…
).
Tijdsafhankelijke
variabelen
kunnen
wel
nog
(bv.
gemoed
op
de
ene
meting,
en
gemoed
op
andere
meting).
Maar
dus
geen
persoonsgebonden
(
tijdsconstante)
factoren.
2)Het
kan
ook
efficiënter
zijn
in
termen
van
het
aantal
subjecten
en
tijd
die
je
moet
spenderen.
3)
Statistische
reden
:
omwille
van
statistische
efficiëntie
Slide
8
Hypothetisch
voorbeeld
om
statistische
efficiëntie
te
illustreren.
Stel
experiment
waarbij
we
gemiddelde
accuraatheid
van
pride
en
happiness
willen
vergelijken.
In
de
ene
conditie
veronderstellen
we
dat
die
70%
is
,
in
de
andere
60
(
gemiddeld,
dus
over
alle
types
van
foto’s
heen
,
of
dus
los
van
het
type
foto
dat
ze
gezien
hebben).
Veronderstel
dat
hoe
accurater
iemand
is
voor
de
ene
conditie
(
bv.
pride)
,
hoe
accurater
die
persoon
ook
is
voor
de
andere
conditie
(
happiness)
want
we
veronderstellen
dat
de
correlatie
hierbij
0.30
is.
Hoeveel
proefpersonen
zouden
we
nodig
hebben
om
dit
verschil
dan
ook
echt
te
detecteren?
Dan
kijken
we
dus
naar
de
power
van
de
studie
!
als
er
dus
effectief
een
verschil
is
(
ja,
want
hier
veronderstellen
dat
er
in
werkelijkheid
een
verschil
van
10%
is
),
hoeveel
proefpersonen
hebben
we
dan
nodig
om
dat
ook
daadwerkelijk
te
detecteren?
(
PS
:
hoe
meer
proefpersonen
=
hoe
groter
power
)
We
willen
hier
2
gemiddelden
gaan
vergelijken
:
gemiddelde
accuraatheid
op
1
emoties
en
op
een
andere
(
in
werkelijkheid
70
en
60%).
De
vraag
is
gaan
we
2
onafhankelijke
of
afhankelijke
groepen
gebruiken
(
dus
between
of
within
?
).
Gaan
we
dezelfde
emoties
aan
dezelfde
groepen
tonen
of
niet?
• Stel
met
onafhankelijke
groepen
(between
)
:
in
elke
groep
37
mensen
nodig
om
dat
verschil
van
10%
met
80%
kans
te
detecteren.
!
Dus
74
mensen
nodig
• Met
afhankelijke
groepen
(
within
)
(dan
zou
je
gepaarde
t-‐test
doen):
maar
27
mensen
nodig
Reden
:
omdat
er
een
positieve
correlatie
verondersteld
wordt
tussen
de
accuraatheid
in
de
twee
condities,
heb
je
minder
proefpersonen
nodig.
Want
je
gaat
eigenlijk
wat
extra
informatie
van
het
ene
gaan
halen
bij
het
ander
omwille
van
die
positieve
correlatie
en
daardoor
kan
je
efficiënter
dat
verschil
gaan
detecteren.
Moest
de
correlatie
gelijk
zijn
aan
0
(
moest
de
accuraatheid
van
de
ene
emotie
niet
afhangen
van
de
acc
van
de
andere)
wat
zouden
we
dan
vinden?
:
dan
even
veel
mensen
nodig
per
conditie
bij
within
als
bij
between.
Dus
dan
hier
ook
37
mensen
per
conditie
nodig
,Dus
ook
de
statistische
efficiëntie
is
een
belangrijke
reden
waarom
we
soms
een
within
subject
design
gaan
gebruiken.
Hier
hebben
we
nu
de
ene
als
within
(
emoties)
,
de
andere
als
between
(type)
genomen.
Je
zou
ze
allebei
als
within
gebruikt
hebben
,
maar
waarom
dit
niet
gedaan?
!
anders
duurt
het
experiment
veel
te
lang
voor
die
kinderen
om
beide
within
factoren
te
maken.
3. Repeated
Measures
ANOVA
Slide
9
Hoe
gaan
we
die
data
nu
analyseren?
!
niet
mogelijk
met
gewone
ANOVA
(
kunnen
gemiddelde
accuraatheid
voor
die
3
emoties
niet
vergelijken
omdat
die
3
groepen
afhankelijk
zijn
van
elkaar
doordat
het
telkens
dezelfde
kinderen
zijn
in
de
3
verschillende
groepen).
=
zitten
met
herhaalde
metingen.
Dus
:
de
metingen
onder
de
3
verschillende
condities
zijn
gerelateerd
aan
elkaar.
Dus
we
gaan
ANOVA
uitbreiden
voor
herhaalde
metingen
=
Repeated
Measures
Anova.
Maar
je
kan
hier
ook
between
subject
factoren
in
rekening
brengen.
Slide
10
We
gaan
hier
de
variantie
gaan
ontleden
in
verschillende
factoren
net
zoals
bij
ANOVA.
Bij
RM-‐
ANOVA
gaan
we
de
kwadratische
afstanden
gaan
opdelen
in
verschillende
factoren
(
net
zoals
we
bij
anova
gedaan
hebben).
Totale
SS
wordt
opgesplitst
in
:
between
SS
en
within
SS.
Als
je
dan
een
within
SS
factor
hebt
kan
je
die
gaan
indelen
in
SS
between
+
SS
error.
We
gaan
dit
even
grafisch
voorstellen
:
Stel
we
hebben
3
proefpersonen
(
x-‐as)
en
op
de
y-‐as
stellen
we
de
accuraatheid
van
verschillende
herhaalde
metingen
van
elk
van
die
proefpersonen
voor.
Dus
bij
proefpersoon
1
zien
we
voor
de
ene
emotie
3
observaties
(
puntjes),
voor
een
andere
emotie
hebben
we
ook
3
observaties
(
kruisjes)
.
Hier
zien
we
dan
dat
voor
die
persoon,
is
de
accuraatheid
voor
de
2e
emotie
(
kruisjes)
beter
dan
voor
de
eerste
emotie
(
puntjes).
Hetzelfde
bekijken
we
eens
voor
de
andere
2
proefpersonen.
Hier
zien
we
dan
bijvoorbeeld
consistent
binnen
elk
van
de
proefpersonen
dat
de
accuraatheid
voor
de
ene
emotie
(
kruisjes)
beter
is
dan
voor
de
andere
emotie.
Dan
kunnen
we
een
gemiddelde
over
al
die
observaties
gaan
bekijken
,
dat
is
hier
dan
die
zwarte
lijn
(
ruw
geschat
het
gemiddelde
van
die
18
observaties).
En
dan
kan
je
kijken
hoe
ver
elk
punt
van
die
zwarte
lijn
afwijkt.
Slide
11
Gebalanceerd
design
=
waarbij
je
ervan
uit
gaat
dat
je
even
veel
observaties
hebt
binnen
elke
mogelijke
combinatie
van
factoren.
Slide
12
Sferisiteit
assumptie
=
betekent
dat
de
varianties
van
de
verschilscores
tussen
de
condities
gelijk
is.
Dit
zullen
we
altijd
hebben
als
de
variantie-‐covariantiestructuur
een
Compund-‐Symmetrie
structuur
heeft.
COMPOUND
SYMMETRIE
:
Hier
veronderstellen
we
dat
de
varianties
gelijk
zijn,
en
dat
de
covarianties
ook
allen
gelijk
zijn.
Dat
betekent
dat
we
,
stel
dat
we
3
emoties
hebben
(
=
3
herhaalde
waarnemingen)
dan
hebben
we
een
3
bij
3
matrix.
• Element
op
eerste
rij,
eerste
kolom
is
dan
variabiliteit
onder
de
eerste
emotie.
• Element
op
2e
rij,
2e
kolom
=
variabiliteit
onder
de
2e
emotie
• Element
op
de
3e
rij
,
3e
kolom
=
variabiliteit
onder
de
3e
emotie
En
we
veronderstellen
hier
dat
die
varianties
gelijk
zijn,
en
dat
de
covarianties
ook
allen
gelijk
zijn
dus
dat
de
samenhang
tussen
emotie
1-‐emotie
2
hetzelfde
is
als
tussen
emotie
1-‐3
en
emotie
2-‐3.
Als
we
dergelijke
compound
symm
structuur
hebben,
is
altijd
voldaan
aan
de
sfericiteit
assumptie.
,SFERICITEIT
:
Compound
symmetrie
impliceert
dus
sfericiteit
,
maar
niet
altijd
omgekeerd.
Het
kan
zijn
dat
je
sfericiteit
kan
hebben
maar
waarbij
je
niet
noodzakelijk
compound
symmetrie
zou
hebben.
Bijvoorbeeld
deze
matrix
:
veronderstel
dat
dit
een
covariantiematrix
is
van
3
herhaalde
metingen.
Voldoet
die
dan
aan
de
voorwaarden
voor
een
compound
symmetrie?
nee
want
de
varianties
noch
de
covarianties
zijn
allemaal
gelijk.
Maar
we
hebben
wel
sfericiteit
omdat
de
variantie
in
de
verschilscore
tussen
de
condities
wel
gelijk
is.
Bv.
als
we
de
variantie
van
Y1
–
Y2
beschouwen
dan
weten
we
dat
dit
gelijk
is
aan
:
VAR(
Y1-‐Y2)
=
VAR
(Y1)
+
VAR
(Y2)
–
2
COV
(
Y1
,
Y2).
"
VAR
(Y1-‐Y2)
=
2
+
4
–
2x2
=
2
Bv.
variantie
van
Y1-‐
Y3
krijgen
we
analoog
:
VAR
(Y1
–
Y3)
=
VAR
(Y1)
+
VAR
(Y3)
–
2COV
(Y1,
Y3
)
"
VAR
(
Y1
–
Y3)
=
2
+
8
–
2x4
=
2
Dus
we
zien
al
dat
de
VAR
(
Y1-‐Y2)
=
VAR
(
Y1
–
Y3
)
=
VAR
(
Y2
–
Y3
)
Dus
de
variantie
van
de
verschilscores
tussen
de
condities
is
gelijk
=
sfericiteit
Slide
13
Hoe
gaan
we
nu
de
sfericiteit
nagaan
?
!
hier
is
een
test
voor
ontworpen.
De
nulhypothese
van
deze
test
stelt
dat
er
sfericiteit
is,
en
de
alternatieve
is
dan
dat
er
geen
is.
Probleem
:
als
we
longitudinale
metingen
hebben,
hebben
we
vaak
geen
compound
symmetrie
structuur
(
zagen
we
voordien
al
–
meer
een
AR(1°)
structuur
–
omdat
je
verwacht
dat
metingen
die
verder
uit
elkaar
liggen
in
de
tijd
minder
sterk
gecorreleerd
zijn
dan
metingen
die
dicht
liggen
in
de
tijd
–
zie
les
1
)
!
Dus
e
sfericiteitsassumptie
is
vaak
geschonden
voor
longitudinale
studies.
Waarom
niet
goed
?
!
indien
sfericiteitsassumptie
geschonden
gaan
we
vaak
te
snel
H0
verwerpen
(
=
liberale
testen).
We
gaan
te
snel
de
nulhypothese
verwerpen
terwijl
deze
toch
waar
is
(
te
liberale
test).
Slide
14
Er
bestaan
gelukkig
schattingen
voor
sfericiteit,
om
correcties
toe
te
passen.
We
hebben
3
maten
(
epsilon)
voor
de
correctie
van
de
vrijheidsgraden
van
onze
F-‐verdeling.
(
Herinner
u
,
we
hadden
daarnet
gezegd
dat
we
gingen
werken
met
deze
F-‐verdeling,
maar
dan
zonder
die
epsilons
erbij
want
die
waren
daarnet
gelijk
gesteld
aan
1).
!
waarom
:
F
geldt
als
sfericiteit
geldt
–
dus
met
epsilon
1
(
dus
geen
correctie
nodig
).
Maar
als
sfericiteit
geschonden
is
gaan
we
moeten
corrigeren
:
dan
moeten
vermenigvuldigen
met
(een
andere
waarde
van
)
epsilon
(
die
dus
niet
1
is
).
Sfericiteit
OK
!
€
=
1
!
gewone
F
verdeling
Sfericiteit
geschonden
!
€
correctie
nodig
!
3
mogelijke
soorten
correcties
(
liggen
allen
tussen
0
en
1)
• GG
• HF
• LB
Hierdoor
zal
onze
test
wat
conservatiever
worden.
Want
als
sfericiteit
geschonden
is
en
je
gebruikt
toch
de
gewone
F-‐test
dan
ga
je
te
snel
de
H0
verwerpen.
Door
correctie
toe
te
passen
wordt
de
test
wat
conservatieven
en
ga
je
de
H0
niet
te
snel
verwerpen.
Probleem
:
vaak
gaan
we
hier
niet
snel
genoeg
de
H0
gaan
verwerpen
(
en
zijn
we
dus
wat
té
conservatief
).
Je
kan
wel
die
3
correcties
ordenen
qua
conservativiteit.
We
gaan
daarom
altijd
GG
gebruiken
:
die
ligt
middenin
qua
conservativiteit.
,Slide
15
Als
we
dus
RM
ANOVA
willen
toepassen
moet
je
eerst
nagaan
of
sfericiteit
voldaan
is,
indien
ja
kunnen
we
F-‐verdeling
gebruiken
zoals
ze
eerst
stond,
indien
niet
moeten
we
corrigeren
met
€=
GH.
(
merk
op
:
de
software
zal
dit
zelf
voor
ons
doen
–
ze
straks).
Alternatief
kunnen
we
toch
ook
het
multivariaat
lineair
model
gebruiken.
Dit
in
plaats
van
gebruik
te
maken
van
de
sfericiteitsassumptie
(
met
al
dan
niet
correcties).
Deze
multivariate
benadering
legt
geen
structuur
op
aan
die
variantie-‐covariantie,
maar
gaat
wel
de
typische
anova
assumpties
maken.
"
Waarom
gebruiken
we
dan
niet
altijd
deze
benadering?
:
Omdat
deze
in
kleine
steekproeven
minder
power
heeft,
maar
in
grote
steekproeven
doet
die
het
wel
vaak
goed
(
soms
zelfs
beter
).
Dus
in
het
experiment
van
daarnet,
hebben
we
slechts
een
beperkt
aantal
proefpersonen
en
daarom
gaat
men
daar
toch
de
sfericiteitsassumptie
gebruiken
(
in
plaats
van
de
multivariate
aanpak
te
gaan
gebruiken).
Dit
wordt
straks
geïllustreerd
op
een
voorbeeld.
Slide
16
Nu
wordt
reeds
kort
de
datastructuur
toegelicht.
Als
we
een
RM
ANOVA
toepassen
dan
staan
uw
metingen
in
WIDE
FORMAT
(
breed
formaat).
Je
hebt
namelijk
voor
elk
individu
1
lijn
(
dus
elke
rij
stemt
overeen
met
1
deelnemer
–
in
dit
geval
1
kind).
In
de
eerste
kolom
staat
dan
tot
welk
type
foto
die
persoon
werd
toegewezen
(
hier
zie
je
allemaal
kinderen
die
zowel
het
gezicht
als
het
lichaam
zagen).
Volgende
kolommen
zijn
de
de
accuraatheid
onder
de
3
emoties.
Kunnen
dus
voor
elke
emotie
de
accuraatheid
voor
elk
kind
gaan
berekenen.
Dus
we
krijgen
1
lijn
per
kind
en
de
accuraatheid
onder
de
3
within-‐subject-‐levels
naast
elkaar
(
in
verschillende
kolommen).
-‐-‐-‐
pauze
-‐-‐-‐
Slide
17
Voor
de
pauze
hebben
we
theorie
gezien
achter
RM
ANOVA,
nu
zien
we
hoe
we
zo’n
analyse
doen.
ANALYZE
–
GENERAL
LINEAR
MODEL
–
REPEATED
MEASURES.
Dan
krijgen
we
dit
:
Dan
moeten
we
eerst
de
Within
Subject
Factor
Name
geven.
We
gingen
bij
onderzoeksvraag
kijken
naar
:
is
er
een
verschil
in
accuraatheid
over
die
3
emoties.
dus
within
subjects
factor
in
deze
studie
is
emotie
(
we
vullen
“emo”
in
).
Het
aantal
niveau’s
hiervan
is
dus
3
(
we
hadden
blij,
verbaasd
en
fier).
De
uitkomst
die
we
bekijken
is
de
accuraatheid
(
“accuracy”).
KLIK
OP
DEFINE.
, Dan
moeten
we
gaan
aangeven
welke
variabelen
in
onze
dataset
eigenlijk
overeenstemmen
hiermee.
Je
ziet
hier
staan
:
• “accuraatheid
van
de
eerste
emotie
conditie”
!
daarvoor
kiezen
we
pride
• “accuraatheid
van
de
tweede
emotie
conditie”
=
happiness
• “…
3e
emotie”
=
surprise
KLIK
OP
“MODEL”
We
hebben
dus
onze
accuraatheid
onder
die
3
emoties.
We
zitten
dus
met
een
model
met
maar
1
factor
in
(
de
emotie).
Dus
we
kunnen
full
factorial
laten
staan
bij
“model”
(
want
er
is
er
toch
maar
1
)
GA
TERUG
EN
KLIK
NU
OP
“CONTRASTS”
Bij
contrasts
staat
er
standaard
“polynomiaal”.
Straks
gaat
prof
voorbeeld
geven
waarbij
dit
wel
van
toepassing
is
maar
dit
gaat
erover
of
je
factor
op
nominaal
of
eerder
op
ordinaal
niveau
ofzo
is.
Hier
hebben
we
pride,
happiness
en
surprise
dus
hier
is
de
factor
emotie
dus
nominaal.
Dan
is
het
weinig
zinvol
om
polynomiale
contrasten
te
gaan
bekijken.
We
kunnen
wel
paarsgewijze
vergelijkingen
maken
(
bv.
tussen
pride
–happiness
!
dergelijke
eenvoudige
contrasten
kunnen
we
wel
maken)
maar
geen
polynomiale.
Dus
gaan
we
ons
contrast
aanpassen
naar
“simple”.