SPSS IV
BEGIN EXAMEN
Syntax openen
File
New
Syntax
*vraag1. Typen
Opslaan als … op bureaublad
Random KADERS
Schaal aan legende toeschrijven
Schaal Google Eigen woorden Voorbeeld
nominaal De data kunnen Geboorteplaats
alleen worden Gender
gecategoriseerd Etniciteit
(geen Automerken
rangorde)1 Geloofsovertuiging
Ordinaal 1+ De data Soort Top tien
kunnen worden hiërarchie/rangorde bestsellers
gerangschikt2 (boeken),
Taalvaardigheid
(zoals laag,
gemiddeld, hoog),
schaal van heel
ontevreden tot
heel tevreden)
race
schooltype (aso,
tso en bso)
Interval 1+2+er zijn Kan onder 0 gaan/ Temperatuur in
gelijke kan negatief zijn Fahrenheit of
intervallen graden Celsius
tussen de
categorieën3
Ratio/scale 1+2+3+er is een Kan niet onder de 0 Leeftijd
absoluut of gaan Gewicht
betekenisvol Temperatuur in
nulpunt. Kelvin
, statische samenvatting
= combinatie van meest gepaste centrummaten en spreidingsmaten
vanaf nominaal modus, geen
spreidingsmaten
vanaf ordinaal modus + mediaan +
kwartielen + min + max
(spreidingsmaten+ 5 getallen sv )
vanaf Interval/ratio Gemiddelde +
standaardafwijking+ variantie
(spreidingsmaten)
Uitkomst/maten van vorm
Vanaf interval
G1=skewness =0 symmetrisch
<0 Links scheef
>0 Rechts scheef
G2 = =0 Mesokurtisch
kurtosis <0 platykurtisch
>0 leptokurtisch
,KEUZEKADER
Analyse doel Variabelen Veel voorkomende
woorden/info
Verkennen
van data
Enkelvoudige regressie waarbij de 1 AV lineair model
regressie afhankelijke variabele 1 OV Alle
gemodelleerd wordt in werkhypothesen
functie van slechts 1 (w) (N, H & L)
onafhankelijke variabele
Meervoudige waarde van AV (y) 1 AV Schatten
regressie schatten aan de hand van ≥ 2 OV Voorspellen
de OV’s (x-en) werkhypothesen
conclusie: Bij regressie- (w): (normaliteit,
analyse willen we een homoscedasticiteit,
regressierechte bepalen, lineariteit)
die toelaat de verwachte
waarde van y te schatten
voor een bepaalde
combinatie van x-en
Logistische Samenhang nagaan tussen AV= Lineair model
regressie de odds (kansverhouding) dichotoom/binair Kansverhoudiing
en OV’s multinomniaal kans
Odds
OV ≥ 2 OV + ratio Geen
of Likertschaal ( bv werkhypothesen
1 = zeer groot,
2=groot,..)
One way nagaan of de gemiddelden Meer dan 2 groepen Between subject
anova van 2 verschillende design (factor)
populaties/groepen al dan 1 factor (ov) dat Eén-fact variantie-
niet significant verschillen. groepen analyse (p123)
onderscheidt= In data view var
nagaan of de Populaties ingedeeld met verschillende
populatiegemiddelden van adhv 1 onafh waarden (vb
minstens 2 groepen (=r variabele (met therapie -> ther 1,
groepen) significant enkele niveau’s ther 2, ther 3
verschillen W: Norm en homo
bv. bv. effect van
methode (3
niveaus))
Two way de populatiegemiddelden 2 factoren= W: Norm en homo
anova worden vergeleken van Populaties ingedeeld P156
groepen die bepaald adhv 2 onafh
worden door (verschillende variabele (met elk
waarden in) twee factoren enkele niveau’s
(onafhankelijke variabelen)
bv. effect van
methode (3
niveaus) en geslacht
(2 niveaus))
Repeated de gemiddeldes van een Within group W: Norm, homo,
measures persoon vergelijken met factoren sfericiteit
zijn eigen gemiddeldes Elk, ieder
(Gemiddelden vergelijken (voorbeeldoef 1)
van DEZELFDE subjecten) p192
Mixed design vereist minimaal twee Combinatie
categorische OV, Between*within
(factoren), en ten minste subject factoren
één van deze variabelen
moet tussen eenheden
variëren en ten minste één
, ervan moet binnen
eenheden variëren
factoranalyse ieen methode die gebruikt Componenten
wordt om data te Eigenwaarden
reduceren door het Communaliteiten
oorspronkelijke aantal dimensie
variabelen terug te
brengen tot een kleiner
aantal
variabelen/dimensies
(=factoren).
clusteranalyse We gaan de interrelaties FA: objecten/cases cluster
tussen verschillende zijn homogeen linkage
variabelen bekijken (zoals euclidische
in vele data-analyse CA: objecten/cases afstand
benaderingen). kunnen worden
ingedeeld in klassen
die verschillen
vertonen
NULHYPOTHESES
Analyse Nulhypothese
Enkelvoudige regressie
Meervoudige regressie
One way anova
nagaan of de gemiddelden van 2
verschillende populaties (of groepen) al
dan niet significant verschillen.
Two way anova
Repeated measures
Mixed
Logistische regressie nulhypothese zo geformuleerd is dat er geen effect of verschil
is en de alternatieve hypothese zo geformuleerd is dat er wel
een effect of verschil is.
H0: β1=β2=β3=β4=0 Geen
enkele predictor van de predictors 1, 2, 3 of 4 is gerelateerd
aan de afhankelijke variabele y…
HA: βi≠0,i=1,2,3,4).
, Ten minste een van de predictors 1, 2, 3 of 4 is gerelateerd
aan de afhankelijke variabele y…
P-waarde ≥ α H0 aanvaarden ≠ significant (onvoldoende bewijs tegen
H0)
P-waarde < α H0 verwerpen = significant voldoende bewijs tegen H0)
Vb.
,WPO 1: VERKENNEN VAN DATA
EEN KIJK NEMEN OP DE VARIABELEN
Databestand: stress
https://canvas.vub.be/files/1519804/download?download_frd=1
Je kan zien hoe zaken gecodeerd zijn door te
klikken op ‘variable view’
Of door op het icoontje te klikken voor een
samenvatting
DOEL: opvragen van het databestand om snel zicht te krijgen op de variabelen en
kunnen via ‘Descriptives’ een aantal statistieken voor de variabelen opgevraagd worden,
Analyze -> descriptive statistics -> descriptives
We willen het beeld weten van
al onze variabelen binnen de
data, daarom selecteren we ze
allemaal en brengen we ze
allemaal over naar variables
(eerste variabele klikken ->
shift inhouden -> pijl)
Ik duid ook ‘Save standardized
values as variables’ aan, zodat
ik gestandardiseerde z-
waarden krijg in mijn dataset.
Via ‘Options’ kunnen eventueel
nog een aantal bijkomende statistieken opgevraagd worden.
, Syntax uitvoeren
We gaan nu kijken naar de cijfers van onze syntax om te zien of er iets opvalt/ een cijfer
fout kan zijn.
1. Gemiddeld zijn de werknemers in het bestand 40,2 jaar oud, en werken ze 13,7
jaar in het bedrijf waar ze momenteel tewerkgesteld zijn. Resulteert in een leeftijd
boven het maximum (=61)
2.
Voor een heel aantal variabelen zoals
geslacht en leidinggevende functie
zijn (door de nominale of ordinale
meetschaal) statistieken zoals het
gemiddelde en de standaardafwijking
niet van toepassing.
3. Het gaat hier om een ordinale
variabele met waarden van 0 tot en
met 6. Bij item 125 is het maximum
gelijk aan 33. Dit wijst op een foute invoer aangezien de maximum waarde gelijk
is aan 6.
Kan je oplossen door naar de item te gaan op de data view.
Rechter muisknop klikken -> sort bij descending -> cijfer aanpassen