METHODOLOGIE DEEL 3: KWANTITATIEF LUIK
1. INTRODUCTIE
1.1. CODEREN EN DATA-ENTRY IN SPSS
• DE CONSTRUCTIE VAN VARIABELEN
® Vóór dataverzameling: van concepten naar (enquête)variabelen → operationaliseren
® Na dataverzameling: van antwoorden op een vraag naar variabelen
o Soms eenvoudig: variabelen = antwoorden (codes) op enquêtevragen
o Soms complex: variabelen via hercoderen van enquêtevragen
o Soms: enquêtevragen samennemen tot schalen om abstracte concepten (bv. anomie,
onveiligheid…) te meten = schaalconstructie
• HET CODEREN A.D.H.V. SCHALEN
® Van vragenlijst via codeboek naar databestand
o Codeboek = bestand dat wordt aangemaakt om een brug te maken tussen de vragen-
lijst en het databestand; tussendocument waarin de legende staat
® Illustratie: mijdgedrag in de VM (v57 t.e.m. v60) → (1) altijd, (2) vaak, (3) soms, (4) zelden,
(5) nooit, (6) niet van toepassing, (7) weet niet, (8) geen antwoord
o Coderen
o Volgende stap: data-entry in SPSS
o Volgende stap: data-cleaning en analyse …
® Coderen: bijkomende punten en samenvattende regels
o Overzichtelijke vragenlijst (genummerd)
o Duidelijk en consequent codeboek (‘veldcoderen’ uitsluiten)
o Afspraken voor ‘weet niet’ (7, 77,…), ‘geen antwoord’ (8, 88,…), ‘niet van toepassing’
(9, 99,…): zie bv. codeboek SCV survey
o Afspraken voor filtervragen
o Afspraken voor onduidelijke antwoorden
o Afspraken verwerking meerdere antwoordmogelijkheden
1
, o Data-entry
- SPSS format opmaken
- Input met twee (iemand die de codes voorleest + iemand die ze ingeeft)
- Voordeel van websurvey (bv. Qualtrics) of CAS/TI
o Data-cleaning
- = het controleren op onmogelijke codes (gebeurt tussen de data-entry en analyse)
- Check: frequentietabellen
- Check: filtervragen
1.2. INLEIDING MULTIVARIATE ANALYSE
• WAAROM METHODOLOGIE?
® Methodologie en statistiek als ‘toolkit’ voor sociale wetenschapper
o Een deel van dit gereedschap is algemeen en moet iedere sociaal-wetenschapper in
huis hebben
o Een ander deel is hoog specialistisch
® Onderzoek opzetten, uitvoeren en analyseren (en ‘evalueren’)
® Methodologie deel 2: opzetten, uitvoeren
® Methodologie deel 3: analyseren, concluderen
• ROL VAN STATISTIEK?
® Beschrijvende statistiek: in beeld brengen van steekproef, …
® Inferentiële statistiek
o Modelleren van onzekerheid
o ‘Hoe waarschijnlijk is een resultaat onder een bepaalde veronderstelling van de
werkelijkheid’
o Statistiek als wetenschap van de probabiliteit
® Voorbeeld:
o OV: Verschilt het onveiligheidsgevoel tussen mannen en vrouwen?
o Conceptualisering, operationalisering, steekproeftrekking, dataverzameling, …
o Analyse: onveiligheidsgevoel vrouwen > onveiligheidsgevoel mannen (steekproef!)
o ‘Hoe groot is de kans dat vrouwen zich onveiliger voelen dan mannen (steekproef),
wanneer we veronderstellen dat geslacht en onveiligheidsgevoelens niet samenhangen
(nulhypothese)’
- H0: onveiligheidsgevoel vrouwen = onveiligheidsgevoel mannen
- Ha: onveiligheidsgevoel vrouwen ≠ onveiligheidsgevoel mannen
o p > 0,O5 (significantieniveau): nulhypothese aannemen
o p < 0,05 (significantieniveau): nulhypothese verwerpen
• ANALYSE IN HET CRIMINOLOGISCHE DOMEIN
® Bedreigingen voor validiteit en betrouwbaarheid
® Probleem van aselecte, representatieve steekproeven
o Verborgen populaties, geen steekproefkader
o Non-respons, bedreigende vragen, sociale wenselijkheid
o ...
® Probleem van de verdeling van de data
o Normale ↔ scheve verdelingen
- Een deel v/d mensen pleegt nooit een delict, een waarschijnlijk
aanzienlijk aantal doet dat eens, een veel kleiner deel recidiveert
en een heel klein deel is hoogactief (‘veelplegers’)
- Steden > platteland
2
, • UNIVARIATE, BIVARIATE EN MULTIVARIATE TECHNIEKEN
a) Univariaat: één variabele
® bv. hoe oud zijn daders van straatroof in Amsterdam?
® Vaak eenvoudige descriptieve maten gebruikt
® Maten voor centrale tendentie, spreiding, …
b) Bivariaat: twee variabelen
® Verband, verschil, samenhang, correlatie
® bv. verband tussen geslacht en onveiligheidsgevoelens
® In veel gevallen gebruiken we correlationele maten
c) Multivariaat: 3 of meer variabelen
® We willen 3 of meer variabelen in samenhang bekijken
® Geïntegreerde analyse
® Tal van mogelijkheden/beperkingen …
• KEUZE VAN DE ANALYSETECHNIEK
a) Toetsend of explorerend
® Hypotheses toetsen of is het verkennen van de data voldoende?
b) Datareductie versus modeltoetsing
® Datareductie: we gebruiken de analyse vooral om het grote aantal gegevens tot een
kleiner aantal terug te brengen
® Modeltoetsing: we zijn expliciet geïnteresseerd in de relaties tussen diverse variabelen
c) Voorspelling versus samenhang, asymmetrisch versus symmetrisch
® Asymmetrisch: de variabele A heeft een andere rol dan variabele B → asymmetrische
technieken kunnen voorspellingen maken (afhankelijk/onafhankelijke variabelen,
invloed, effect, predictie, … (causaliteit))
® Symmetrisch: de vraag naar de samenhang tussen kenmerk A en B → de vraag is
symmetrisch omdat A en B eenzelfde rol hebben (we kunnen ze van plaats laten
wisselen, en dan verandert de vraag niet en krijgen we hetzelfde antwoord)
d) Meetniveau van de variabelen
® Nominaal, ordinaal, metrisch
® Meten = het toekennen van getallen aan waarnemingen
• MEETNIVEAU VAN DE VARIABELEN (!)
a) Nominaal
- Indeling in ongeordende klassen, categorieën
- Getallen zonder functie: dienen slechts om verschillende soorten te onder-
scheiden
- Label Categorische
- bv. godsdienst, haarkleur, ... variabelen
b) Ordinaal
- Ordening, rangorde
- Getallen weerspiegelen rangorde
- bv. preferentieoordelen
c) Interval
- De intervallen tussen de getallen zijn even groot
- Verhoudingen van verschillen tussen metingen zijn zinvol Metrische
- Geen vast nulpunt variabelen
- bv. meting van temperatuur
3