STATISTIEK
Hoofdstuk 1 niet voor examen!
Hoofdstuk 2: Inleidende begrippen
1. Inleiding:
Objecten/onderzoekseenheden/cases = de personen of zaken over wie je iets zegt in
criminologisch onderzoek
Bv. eerstejaarsstudenten, misdaadartikelen…
Variabelen = kenmerken van het object/ de onderzoekseenheid
Bv. de gemiddelde leeftijd, de lengte…
Afhankelijke variabele = de variabele waarover je een voorspelling doet/hetgeen dat
onderzocht wordt
Onafhankelijke variabele = de variabele waarvan je gaat meten of ze een verandering
veroorzaakt bij de afhankelijke variabele
Overgeneralisatie = wanneer we ons niet houden aan de onderzoekspopulatie die we op
voorhand hebben gedefinieerd !!
Bv. Belgen tussen de 15 en 90 jaar is onze doelgroep
Onderzoekspopulatie = de verzameling individuen waarover we uitspraak willen doen
Steekproef/sample = een staal uit de onderzoekspopulatie die we werkelijk ondervragen
o Reden: kan niet ied v/d onderzoekspopulatie ondervragen
o Moet toevalsgewijs (= willekeurig) en representatief (= de kenmerken v/d
steekproef moeten evenredig zijn met de relevante kenmerken van de
onderzoekspopulatie) zijn
Selecte steekproef= Niet willekeurige steekproef
o Niet representatief, d.w.z. dat een bepaalde groep oververtegenwoordigd is, en een
andere ondervertegenwoordigd
Respondenten = De personen zelf die we uiteindelijk bevraagd hebben
o = zijn een deelverzameling v/d onderzoekspopulatie
Moet nauw afgebakend zijn
2. Beschrijven, schatten en veralgemenen als statistische bedrijvigheid:
DEFENITIE statistiek = het geheel van regels en procedures om gemeten kenmerken te verwerken
2 soorten: Beschrijvende statistiek en Inductieve of inferentiële statistiek
1. Beschrijvende statistiek: het beschrijven v/d onderzoekseenheden, de kwantitatieve
beschrijving van nieuwe fenomenen, kenmerken v/d steekproef
1
, DEF: overzichtelijk en samenvattend of op synthetische wijze kenmerken die voorkomen
in een onderzoekspopulatie weergeven wnr we niet alle eenheden kunnen bevragen
Bv. onveiligheidsgevoel volgens de verzorgdheid van de buurt (het ligt hoger in
onverzorgde buurten, = pure beschrijving)
BEPERKINGEN doordat het veel gegevens zonder verlies aan info overzichtelijk wilt
weergeven !!
o Gegevens om de onderzochte groep te beschrijven kunnen NIET veralgemeend
worden naar andere groepen, tijden. Ze is enkel geldig voor de onderzoekspopulatie
o Het kan NOOIT causaliteit bewijzen, maar omgekeerd als er een causale relatie is
moet er statistisch verband zijn
Kan een idee geven v/d samenhang van kenmerken = veronderstellingen = leidt tot
hypothesen
Gegevens worden gecategoriseerd, gemeten, vergeleken en tegenover elkaar afgezet
o Welke gemaakte categorieën, wat met wat vergeleken wordt, manier van meten
wordt bepaald door de wetenschappelijke theorie die men gebruikt
Is reductionistisch: rijke info wordt herleid tot naakte cijfers
o Reden: is het begin v/e reeks vragen die de criminoloog stelt
2. Inductieve of inferentiële statistiek: veralgemenen van de gegevens die verzameld zijn door de
steekproef, naar de onderzoekspopulatie waaruit ze getrokken werden
PROBLEEM: Kan de steekproef veralgemeend worden tot de totale onderzoekspopulatie?
Toetsbare stellingen= geformuleerde veronderstellingen = hypothesen
o Noodzakelijk hierbij: vakliteratuur onderzocht en vorming v/e theorie
o DEF hypothesen: specifieke stellingen betreffende causale relaties tussen 2 of meer
concepten die afgeleid zijn uit de theorie
o 3 soorten hypothesen: onderzoekshypothese + nulhypothese + alternatieve hypothese
Onderzoekshypothese: formuleert de betrokken stelling in positieve zin, dus in
de richting v/d verwachtingen van de onderzoeker (af te leiden uit opgave)
Nulhypothese H 0 :de hypothese dat er geen verband bestaat tussen de
variabelen een omkering van de onderzoekshypothese
Bv geen verband tussen geslacht en slachtofferschap van seksueel geweld
Alternatieve hypothese H a : indien er wel een verband is, mag de nulhypothese
verworpen worden -> klopt (voorlopig) de onderzoekshypothese, deze heten we
dan de alternatieve hypothese
We toetsen een hypothese via de nulhypothese. Hypotheses zijn nooit definitief
bewezen, ze kunnen weerlegd worden. Wnr de nulhypothese niet klopt achten
we de hypothese als correct
Hypothesen testen = verbanden onderzoeken
2
,3. Statistiek en de beantwoording van beschrijvende en verklarende onderzoeksvragen:
Soorten onderzoeksvragen !!
Beschrijvende Verkennende Verklarende
onderzoeksvraag onderzoeksvraag onderzoeksvraag
DEF: Kwantitatieve DEF: Aftasten van DEF: Verschillen of
beschrijving van een (nieuwe) veranderingen in
fenomeen veronderstellingen/ uitkomstvariabelen
Gaat voorkomende kwantitatieve verklaren vanuit de
verschijnselen opsommen verkenning v/h kenmerken v/h theoretisch
en mogelijk in verband fenomeen paradigma = statistisch
legen met andere “Is er een verband verklaren van verschillen
verschijnselen zonder tussen…?” tussen eenheden door
verklaring kenmerk(en) v/d eenheid
Tussen beschrijvende
Gebruikt beschrijvende en verklarende Is het meest complex
statistiek onderzoeksvraag.
Makkelijkst
De eerste stap in een onderzoek is info verzamelen en dus gebruik maken van de
beschrijvende en verkennende. Daarna kunnen we over gaan naar de verklarende.
Probleemstelling moet nauwkeurig afgebakend worden want het geeft richting aan het
onderzoek, bepaalt resultaten
4. Statistische eenheden:
DEF: onderzoekseenheden waar men een uitspraak over wil doen, die eenheden hebben
kenmerken variabelen
Verschil impliceert onzekerheid
o We willen deze onzekerheid modeleren of voorspellen en gaan dus onderzoek doen
o We gaan uitspraken doen in termen van waarschijnlijkheid nooit 100% zeker
Kenmerken: variabiliteit en centraliteit
Variabiliteit/spreiding (= veranderbaarheid, diversiteit, verschillen): wordt uitgedrukt in
spreidingsmaten:
o De eenheden die we onderzoeken moeten verschillen op relevante kenmerken
o CRUCIAAL: per kenmerk moet er minstens 2 verschillende waarden zijn + de eenheden
moeten verspreid zijn over de categorieën of waarden v/d kenmerken
o Bv: de verschillende onderzoekseenheden plegen met andere frequenties criminaliteit
o DEF constante: een kenmerk dat niet varieert of een kenmerk waarop alle eenheden
dezelfde waarde hebben niet bruikbaar in statistiek er is zekerheid
o Er moet voldoende spreiding zijn binnen de variabelen, wanneer er onvoldoende
spreiding is binnen de verschillende variabelen (=wanneer kenmerken zich vooral
3
, concentreren in 1 bepaald onderscheid) kunnen we een kenmerk indien nodig
schrappen, eenheden in de steekproef vergoten of probleemstellingen herzien
Binnen de criminologie vaak problematisch bv. de spreiding van slachtoffers,
daders, gevangenen concentreren zich op 1 bepaald onderscheid
Centraliteit: geeft grote tendensen weer: de modus, de mediaan…
5. Univariate, bivariate en multivariate beschrijvende analyse:
Soorten analyses zijn afhankelijk van het aantal variabelen die je erbij wilt betrekken:
Univariate analyse: analyse van 1 kenmerk dat varieert
o Gaat de verdeling v/e kenmerk accuraat beschrijven
o Gebruikt maten van centraliteit en spreiding
Bivariate analyse: bestudeert samenhang tussen 2 kenmerken, 2 kenmerken van buurten
beschouwen we als 2 onderzoekseenheden (bv. criminaliteitsniveau en
werkloosheidsniveau)
o Is geïnteresseerd in de correlatie/samenhang. Hoe verschillen in 1 variabele
samenhangt met verschillen in een andere variabele
Multivariate/multivariabelen analyse: bestudeert de samenhang tussen 3 of meerdere
kenmerken
o Gebruikt regressiemodellen !!
Belangrijkste, je moet met alle variabelen rekening houden in een analyse! Het volstaat niet
om enkel een relatie tussen 2 kenmerken te bestuderen
Opletten!
Univariate en bivariate volstaan niet kan anders tot foute conclusie leiden
Je voorspelt op basis van gegevens, die kunnen correct of vals zijn
Statistische analysetechnieken zijn dependent of niet-dependent:
- dependent: we veronderstellen een oorzaak-gevolg relatie
- niet-dependent: we veronderstellen geen oorzaak-gevolg relatie (enkel samenhang)
de samenhang tussen variabelen is dus niet altijd causaliteit!
6. Meetniveaus van variabelen:
De wijze waarop je variërend kenmerk meet bepaalt het meetniveau v/d variabele
HIËRARCHIE
Het meetniveau bepaalt welke statistische analysetechnieken mogelijk zijn
o Hoe hoger het meetniveau hoe meer mogelijkheden Ratio
Het meetniveau bepaalt de wijze waarop gegevens grafisch weergegeven Interval
worden, de parameters + de analysetechnieken die men mag gebruiken
Ordinaal
Altijd zo hoog mogelijk meetniveau gebruiken
o Sommige kenmerken kan men niet in meetniveau verhogen: geslacht Nominaal
4