[TITEL VAN DOCUMENT]
[Ondertitel van document]
[DATUM]
[BEDRIJFSNAAM]
[Bedrijfsadres]
, MODULE 1: INLEIDING TOT DE STATISTIEK
1. KWA LIT ATIEVE VS. KWA NTIT ATIEVE O NDERZOE KSMETHODE N
Kwalitatieve onderzoeksmethoden:
Wanneer gegevens bestaan uit woorden of tekst hebben we dit nodig om deze woorden en
de betekenis te analyseren
Vaak interviews en focusgroepen
Kwantitatieve onderzoeksmethoden:
Wanneer gegevens bestaan uit cijfers hebben we dit nodig om die cijfers te gaan analyseren
Hier gaan we het in deze cursus over hebben
Statistiek is een instrument dat ons helpt de wereld om ons heen te helpen begrijpen
Kwantitatieve onderzoeksmethoden zijn een set van tools en technieken die gebruikt wordt voor het
beschrijven, organiseren en interpreteren van informatie of gegevens.
2. O NDE RZOE KSPROCE S
2.1 GE NE REE R E EN O NDERZO EKSVRAAG
Pagina | 1
,Elk onderzoek begint met een duidelijk geformuleerde vraag of probleem waarop het onderzoek een
antwoord wil geven. Dit mag niet dubbelzinnig worden geformuleerd zodat het duidelijk is wat we juist
willen onderzoeken.
De onderzoeksvraag kan voortkomen uit iets wat je vast stelt doordat we de wereld observeert en er
meer over willen weten. Als we geen observatie hebben kan je ook een onderzoeksvraag genereren
door literatuur te lezen en hier verder rond te onderzoeken (dit zal vaak gebeuren bij een masterproef)
2.2 RAAD PLEEG EE N THEO RIE
De eerste stap van een onderzoeksvraag is het zoeken naar relevante theorieën. Deze zijn heel
algemeen van toepassing op alle entiteiten of situaties. Een hele set van entiteiten is een populatie.
Deze kan heel divers zijn.
Theorie: een uitleg of set van principes die een breed fenomeen verklaart en die goed onderbouwd
is door herhaaldelijk te zijn getest
Populatie: een theoretische groep waarover je conclusies wilt trekken Voorbeeld: alle potentiële
klanten
2.3 GE NE REE R E EN HY POT HE SE
Hypothese: een vooropgestelde verklaring voor een vrij beperkt
fenomeen of reeks waarnemingen
Gezien de theorie uit de vorige slide zouden we een hypothese kunnen genereren. Het is geen gok
maar een geïnformeerde poging om proberen te verklaren wat er is waargenomen.
Zowel theorieën als hypothesen proberen de wereld te verklaren, maar een theorie verklaart een
breed scala aan fenomenen en werd reeds veelvuldig getest. In tegenstelling tot een hypothese dat
een kleiner fenomeen verklaart en nog niet is getest.
2.4 VERZAME L D ATA OM D E H YPO THE SE TE TESTE N
Vooraleer je kan beginnen met het verzamelen van data, moet je eerst de variabelen definiëren.
Pagina | 2
,De gegevens je verzameld wordt een dataset genoemd. Datasets kunnen worden geschreven met 2
termen: cases en variabelen.
Een variabele wordt in een dataset weergegeven als een kolom. Wanneer je je eigen lengte en die van
je vrienden hebt gemeten, heb je de variabele ‘lengte’ gemeten. In tegenstelling tot een variabele is pi
(3,1415…) een constante en verandert nooit. Een case wordt in een dataset weergegeven als een rij.
Samengevat is een dataset een verzameling van gegevens die op een bepaalde manier aan elkaar
gekoppeld zijn. Een dataset is een spreadsheet met variabelen als kolommen en cases (of observaties)
als rijen. Elke variabele vertegenwoordigt een verzameling van één type gegevens. Een case omvat alle
gegevens over alle variabelen in de dataset uit één enkele bron.
Variabele: Alles dat kan worden
gemeten en dat kan verschillen (of
veranderen of variëren) tussen
entiteiten of in de tijd.
Case: De gegevens uit één bron van
één of meerdere variabelen.
VIE R T YPES VARIABE LE N:
Afhankelijke variabele:
Als eerste hebben we de afhankelijke variabele, hierin ben je als onderzoeken geïnteresseerd. Het is
je doel om deze variabele te begrijpen en te omschrijven, om de variabiliteit te verklaren of om deze
variabele te voorspellen. Vandaar dat dit soort variabele ook wel verklaarde variabele of uitkomst
variabele genoemd wordt.
Synoniemen: verklaarde variabele, uitkomstvariabele, response, DV, …
Onafhankelijke variabele:
De onafhankelijke variabele is de variabele die invloed heeft op de afhankelijke variabele. Er is dus een
samenhang tussen de twee types variabelen: Variatie in de afhankelijke variabele wordt verklaard door
de variatie in de onafhankelijke variabele(n). Bijvoorbeeld wanneer we een stijging of daling zien in de
onafhankelijke variabele, zullen we ook een stijging of daling zien van de afhankelijke variabele.
Synoniemen: verklarende variabele, voorspellende variabele, predictor, IV, …
Modererende variabele:
De modererende variabele moet je zien als een variabele die de relatie tussen de onafhankelijke en
afhankelijke variabele conditioneel gaat maken. Deze gaat de relatie tussen die 2 versterken,
verzwakken of misschien wel van richting doen veranderen. Het is dus een variabele die een invloed
heeft op de richting en/of de sterkte van de relatie tussen de onafhankelijke en afhankelijke variabelen
Synoniemen: interactie, MV, …
Pagina | 3
, Mediërende variabele:
Een mediërende variabele helpt om het verband tussen de onafhankelijke en afhankelijke variabele
beter te begrijpen. Deze gaat verklaren waarom de onafhankelijke variabele een invloed gaat hebben
op de afhankelijke variabele. Het is een variabele die optreedt tussen het tijdstip dat de onafhankelijke
variabele invloed begint uit te oefenen op de afhankelijke variabele en het moment dat de impact
duidelijk is.
Synoniemen: interveniërende variabele, IVV
Controlevariabele:
Eigenlijk zouden we ook nog een vijfde soort variabele kunnen definiëren, namelijk de
controlevariabele. We kunnen dit beschouwen als een onafhankelijke variabele, maar deze behoren
niet tot de kern van je probleemstelling. Vaak gaat het hier om socio-demografische variabelen zoals
leeftijd en geslacht. We zijn niet specifiek geïnteresseerd in de impact van deze variabele, maar we
willen zeker zijn dat we controleren voor de mogelijke variatie in de afhankelijke variabele die
verklaard wordt door deze controlevariabele.
MEET V ARIA BE LE N
Zoals we net gezien hebben, moeten we om onze hypothese te testen eerst gegevens verzamelen. Dit
wordt gedaan door het meten van variabelen. Om de variabelen te kunnen meten, moeten we ze eerst
definiëren en operationaliseren. Dit heeft belangrijke implicaties voor de analyses die we kunnen
uitvoeren. Het is natuurlijk ook heel belangrijk voor de interpretatie.
Voorbeeld: na de lancering van de serie Bridgerton werd al snel gemeld dat de serie al 82 miljoen
kijkers had gehaald. Wanneer echter gekeken werd naar hoe een kijker werd gedefinieerd, bleek dat
kijkers die de serie voor 5 minuten hadden gekeken en later hadden beslist dat de serie niets voor hun
was, ook werden meegeteld in die 82 miljoen. Een kijker werd gedefinieerd als iemand die de eerste 3
minuten van een aflevering had gekeken.
Wees als onderzoeker dus altijd waakzaam voor het fenomeen ‘garbage in, garbage out’. Je kan
prachtige statistische technieken toepassen, heel mooie modellen en grafieken maken, maar als de
data op een slechte manier werd verzameld, zal het resultaat ook niet goed zijn. Dit kan door een
slechte dataverzameling, slechte steekproef of wanneer de variabelen niet goed werden gedefinieerd
of geoperationaliseerd.
Wanneer we variabelen gaan meten gaan we objecten zoals personen bedrijven, afdelingen of
huishoudens beschrijven aan de hand van kenmerken, zoals lengte, leeftijd, kwaliteit van de
dienstverlening. We doen dit door cijfers of symbolen toe te kennen aan de kenmerken.
We kunnen een onderscheid maken tussen 3 zaken die we kunnen meten.
Pagina | 4