Statistiek voor Bedrijfskunde
Module 1 - Inleiding tot de statistiek
Wetenschap: gaat over het verzamelen van data en verklaringen zoeken voor wat die data
ons vertellen.
Kwalitatieve en kwantitatieve onderzoeksmethoden
Kwalitatieve onderzoeksmethoden: wanneer gegevens bestaan uit woorden of tekst.
è Kwalitatieve onderzoeksmethoden nodig om de woorden en de betekenis te analyseren.
è Bv. interviews en focusgroepen.
Kwantitatieve onderzoeksmethoden: wanneer gegevens bestaan uit cijfers.
è Kwantitatieve onderzoeksmethoden nodig.
è Onderwerp van deze cursus.
Kwantitatieve onderzoeksmethoden = een set van tools en technieken die gebruikt wordt
voor het beschrijven, organiseren en interpreteren van informatie of gegevens.
Voorbeelden:
“Minder dan 5% van de volwassenen doet elke dag 30 minuten aan lichaamsbeweging.”
“Kinderen brengen meer dan 7,5 uur per dag door voor een scherm.”
“Voor kinderen van 2 tot 18 jaar is 40% van de totale dagelijkse calorieën afkomstig van
toegevoegde suikers en vetten.”
è Al deze getallen zijn afkomstig uit data en uit statistische analyse van deze data.
è Statistiek helpt bij het trekken van conclusies op een verantwoorde manier.
De gemiddelde leeftijd dat een kind gaat kruipen is tussen de x- en y-aantal maanden.
Sommige baby’s kruipen eerder en sommige later, hetgeen niet direct wil zeggen dat het
kind een ontwikkelingsprobleem heeft.
è Er bestaat variatie rond het gemiddelde. De variatie wordt alleen problematisch in
extreme gevallen.
Voorbeeld misleidende reclame Colgate:
Consumenten werden ertoe gebracht te geloven dat 80% van de tandartsen Colgate
aanraden, terwijl 20% andere merken aanraden. Uiteindelijk bleek dat ze uit verschillende
merken konden kiezen (en niet slechts één) dus andere merken konden net zo populair zijn
als Colgate.
1
,Onderzoeksproces
Onderzoeksproces
Wat je doet Hoe je het doet Waar je het op doet
Genereer een Observeer de wereld
onderzoeksvraag of lees
Raadpleeg een
theorie
Genereer een
hypothese
Populatie
Verzamel data om
de hypothese te Meet variabelen
testen
Steekproef
Beschrijvende en
Analyseer de data inferentiële
statistiek
Veralgemeen de
resultaten
Populatie
Genereer een onderzoeksvraag
Elk onderzoek begint met een duidelijk geformuleerde vraag of probleem waarop het
onderzoek een antwoord wil geven.
Onderzoeksvraag: moet ondubbelzinnig worden geformuleerd zodat we precies weten
waarin we geïnteresseerd zijn en welke doelgroep we willen bestuderen.
Voorbeeld:
Ben is eigenaar van een lokale ijsketen met vijf locaties. De verkoop op sommige locaties is
gedaald en hij wil de oorzaak daarvan vaststellen. Hij vermoedt dat sommige
winkelmanagers geen belang hechten aan klanttevredenheid. Uiteraard heeft hij meer dan
een buikgevoel nodig om hen ervan te overtuigen hun manier van werken aan te passen.
Daarom besluit hij dit verder te onderzoeken en begint hij aan zijn onderzoeksproces met
het genereren van de onderzoeksvraag: ‘Verschilt de klanttevredenheid tussen de vijf
locaties?’
Raadpleeg een theorie
Theorie: een uitleg of set van principes die een breed fenomeen verklaart en die goed
onderbouwd is door herhaaldelijk te zijn getest.
è Theorieën zijn heel algemeen van toepassing op alle entiteiten of situaties. Een hele set
van entiteiten staat bekend als een populatie.
Populatie: een theoretische groep waarover je conclusies wilt trekken.
Bv. alle potentiële klanten.
è Een populatie kan heel divers zijn.
2
,Verschillende soorten wetenschappers kunnen zich richten op verschillende populaties.
Bv. een econoom kan geïnteresseerd zijn in de populatie van klanten, kleine ondernemingen,
werknemers of managers.
Bv. een bioloog kan geïnteresseerd zijn in de populatie van kleine cellen.
Voorbeeld ijsketen:
Ben wil conclusies trekken over klanten in het algemeen waardoor klanten de populatie
vormen waarin hij geïnteresseerd is. Om de onderzoeksvraag van Ben te beantwoorden,
kunnen we beginnen met de theorieën over klanttevredenheid. Een theorie zegt dat de
tevredenheid wordt beïnvloed door vele factoren waaronder een vriendelijke en
behulpzame winkelmanager.
Genereer een hypothese
Hypothese: een vooropgestelde verklaring voor een vrij beperkt fenomeen of reeks
waarnemingen.
è Geen gok, maar een geïnformeerde poging om trachten te verklaren wat er is
waargenomen.
Verschil theorie en hypothese:
• Theorie: verklaart een breed fenomeen en werd reeds veelvuldig getest.
• Hypothese: probeert typisch een enger fenomeen te verklaren en is nog niet getest.
Voorbeeld ijsketen:
Op basis van theorieën die stellen dat klanttevredenheid wel degelijk afhangt van de
winkelmanager, kan volgende hypothese worden gegenereerd:
‘Klanttevredenheid verschilt per winkellocatie.’
Verzamel data om de hypothese te testen
Dataset: een verzameling van gegevens die op één of andere manier aan elkaar gekoppeld
zijn. Het is een spreadsheet met variabelen als kolommen en cases/observaties als rijen.
è Datasets kunnen worden beschreven met twee termen: variabele en cases.
3
,Variabele: alles dat kan worden gemeten en dat kan verschillen (of veranderen of variëren)
tussen entiteiten of in de tijd.
è Wordt in een dataset weergegeven als een kolom.
è Elke variabele vertegenwoordigt een verzameling van één enkel type gegeven.
Variabele ó Constante: verandert nooit. Bv. ∏
Case: de gegevens uit één bron van één of meerdere variabelen.
è Wordt in een dataset weergegeven als een rij.
è Een case omvat alle gegevens over alle variabelen in de dataset uit één enkele bron.
Voorbeeld ijsketen:
Om de hypothese te testen, moeten we gegevens verzamelen die we achteraf zullen
analyseren. Ben verzamelt informatie over de klanttevredenheid in elke winkel. De gegevens
die Ben verzamelt, wordt een dataset genoemd. In onze dataset zijn winkel, Q1, Q2 en Q3 de
variabele. Case 1 bevat data voor de vier variabelen. Een A voor de winkelvariabele, 2 voor
de Q1-variabele, 5 voor de Q2-variabele en ja voor de Q3-variabele.
⚠ Opgelet (belangrijk!): verschillende soorten variabelen vereisen verschillende analyses!
Variabele
Kwalitatief Kwantitatief
Categorisch Scale
• Kwalitatieve variabele (categorische variabele): een categorische variabele is
opgebouwd uit categorieën. Bv. dieren.
è In zijn eenvoudigste vorm benoemt een categorische variabele slechts twee
verschillende soorten dingen. Bv. dood of levend, ja of nee.
è = Binaire of dichotome variabele: er zijn slechts twee categorieën en een entiteit
kan slechts in één van deze twee categorieën geplaatst worden. Bv. je rookt of je
rookt niet. Op de vraag of je roker bent, kan je slechts met ja of nee antwoorden.
⚠ Opgelet: kwalitatieve gegevens zijn niet-numeriek van aard, maar kunnen wel als
een getal worden gecodeerd. Een onderzoeker kan bv. nummer 1 aan dood en
nummer 2 aan levend toekennen.
Codering: het aanduiden van categorieën d.m.v. getallen. De cijfers betekenen niet
meer dan de namen van de categorieën, maar het kan handig zijn om de cijfers te
gebruiken om verschillende categorieën aan te duiden.
è Het is zinloos om berekeningen te maken met variabelen die gecodeerd zijn d.m.v.
getallen.
• Kwantitatieve variabele (schaal variabele): variabelen die een bepaalde numerieke
weergave kunnen hebben en die numeriek enige informatie bevatten.
Bv. lengte, leeftijd, gewicht, …
è Er kan gerekend worden met dit soort variabelen.
Bv. optellen van de leeftijd van 2 personen.
4
, Variabele
Kwalitatief Kwantitatief
Categorisch Scale
Nominaal Ordinaal Interval Ratio
Meetniveau (meetschaal): de relatie tussen wat wordt gemeten en de getallen die
vertegenwoordigen wat er wordt gemeten.
• Kwalitatieve variabele (categorische variabele)
o Nominale variabele: beschrijvingen of labels zonder gevoel voor orde.
§ Bv. nationaliteit, soort chocolade, kleur. We kunnen niet zeggen dat
rood superieur is aan andere kleuren of we kunnen nationaliteiten
niet rangschikken.
§ è Eenvoudigste meetschaal.
1 2 3
1 2 3
4 5
1 1 1 12 2 2 23 3 3 43 4 4 4
o Ordinale variabele: hebben een betekenisvolle volgorde.
§ Bv. olympische medailles, rang, tevredenheid. Olympische medailles
kunnen van hoog naar laag worden gerangschikt.
11 1 22 2 33 3 44 4
⚠ Opgelet: de intervallen tussen de waarden in de schaal zijn mogelijk niet
gelijk. Er kan een groot verschil zijn tussen tevreden en ontevreden, maar een
kleiner verschil tussen tevreden en zeer tevreden.
Bv. de kloof tussen de eerste van twee lopers in een race kan klein zijn, terwijl
er een grotere kloof is tussen de tweede en de derde.
5
,• Kwantitatieve variabele (schaal variabele)
o Interval variabele: deze meetschaal heeft geordende categorieën en vereist
ook dat de intervallen tussen de categorieën gelijk zijn. Intervalschalen
hebben geen echt nulpunt en kunnen waarden onder 0 vertegenwoordigen.
§ Bv. kalenderjaar, temperatuur.
§ Een interval van 1 kalenderjaar (2005-2006) (2014-2015) heeft altijd
dezelfde betekenis. Het verschil tussen 80 en 90°C is hetzelfde als het
verschil tussen 90 en 100°C, maar 100°C is niet twee keer zo heet als
50°C. 0°C is geen echt nulpunt omdat het niet betekent dat er geen
temperatuur is.
o Ratio variabele (verhoudingsvariabele): deze meetschaal gaat een stap
verder dan de interval variabele door te eisen dat naast de vereiste van de
intervalvariabelen, de verhoudingen of ratio’s van waarde langs de schaal
zinvol moeten zijn. De schaal moet een echt zinvol nulpunt hebben. Dit
betekent dat het nulpunt een volledige afwezigheid aangeeft van het ding dat
je aan het meten bent.
§ Bv. gewicht, leeftijd, lengte, behaalde punten op een examen.
§ Het verschil tussen 100 en 150 kg is hetzelfde als het verschil tussen 0
en 50 kg. 0 kg is een echt nulpunt omdat het betekent dat er geen
gewicht is. Het hebben van een betekenisvol nulpunt betekent dat
verhoudingen en intervallen worden gehandhaafd langs de
meetschaal. 20 kg is 2 x zo zwaar als 10 kg en 5 kg is de helft van 10 kg.
6
, Variabele
Kwalitatief Kwantitatief
Categorisch Scale
Nominaal Ordinaal Interval Ratio
Discreet Continu
Continu à Discreet
19 20 21 40
Discreet à Continu
19,8 36,7 86° 86,1° 86,14° 86,145°
• Discrete variabele: kunnen een eindig aantal verschillende gehele getallen
aannemen.
è Waarden voor deze variabele worden meestal verkregen door te tellen.
Het aantal studenten in een klas kan bv. 19, 20, 21 of 40 zijn maar niet 19,8 of 36,7.
è Kwalitatieve of kwantitatieve variabelen.
• Continu variabele: hebben een oneindig aantal fractionele waarden.
è Waarden voor deze variabele kunnen niet worden geteld.
Als je bv. leeftijd zou tellen, dan zou het een eeuwigheid duren want er zijn jaren,
maanden, dagen, uren, minuten, seconden, milliseconden, nanoseconden, …
Hetzelfde geldt voor temperatuur. We hebben 86°C, 86,1°C, 86,14°C, 86,145°C, …
è Kwantitatieve variabelen.
⚠ Opgelet: het onderscheid tussen continu en discrete variabele kan vervagen. Continu
variabele kunnen in discrete termen worden gemeten. Bv. bij het meten van leeftijd
gebruiken we zelden nanoseconden, maar jaren. Het tegenovergestelde kan ook waar zijn.
We behandelen discrete variabele vaak alsof ze continu zijn. Bv. aantal partners van
vrouwelijke twintigers is gestegen van 2,3 naar 3,5. Niemand in de steekproef had 3,5
partners.
⚠ Opgelet: kwalitatieve variabelen zijn altijd discreet!
• Direct meetbare variabele: variabele die direct gemeten kunnen worden.
Bv. hoogte, gewicht en leeftijd. Je kan iemands lengte waarnemen en met een
meetlat direct meten.
7