Statistiek 1
Hoofdstuk 1: Inleiding
Soorten statistiek:
-Beschrijvende statistiek
-Inferentiële statistiek
-Verklarende statistiek (statistische analyse)
Hoofdstuk 2: Meten en meetschalen van variabelen
Beschrijvende statistiek:
-Resultaten weergeven via getallen, tabellen en grafieken.
-Samenvattend beschrijven van de kenmerken van een groep onderzoekseenheden
onderzoekspopulatie.
Terminologie en kernbegrippen:
Begrip Uitleg
Onderzoekspopulatie -Alle leden van een welkomschreven groep die je wil
onderzoeken.
-De omvang en type kan sterk variëren, moet duidelijk
omschreven zijn.
Statistische eenheid (= cases) Elementen uit de bestudeerde bevolking: mensen, schapen,
woningen, landen, regio, kranten, …
Statistiek Bestudeert de kenmerken van die bevolking
Variabele -Kernmerken van onderzoekseenheden waarin we
geïnteresseerd zijn.
-Bij sommige kenmerken zijn de waarden al een getal (leeftijd).
-Bij andere kenmerken is dit niet het geval (geslacht).
Datamartix -Cases (waarnemingseenheden): in rijen = records
-Variabelen (waarde varieert): in kolommen
-Waarden: in cellen
Parameters Kengetallen die de verdeling weergeven van een kenmerk in
een populatie voorbeeld: gemiddelde populatie (), de
standaardafwijking ()
Steekproef -Onderzoek met betrekking tot specifieke bevolkingsgroep
(populatie) vaak onmogelijk om deze volledige te onderzoeken
steekproef = deel populatie.
-Inferentiële statistiek: conclusies trekken over volledige
populatie op basis van steekproef.
Steekproefstatistieken -Statistische kengetallen van een steekproef of schatters:
gemiddelde steekproef (), standaardafwijking (s)
-Schatters of statistische maat = een numerieke samenvatting
van de steekproef uit de populatie.
Opmerkingen -Beschrijvende statistiek: populatie en steekproef.
-Inferentiële statistiek: steekproef uitspraken over gehele
bevolking.
Statistische reeks -Reeks waarnemingen
, Voorbeeld: kijkgedrag van verschillende personen.
Tijdreeks -Reeks waarneming in tijd.
-Ogenblik van waarneming is belangrijk voor interpretatie van
gegevens.
Voorbeeld: evolutie van facebookgebruik doorheen de tijd.
Dimensie van een reeks -Aantal variabelen dat simultaan wordt waargenomen of
bestudeerd.
-Unidimensionale reeks
-Tweedimensionale reeks
-Multidimensionale reeks
Waarom meten? Numerieke waarden aan objecten toekennen.
-Laat toe om vergelijkingen te maken.
-Standaarden nodig om te vergelijkende (bv. cm)
-Moderne standaarden en internationale overeenkomsten: lengtematen, tijdsmaten,
gewicht, inhoud, ….
-Statistiek heeft nood aan standaarden: gestandaardiseerde meetschalen en indicatoren.
Evidente (bv. leeftijd) en complexe (bv. inkomen) eenheden.
Wat is meten? Operationalisatie:
-Meetbaar maken van variabelen in één of meerdere vragen.
-Bepalend voor de rest van je onderzoek.
-Meestal op basis van voorafgaand onderzoek of op basis van een theorie.
-Sommige variabelen hoeven niet onderbouwd te zijn (geslacht), andere wel (armoede).
Afhankelijk en onafhankelijke variabelen:
-In veel onderzoek wens je een variabele te verklaren of relaties met andere variabelen in
kaart te brengen voorbeeld: effect van opleiding op politieke attitude (politieke attitude =
afhankelijk, opleiding = onafhankelijke attitude).
`
Meten: verdelen van de populatie P in equivalentieklassen deelverzameling van P die alle
elementen groepeert die equivalent (gelijk) zijn voor het bestudeerde kenmerk.
Meten in twee stappen:
-De verzameling X van waarden wordt de meetschaal van de variabelen genoemd.
-Een variabele is een afbeelding van een bevolking P in een verzameling X van waarden de
gemeten eigenschap of kenmerk.
Schalen: toekennen van een eigen waarde (kwalitatief/ kwantitatief) aan elke
equivalentieklasse van het ongeschaalde kenmerk.
Toekennen van getallen aan equivalentieklassen, hoe?
-Aan elke waarde van het ongeschaalde kenmerk wordt een unieke, specifieke ‘code’ of
getal toegekend.
-De toegekende waarden aan equivalentieklassen weerspiegelen de relaties die in realiteit
bestaan tussen de equivalentieklassen, en enkel die relaties.
, -Toegekende getal heeft geen intrinsieke relatie met de geobserveerde waarden (vb.
provincie = 4) de relatietussen waarden en codering is arbitrair. Bij een geboortejaar zijn
de waarde en codering gelijk aan elkaar.
Kwantitatieve versus kwalitatieve waarden:
-In de sociale wetenschap gebruikt men vaak kwantitatieve waarden.
-Voordelen: duidelijker, via computer vlotter, mogelijk tot analyse (beschrijvende maten,
relaties tussen kenmerken kunnen als algebraïsch uitgedrukt worden).
Eigenschappen en variabelen:
-Meetniveau: bepaald welke statistische analyses mogelijk zijn en welke niet. De manier
waarop je een variabele meer, bepaalt het meetniveau of de meetschaal van de variabele
(vb. inkomen). Er zijn vier meetschalen/ meetniveaus:
Rationaal
Interval Absoluut nulpunt
Ordinaal Vaste meeteenheid Vaste meeteenheid
Nominaal Rangorde Rangorde Rangorde
Classificatie Classificatie Classificatie Classificatie
1.Nominale variabelen
-Classificatie: numerieke waarde = slechte naamgeving. Je kunt niet rekenen met de
waarden die je aan variabelen hebt gegeven: numerieke waarde is slechts een naamgeving
(classificaties).
Voorbeelden: migratieachtergrond, religieuze strekking, woonplaats, politieke
partijvoorkeur, geslacht, ….
2.Ordinale variabelen
-Classificatie + rangordering: de variabele of meetschaal X is ordenbaar wanneer voor elk
paar element x1 en x2 X, men kan besluiten dat x 1 > x2 en x1 < x2. De ordenbaarheid van
waarden weerspiegelt een bestaande ordening tussen de equivalentieklassen van het
bestuurde kenmerk. Volgorde is duidelijk maar verschillen zijn niet interpreteerbaar, opties
liggen niet noodzakelijk even ver uit elkaar.
Voorbeelden: opleidingsniveaus, opiniepeiling, meningen, ….
3.Intervalvariabelen: bestaan van een meeteenheid, wiskundige berekeningen mogelijk
Voorbeelden: temperatuur (vaste meeteenheid waarbij de waarden voor de graden
betekenis toekennen aan de afstanden tussen de graden), geboortejaar, IQ, …..
4.Ratiovariabelen
-Classificatie + rangordening + meeteenheid + absoluut nulpunt: een absoluut nulpunt is
een waarde (0) die de afwezigheid van het bestudeerde kenmerk weergeeft. Er zijn
wiskundige berekeningen mogelijk. Negatieve waarden komen niet voor wanneer een
absoluut nulpunt bestaat. Ratio’s of verhoudingen zijn niet bepaald. Er kan opgeteld,
afgetrokken, vermenigvuldigd en gedeeld worden.
Voorbeelden: lengte, leeftijd, aantal vrienden op facebook, aantal uren, …. (minder dan 0
kan niet).