STATISTIEK I
SAMENVATTING EXAMENPERIODE 1 – JANUARI 2022
1 INLEIDING
1.2 DE BETEKENIS VAN STATISTIEK
Statistiek is de wetenschap van het leren uit data en van het meten, controleren en communiceren van onzekerheid.
1.2.2 ENKELE DEFINITIES
De populatie is de volledige verzameling van objecten of personen waarover informatie wordt gewenst.
Elementen zijn de individuele leden van de populatie (objecten of personen).
De steekproef is een deelverzameling van de populatie die feitelijk zal onderzocht worden om informatie te
bekomen.
Een variabele is een eigenschap die bij de elementen van de populatie of steekproef varieert. Vaak worden er bij
een steekproef verschillende variabelen gemeten.
Data is de verzameling van gegevens die wordt bekomen door de variabelen te meten.
De verdeling van een variabele geeft aan welke waarden worden aangenomen en hoe vaak.
Bij inductie wordt het algemene besloten uitgaande van het bijzondere. We proberen op basis van een aantal
waarnemingen tot een algemeen besluit te komen. Bij deductie wordt het bijzondere besloten uitgaande van het
algemene.
1.3 EIGENSCHAPPEN VAN VARIABELEN
1.3.1 SCHAALFAMILIES
1.3.1.1 NOMINALE SCHAAL
Bij de nominale schaal worden de waarden van de variabelen gebruikt voor identificatie zonder dat ze een
hoeveelheid aanduiden. Variabelen gemeten op nominale schaal worden ook nominale vairabelen genoemd.
Nominaal drukt uit dat de waarden van de variabelen slechts ‘namen’ zijn.
o Voorbeeld 1: Geslacht – man, vrouw of andere
o Voorbeeld 2: Rekeningnummer – 37 0000 0000 2828, 73 0000 0000 6060, etc.
Statistiek I 1
,1.3.1.2 ORDINALE SCHAAL
De ordinale schaal erft alle eigenschappen van de nominale schaal samen met een extra eigenschap: de waarden
duiden een volgorde aan. Behalve om een volgorde weer te geven, is de waarde van de variabele niet van belang.
Variabelen gemeten op ordinale schaal worden ook ordinale variabelen genoemd. Ordinaal drukt uit dat de
waarden van de variabelen geordend kunnen worden.
o Voorbeeld 1: Uitslag wedstrijd – goud, zilver of brons
1.3.1.3 INTERVALSCHAAL
De intervalschaal erft alle eigenschappen van de ordinale schaal met de extra eigenschap dat verschillen tussen
waarden een betekenis hebben. Er is echter geen absoluut nulpunt (een getal dat aangeeft dat niets van de
variabele aanwezig is). Variabelen gemeten op intervalschaal worden ook intervalvariabelen genoemd. De
benaming interval drukt uit dat gelijke verschillen op de meetschaal (intervallen) duiden op gelijke verschillen in de
variabele.
o Voorbeeld 1: Temperatuur in °C – 0, 10, -30, etc.
1.3.1.4 RATIOSCHAAL
De ratioschaal erft alle eigenschappen van de intervalschaal én heeft daarbij ook een absoluut nulpunt. Variabelen
gemeten op ratioschaal worden ook ratiovariabelen genoemd. De benaming ratio drukt uit dat verhoudingen
(ratio’s) een betekenis hebben.
o Voorbeeld 1: Lengte in cm – 0, 1, 354, etc.
Het is vooral van belang om het onderscheid te kennen tussen de nominale, ordinale en interval/ratioschaal. Het
onderscheid tussen de intervalschaal en de ratioschaal is minder van belang.
1.3.2 DISCRETE EN CONTINUE VARIABELEN
Continue variabelen kunnen tussenwaarden aannemen; tussen elke twee willekeurige waarden ligt een derde
waarde. Dit impliceert dat er tussen twee waarden oneindig veel waarden kunnen liggen. We zeggen ook dat
variabelen gemeten op een continue schaal variëren.
o Voorbeeld 1: Lengte in cm (tussen 2 en 3 cm liggen er nog vele andere waarden: bv. 2.5 cm, 2.34 cm, etc.)
Bij discrete variabelen bestaan steeds twee waarden waar geen derde waarde kan tussen liggen. Dit impliceert dat
de variabele maar een eindig aantal waarden kan aannemen.
o Voorbeeld 1: Aantal kinderen (tussen 1 en 2 kinderen ligt geen derde waarde; het is niet mogelijk om 1.5
kinderen te hebben)
Het aantal volgers op Twitter is theoretisch gezien een discrete variabele, maar omdat deze variabele veel
verschillende waarden kan aannemen, wordt er ook gezegd dat ze bijna-continu is. In de praktijk zullen we
variabelen die bijna-continu zijn als continu beschouwen.
Statistiek I 2
, DEEL I: BESCHRIJVENDE STATISTIEK
2 VISUALISEREN VAN DATA
2.1 ONDERZOEK NAAR RACIALE VOORKEUR
2.1.2 DE POPULATIE EN DE STEEKPROEF
De wijze waarop men de steekproef zal nemen, is belangrijk. De steekproef moet immers een afspiegeling zijn van
de totale populatie. Een steekproef die een goede afspiegeling is van de populatie, wordt ook representatief
genoemd.
Er zijn verschillende technieken om (theoretisch) een representatieve steekproef te bekomen. Een voorbeeld is de
aselecte streekproef: men selecteert willekeurig x aantal objecten of personen uit de populatie. Dit is echter niet
haalbaar in de praktijk. Het bekomen van een steekproef uit een populatie zal bijgevolg een compromis zijn tussen
de theoretisch beste keuze en een praktisch haalbare keuze.
2.2 CIRKELDIAGRAM
Het cirkeldiagram is een grafische voorstelling die voornamelijk gebruikt wordt voor variabelen van nominaal
meetniveau.
De absolute frequentie van 𝑥 is het aantal keer dat de waarde 𝑥 in de steekproef voorkomt.
De absolute frequentieverdeling van 𝑋 is een tabel met twee rijen/kolommen waar de eerste rij/kolom de mogelijke
waarden van 𝑋 weergeeft en de tweede rij/kolom de overeenkomstige absolute frequenties.
De steekproefgrootte 𝑛 is gelijk aan het aantal elementen in de steekproef.
De relatieve absolute frequentie van 𝑥 is de absolute frequentie gedeeld door de steekproefgrootte 𝑛.
De verdeling van een variabele geeft het geheel van mogelijke waarden samen met de absolute of relatieve
frequenties.
Cirkeldiagrammen worden afgeraden om te gebruiken omdat het menselijk oog niet goed in staat is om de
oppervlaktes van een cirkeldiagram te beoordelen.
2.3 STAAFDIAGRAM
In een staafdiagram worden de verschillende waarden van de variabele horizontaal weergegeven en bij elke waarde
wordt een rechthoek getekend waarbij de hoogte gelijk is aan de absolute frequentie of de relatieve frequentie.
Alle rechthoeken moeten even breed zijn en de ruimte tussen twee rechthoeken moet ook steeds dezelfde zijn.
Staafdiagrammen worden gebruikt voor variabelen van nominaal of ordinaal niveau.
2.4 HISTOGRAM
Om een histogram te maken, moeten we eerst de data groeperen. We verdelen de data in klassen of intervallen
]𝑎, 𝑏].
De klassenbreedte van een interval ]𝑎, 𝑏] wordt gegeven door 𝑏 − 𝑎.
Statistiek I 3
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur phoebevani. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €5,99. Vous n'êtes lié à rien après votre achat.