Kansrekening en Statistiek
Gegevens kunnen gemeten worden op verschillende types schalen: welke ? Indien je een dataset
opmeet met de persoonlijke gegevens van de inwoners van Brussel, heb je data zoals: naam,
geboortejaar, gewicht, lengte, geslacht, … Geef de schaal van deze gegevens.
- De nominale schaal: elk individu heeft een naam, er is geen overlap in deze namen. Bv.
Zwart of wit. Deze schaal is voor kwalitatieve gegevens.
- Ordinale schaal: er is een rankschikking, ordening. In deze rankschikking is er geen afstand
tussen de gegevens. Bv. Er is de afstand tussen zeer slecht en slecht is niet dezelfde als die
van goed en zeer goed. Deze schaal is voor kwalitatieve gegevens.
- Intervalschaal: bestaat uit numerieke gegevens, heeft een ordinaal + afstand. Bv. Het verschil
tussen 0°C en 10°C is dezelfde als het verschil tussen 10°C en 20°C. Deze schaal is voor
kwantitatieve gegevens.
- Verhoudingsschaal is een intervalschaal + nulpunt. Daarbij speelt de eenheid een belangrijke
rol. De °C en K gaat niet, want het nulpunt is verschillend. Bv. Omzetten van mm naar cm kan
gedaan worden door het vermenigvuldigen van een constante. Deze schaal is voor
kwantitatieve gegevens.
Naam Nominale schaal
Geboortejaar Intervalschaal of verhoudingsschaal
Gewicht Verhoudingsschaal
Lengte Verhoudingsschaal
Geslacht Nominale schaal
Welke kengetallen ken je om de spreiding van de gegevens in een steekproef weer te geven.
Definieer ze. Hoe maak je een boxplot?
Dit zijn de spreidingsmaten, ze geven een idee hoe gespreid de data is.
o Het bereik = range R = hoogste – laagste waarde = xn – x1.
2
∑(𝑥𝑖 −𝑥̅ )2 ∑ 𝑓𝑖𝑥𝑚𝑖 −𝑛𝑥̅ 2
o Variantie: 𝑠𝑛2 = en voor klassen: 𝑠𝑛2 = met 𝑓𝑖 de frequentie van de klasse
𝑛−1 𝑛−1
en 𝑥𝑚𝑖 het klassen midden.
o Standaardafwijking: 𝑠 = √𝑠𝑛2 , is de vierkantswortel van de variantie.
1
o Gemiddelde absolute afwijking: MeanAD = ∑𝑛𝑖=1|𝑥𝑖 − 𝑚𝑒𝑑 | 𝑛
o Mediaan absolute afwijking: 𝑀𝐴𝐷 = 𝑚𝑒𝑑𝑖𝑎𝑎𝑛 {|𝑥𝑖 − 𝑚𝑒𝑑 |}𝑛𝑖=1 → Mediaan van de
verzameling van elke 𝑥𝑖 waarde waarvan de mediaan is afgetrokken.
o Chebyshev’s theorema (Empirische regel): fractie van data dichter dan k keer de
1 2
standaardafwijking ≥ 1 − (𝑘)
Boxplot is het samenvatten van data door gebruik te maken van 5 getallen. Deze wordt vooral
gebruikt voor grote data ’s.
De verbinding tussen de box en het minimum en het maximum heet
de whiskers. Uitschieters worden er niet mee verbonden indien ze
aan volgende voorwaarde voldoen:
< 𝑄1 − 1,5 ∗ 𝐼𝑄𝑅
> 𝑄2 − 1,5 ∗ 𝐼𝑄𝑅
Pagina 1 van 20
,Welke kengetallen ken je om de centrale tendens van de gegevens in een steekproef weer te
geven. Definieer ze.
Kengetallen voor de centrale tendens worden ook de centrummaten genoemd. Dit geeft een idee
waar de date ligt.
1 1
o Gemiddelde: 𝑥̅ = 𝑛 ∑𝑛𝑖=1 𝑥𝑖 en voor klassen: 𝑥̅ = 𝑛 ∑𝑘𝑖=1 𝑓𝑖 𝑥𝑚𝑖 met 𝑓𝑖 de frequentie van de
klasse en 𝑥𝑚𝑖 het klassen midden.
o Mediaan = middelste meting bij het ordenen van de date van klein naar groot. 𝑚𝑒𝑑 =
𝑥𝑛+1
𝑣𝑜𝑜𝑟 𝑛 𝑜𝑛𝑒𝑣𝑒𝑛
2
{ 1 𝑥𝑛+2 𝑣𝑜𝑜𝑟 𝑛 𝑒𝑣𝑒𝑛
2
(𝑥𝑛 +
2
)
2
o Modus = meting met de hoogste frequentie. Dit kunnen ook meerdere metingen zijn = modi.
𝑥1 + 𝑥𝑛
o Midrange = gemiddelde tussen de hoogste en laagste waarde: 2
1
o Gewogen gemiddelde: 𝑥̅ = ∑𝑛 𝜔 𝑥𝑖 met 𝜔𝑖 het gewicht.
𝑛 𝑖=1 𝑖
Welke kengetallen ken je om de positie van een datapunt in een steekproef weer te geven.
Definieer ze.
𝑥𝑖 −𝑥̅
o De standaard score of Z-score. 𝑍 =
𝑠
o Percentielen, kwartielen en interkwartielen:
𝛼
𝛼% − 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑒𝑙 = 𝜉𝛼 = 100
∗ (𝑛 + 1) en 𝜉𝛼 = 𝑥𝑝 + 𝜌(𝑥𝑝+1 − 𝑥𝑝 ). Waarbij p het hele deel is en
ρ het overschot is. Het interkwartiel is de afstand tussen de derde en het eerste kwartiel.
Indien je over een steekproef beschikt, wat is dan de relatieve en de cumulatieve frequentie ? Hoe
kun je ze grafisch voorstellen (eventueel op meerdere manieren) ? Wat is een empirische
verdelingsfunctie?
De relatieve frequentie is de frequentie uitgedrukt in percentages. Hierbij is de verticale as van het
histogram de dichtheidsschaal, uitgedrukt in percentages. En de horizontale as is verdeeld in de
verschillende klassen.
De cumulatieve frequentie wordt uitgedrukt in percentages, maar stelt niet het percentage van een
bepaalde klasse voor. Dit gebeurt door de vorige percentages van de klassen altijd op te tellen.
Deze kunnen grafisch voorgesteld worden door:
o Histogram. Waarbij de date gegroepeerd is in klassen.
o Polygoon. Dit is door op het histogram halverwege elke klassenbreedte de punten met
elkaar te verbinden.
o Cumulatief frequentie histogram. De hoogtes van de klassen met elkaar op te tellen.
o Ogief. De rechterklassepunten van het cumulatieve histogram verbinden.
𝑎𝑎𝑛𝑡𝑎𝑙 𝑚𝑒𝑡𝑖𝑛𝑔𝑒𝑛 ≤ 𝑥
De empirische verdelingsfunctie: 𝑓𝑛 (𝑥) = 𝑛
Het is een trapfunctie, er zijn sprongen in de grafiek. De grafiek start altijd bij 0 en eindigt altijd bij 1.
Pagina 2 van 20
, Geef de definities van universum, gebeurtenis en het begrip kans. Wat is een voorwaardelijke
kans?
Universum Ω is de verzameling van alle mogelijke uitkomsten van een experiment. Een gebeurtenis is
een deelverzameling van het universum. Als deze deelverzameling maar een element bevat, dan is
het een elementaire gebeurtenis.
Mathematische betekenis van kans: een kans is een functie waarbij met elke gebeurtenis A van het
universum Ω een reëel getal P(A) geassocieerd wordt. Dit getal moet aan bepaalde voorwaarden
voldoen:
• 0 ≤ P(A) ≤ 1
• P(φ) = o en P(Ω) = 1
• Als A ∩ B = φ dan is P (A ∪ B) = P(A) + P(B)
De voorwaardelijke kans op het optreden van gebeurtenis V als gebeurtenis B heeft plaatsgevonden
en P(B) ≠ 0.
𝑃(𝑉 ∩ 𝐵)
𝑃 (𝑉|𝐵 ) =
𝑃(𝐵)
Formuleer de wet van de totale kans en de regel van Bayes. Illustreer beiden met de hulp van een
figuur. Bewijs de regel van Bayes.
De wet van de totale kans: Zij E1, E2, …, En een partitie van het
universum Ω, dan geldt voor A een willekeurige gebeurtenis:
𝑛
De wet van de totale kans: Zij E1, E2, …, En een partitie van het universum Ω,
dan geldt voor A een willekeurige gebeurtenis met P(A) > 0:
𝑃(𝐴|𝐸𝑘 )𝑃(𝐸𝐾 )
𝑃 (𝐸𝑘 |𝐴) = 𝑛
∑𝑖=1 𝑃 (𝐴|𝐸𝑖 )𝑃(𝐸𝑖 )
Om de regel van Bayes te bewijzen, moet eerst eens de productregel
uitgevoerd worden en nadien de wet der totale kans.
𝑃(𝐸𝑘 ∩ 𝐴) 𝑃(𝐴|𝐸𝑘 )𝑃(𝐸𝐾 )
𝑃(𝐸𝑘 |𝐴) = = 𝑛
𝑃(𝐴) ∑𝑖=1 𝑃 (𝐴|𝐸𝑖 )𝑃(𝐸𝑖 )
Pagina 3 van 20
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur catherinevanbel. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €10,89. Vous n'êtes lié à rien après votre achat.