BEDRIJFSSTATISTIEK
Samenvatting: theorie
14/20 eerste zit --> voor oplossingen van alle oefeningen: zie ander document te koop
op Stuvia :)
,Inhoud
1.5 Onafhankelijke gebeurtenissen.................................................................................................6
1. Kansrekenen
1.1 Definities van begrippen in een kansruimte
1.1.1. Het experiment
A. Het deterministisch experiment
Men meet een bepaalde grootheid (massa, snelheid, concentratie,. . . ) en het resultaat is een
vast getal.
B. Het stochastisch experiment
De uitkomst van het experiment hangt af van het toeval. Men spreekt ook van
toevalsexperimenten (in het Engels randomexperiments).
Kanstheorie beschrijft op wiskundige wijze de wetmatigheden die dit toeval beheersen.
Een stochastisch experiment leidt dus tot een niet met zekerheid te voorspellen resultaat
o Resultaat = de uitkomst van het experiment
o De uitkomstenverzameling/universum = de verzameling van alle mogelijke
uitkomsten (Ω)
Gebeurtenis = elke deelverzameling A van Ω
Ω
o A ⊂Ω of A ⊂ 2 = de verzameling van alle mogelijke gebeurtenissen is de
verzameling van alle deelverzamelingen van Ω
o Zekere gebeurtenis = Ω
Omega vormt een deel van omega en is daarom aan zich ook een
gebeurtenis
Ze krijgt de naam zekere gebeurtenis, omdat wat de uitkomst ook zal zijn ze
zeker tot omega zal behoren
o Onmogelijke gebeurtenis = ∅ ⊂ Ω
o Enkelvoudige gebeurtenis = #A = 1
1.1.2. Mogelijke benaderingen van het kansbegrip
C. Kans als relatieve frequentie
Bij de uitvoering van een theoretisch oneindig aantal experimenten wordt de relatieve
frequentie waarmee een gebeurtenis zich voordoet een vast getal
o Relatieve frequentie als definitie voor waarschijnlijkheid
o In praktijk moeilijk om mee te rekenen, omdat
je een experiment simpelweg niet oneindig kan herhalen
het verloop van S(n)/n is zelf afhankelijk van het toeval
S (n)
P ( A )=lim ❑
n
De relatieve frequentieregel is een gevolg van de axiomatische definitie van de kanstheorie
D. De definitie van Laplace
Voorwaarde: alle enkelvoudige gebeurtenissen zijn even waarschijnlijk
Tweede probleem: om waarschijnlijkheid te definieren wordt in de verklaring het begrip
waarschijnlijkheid zelf geredeneerd
1
, ¿A
P ( A )=
¿Ω
E. De axiomatische benadering
De wiskundige ruimte gekenmerkt door specifieke rekenregels die overeenstemmen met de
wet van relatieve frequenties
Een kansruimte is een drietal van
o Uitkomstenverzameling omega
o Gebeurtenisverzameling: β= 2Ω
o Kansfunctie P
De kansruimte voldoet aan drie eigenschappen
o Positiviteit: ∀A ∈ 2 Ω: P(A) ∈ R+.
o Kans op zekere gebeurtenis P(Ω) = 1 = 100%
o De aftelbare additiviteit
Additiviteit
∀A, B ∈ 2Ω: A ∩ B = Ø ⇒ P(A ∪ B) = P(A) + P(B)
Continuiteit
Als An een rij is van gebeurtenissen zodat An ⊂ An+1 dan is:
o P(lim An) = lim P(An)
Toepassingen hiervan binnen de kanstheorie
o De wet van de grote getallen
o De centrale limietstelling
o De wet van de relatieve frequenties
1.2 Eigenschappen van een kansruimte
P(Ø) = 0
De complementsregel
Wanneer je ten hoogste of ten minste in een vraagstuk ziet staan wijst dit erop dat je de
complementsregel moet gebruiken
A ∪ A 0 = Ω met: A ∩ A 0 = Ø.
o Logisch: wat heeft A en haar complement/tegengestelde gemeenschappelijk
niets
o Het complement en A zelf vormen samen het universum
P(A’) = 1- P(A)
Uit de complementregel volgt dat elke kans tussen 0 en 1 ligt!
o 0 < P(A) < 1
De verschilregel
P(A\B) = P(A) − P(A ∩ B)
Wet van Boole: de veralgemeende somregel
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
Uitbreiding van de wet van Boole
Je kan de kans van unie van meerdere gebeurtenissen makkelijk berekenen hiermee
P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) −P(B ∩ C) + P(A ∩ B ∩ C)
Partiele ordening
∀A, B ∈ 2Ω : A ⊂ B ⇒ P(A) ≤ P(B)
o Als A een deelverzameling is van B, dan is de kans op A kleiner dan of gelijk aan
de kans op B
2
, De opbouw van eindige kansruimten
Eindige uitkomstenverzameling Ω, met #Ω = n. Kans is volledig bepaald door de waarde
van P(ωi) in n − 1 enkelvoudige gebeurtenissen.£
Kort samengevat, in een eindige kansruimte met een beperkt aantal mogelijke
uitkomsten, kunnen we de kansen van verschillende gebeurtenissen bepalen door
simpelweg de enkelvoudige kansen van de individuele uitkomsten op te tellen, zonder
dat strikt gedefinieerde axioma's noodzakelijk zijn om de kansregels te rechtvaardigen.
De wetten van De Morgan
(A ∩ B)’ = A’∪ B’
(A ∪ B)’ = A’∩ B’
De ongelijkheid van Bonferroni
De kans op het gelijktijdig optreden van meerdere gebeurtenissen wordt beperkt
De kans dat alle onafhankelijke gebeurtenissen tegelijk optreden kan niet groter zijn dan
de soms van de kansen van elke afzonderlijke gebeurtenis
De kans dat ze allemaal optreden : de kans van hun doorsnede
Dit betekent dat de gezamenlijke kans van het optreden van alle gebeurtenissen niet
groter kan zijn dan de som van de individuele kansen
P(A₁ ∩ A₂ ∩ ... ∩ Aₙ) ≤ P(A₁) + P(A₂) + ... + P(A ₙ)
als je naar meerdere gebeurtenissen kijkt en je wilt de kans berekenen dat ze allemaal
samen plaatsvinden, dan kun je de bovengrens voor die kans vinden door de kansen van
elke afzonderlijke gebeurtenis op te tellen.
De ongelijkheid van Bonferroni vind je door de wetten van Morgan toe te passen
1.3 Uniforme kansruimten
1.3.1 Definitie
De kansfuncutie op een universum is uniform indien de kansen op alle enkelvoudige
gebeurtenissen gelijk zijn (P(A) = (P(B))
1.3.2 Eigenschappen
1. Als #A = 1, dan is P(A) = 1/#Ω.
2. Kansregel van Laplace: voor uniforme verdelingen geldt: ∀A ∈ 2 Ω : P(A) = #A/#Ω.
3
,1.3.3 Tellen van uitkomsten – combinatieleer
F. Variaties en permutaties
Op hoeveel manieren kan een radiozender een keuze maken van 3 uit 9 symfonieen van
Beethoven
Er zijn n verschillende objecten
Op hoeveel manieren kunnen k objecten selecteren als volgorde belangrijk is (k<n) en er geen
herhaling is toegestaan (geen teruglegging)
G. Herhalingsvariatie
Nk
We hebben n objecten waarvan er k willen kiezen
De volgorde is belangrijk en herhalingen zijn mogelijk (experiment met teruglegging)
Bij de jokertrekking wordt er zeven keer een cijfer tussen 0 en 9 getrokken, de volgorde van
cijfers is belangrijk en herhalingen zijn mogelijk
H. Combinaties
De volgorde is niet belangrijk
Een groep van zes personen wil schaak spelen, elke keer met een andere tegenspeler?
n!/ k!(n−k)
1.4 De voorwaardelijke kans
1.4.1 Definitie
Als we de kans willen kennen dat A en B gebeuren dan is dat eerst en vooral de kans dat A
gebeurt vermenigvuldigt met de kans dat B ook gebeurt wetende dat A gebeurt
P(A∩B) = P(A) * P(B|A)
Andere formule: P(B) * (PAB) / P(B) * (PAB) + P(A) * (PAB) (in geval van hoogte Nederlanders en
Belgen)
Andere formule P(CT) = PC * PTC /P(T)
De formule kan ook anders zijn waarbij je het complement neemt van de eerste term van de
noemer
De a posteriori kans op B, onder de voorwaarde dat A zich heeft voorgedaan
In praktijk is A vaak een testuitslag, omdat het heel moeilijk na te gaan is of B zich heeft
voorgedaan
4
, Hoeveel informatie levert de gebeurtenis A op over B?
1.4.2 Wet van totale kans
Stel je voor dat je een gebeurtenis B wilt laten plaatsvinden, maar je weet dat deze
gebeurtenis afhankelijk is van verschillende "oorzaken" of "condities" die kunnen variëren.
Deze condities kunnen A₁, A₂, ..., Aₙ zijn, waarbij elk van deze condities een mogelijke oorzaak
is voor het optreden van gebeurtenis B. De kans dat B plaatsvindt, kan anders zijn afhankelijk
van welke van deze condities van toepassing is.
De wet van de totale kans stelt dat de kans op gebeurtenis B kan worden berekend door alle
mogelijke manieren waarop B kan optreden te overwegen, gegeven de verschillende
condities:
P(B) = P(B | A₁) * P(A₁) + P(B | A₂) * P(A₂) + ... + P(B | A ₙ) * P(A ₙ)
Met andere woorden, om de kans op B te berekenen, moet je rekening houden met elk van
de condities (A₁, A₂, ..., Aₙ) en de kans op B gegeven elke specifieke conditie vermenigvuldigen
met de kans dat die conditie plaatsvindt. Vervolgens tel je deze individuele kansen bij elkaar
op om de totale kans op gebeurtenis B te verkrijgen.
Dit concept wordt vaak gebruikt in situaties waarin er meerdere oorzaken zijn die van invloed
kunnen zijn op het optreden van de gebeurtenis en je wit de kans van die gebeurtenis
berekenen door rekening te houden met alle mogelijke oorzaken
1.4.3 Regel van Bayes
De regel wordt gebruikt om de kans van een oorzaak of conditie te herzien op basis van
nieuwe informatie of waarnemingen: actualisatie van de kans op basis van nieuwe informatie
o De a priori kans (A) <-> reele kans= P(AT) : de a posteriori kans
o Hoe meer gegevens je toevoegt hoe waarheidsgetrouwer de uitkomst
Gebruikt bij:
o Medische diagnose
o Machine learning en kunstmatige intelligentie
o Fraudedetectie
o Natuurlijke taalverwerking
In dit geval zijn er altijd slechts twee hypotheses A en A’
5
, I. Algemene formulering regel van Bayes
Indien meerdere disjuncte toestanden mogelijk zijn en niet enkel A en A’ kunnen we een
algemene formulering van de regel van Bayes toepassen
Kan u volgende vraag op basis van de regel van Bayes oplossen: - je hebt drie dozen
opgesteld met volgende samenstelling doos 1: 4 witte en 6 zwarte bollen doos 2: 3 witte
en 2 zwarte bollen doos 3: 8 witte en 7 zwarte bollen Wat is de kans dat je uit doos 1
getrokken hebt? (gegeven je een witte bol trekt)
o Kans je uit doos 1 trekt = 1/3 (= de kans dat je uit doos 2 of doos 3 trekt)
o Vermenigvuldigen met de kans dat je een witte bol trekt
k (4/30 + 3/15 + 8/45) = 1
k = 45/23
1.4.4 Kettingregel
J. Het driedeurenprobleem (Monty Hall paradox)
De hoofdprijs is een auto. Drie deuren: de auto en twee fopprijzen. De kandidaat mag ´e´en
deur kiezen. Spelleider opent een andere deur waarvan hij weet dat er een troostprijs is.
Daarop krijgt de kandidaat de kans om van deur te veranderen. Is het verstandig om dit te
doen?
Je hebt nieuwe informatie over de deur die naar de hoofdprijs leidt dus heeft het n zin van
gedachten te veranderen. Je weet immers dat de spelleider niet voor de deur heeft gekozen
die naar de hoofdprijs leidt.
o Als je ervoor kiest om bij je oorspronkelijke deur te blijven, blijft de kans dat je de
auto wint 1/3.
o Als je ervoor kiest om van deur te veranderen, wordt de kans dat je de auto wint 2/3.
K. Het gezin met twee kinderen
1.5 Onafhankelijke gebeurtenissen
1.5.1 Voorbeelden en definitie
A is onafhankelijk van B ⇔ P(A|B) = P(A). Voor P(B) = 0 is P(A|B) niet gedefinieerd. In dat
geval spreken we af dat elke gebeurtenis onafhankelijk is van B
P(A ∩ B) = P(A)P(B)
6
, Als A onafhankelijk is van B is B ook onafhankelijk van A
Als A en B onafhankelijk zijn dan zijn hun complementen dat ook
o Is A onafhankelijk van B, C, ´en B ∩ C, dan is A ook onafhankelijk van B ∪ C
o Is A onafhankelijk van B, C, ´en B ∪ C, dan is A ook onafhankelijk van B ∩ C.
Opgelet: Als A onafhankelijk is van B en C, hoeft A niet onafhankelijk te zijn van B ∩ C of van B
∪ C je kan de redenering pas doortrekken naar de unie als je iets weet over de doorsnede
o Als A en B onafhankelijk zijn en C ⊂ B is een deel van B, dan zijn A en C niet
noodzakelijk onafhankelijk
o Als A en B onafhankelijk zijn, en B en C zijn ook onderling ONafhankelijk, dan kunnen
A en C afhankelijk zijn
1.5.2 Onafhankelijke en disjuncte gebeurtenissen
Disjunct - somregel: P(A ∪ B) = P(A) + P(B)
Onafhankelijk - productregel: P(A ∩ B) = P(A) · P(B)
Twee disjuncte gebeurtenissen: P(A ∩ B) = P(Ø) = 0 !!
A en B onafhankelijk ⇒ P(A) = 0 of P(B) = 0. Als Ø enige gebeurtenis is met kans 0 ⇒ A = Ø of
B=Ø
P(A) > 0 en P(B) > 0 ⇒ A en B kunnen nooit tegelijk onafhankelijk en disjunct zijn
Onafhankelijke gebeurtenissen hebben geen invloed op elkaar
Disjuncte gebeurtenissen zijn in de meeste gevallen afhankelijk van elkaar
Twee gebeurtenissen met strikt positieve waarschijnlijkheid kunnen nooit tegelijk
onafhankelijk en disjunct zijn
Onafhankelijkheid: de kans op gebeurtenis A is niet beinvloed door het feit of gebeurtenis B
al dan niet opgetreden is
Disjunct: twee gebeurtenissen kunnen niet tegelijkerktijd plaatsvinden: de kans dat zowel A
als B optreedt gelijk is aan 0
L. Toepassing 1: netwerken en productieketens
P(X)=P(A∪B)=P(A)+P(B)−P(A∩B)=P(A)+P(B)−P(A)P(B)
1.5.3 Onafhankelijkheid van meer dan twee gebeurtenissen
Het drietal A, B en C is onafhankelijk m volgende verzamelingen zijn 2 aan 2 onafhankelijk:
o A en B, A en C, B en C
o A en B ∩ C, B en A ∩ C, C en A ∩ B.
P(A ∩ B ∩ C) = P(A)P(B)P(C)
! het omgekeerde geldt niet zomaar
2. Toevalsveranderlijken
2.1 Toevalsveranderlijke of stochastische variabele
2.1.1 Het begrip toevalsveranderlijke
Het gemiddelde van iets iets = toevalsveranderlijke: stochastische variabele of
kansveranderlijke
o Van al deze grootheden kunnen we de exacte waarden niet berekenen vooraf
We kunnen ze misschien wel waarnemen op het moment dat ze zich
manifesteren
X = hoofdletter, omdat de grootte van de variabele afhangt van het toeval
7
, 2.1.2 Verband met uitkomstenverzameling en kansfuncties
Voor elk mogelijk resultaat (uitkomst) ω ∈ Ω neemt de toevalsveranderlijke X een bepaalde
waarde aan.
Ook een experiment waar het toeval een rol speelt
De toevalsveranderlijke kan men zien als een functie die elke uitkomst afbeeldt op een reel
getal
=> ook de functiewaarde is toevalsafhankelijk
2.2 Discrete toevalsveranderlijken
Kan enkel geïsoleerde waarden aannemen, een eindig aantal of een oneindig, maar wel
aftelbaar aantal waarden <-> continu: continuum van waarden
2.2.1 Kansmassa-functie
De kansmassafunctie geeft voor iedere mogelijke waarde x die een discrete
toevalsveranderlijke kan aannemen de kans dat die waarde wordt aangenomen
2.2.2 Cummulatieve verdelingsfunctie
De cummulatieve verdelingsfunctie geeft voor iedere reele waarde x de kans dat X kleiner of gelijk is
aan x
De cummulatieve verdelingsfunctie van een discrete toevalsveranderlijke is altijd een trapfunctie die
stijgt van links naar rechts. Ze begint bij 0 en eindigt steevast op 1
8
, De functie SX(x) = 1 − FX(x) noemt men soms de overlevingsfunctie (survival function)
2.2.3 Een fundamenteel voorbeeld: Bernoulli-verdeling
Een Bernoulli-verdeling heeft een binaire uitkomst: 0 of 1.
De kansmassafunctie heeft 1 parameter: p is kans op 1: p = P(Y = 1) met Y ∼ bernoulli(p).
Veel toevalsveranderlijken duiken op als antwoorden op vragen over herhaalde,
onafhankelijke Bernoulli-experimenten:
o 1. Aantal keer 1 bij n pogingen: binomiaal-verdeling.
o 2. Aantal pogingen tot 1ste keer 1: geometrische verdeling.
2.3 Continue toevalsveranderlijken
Het heeft geen zin een kansmassafunctie te definieren, want de kans dat een exacte waarde
zich voordoet is 0
2.3.1 Cummulatieve verdelingsfunctie
De x-waarde kan negatief zijn, maar dit is niet voor elk geval hetzelfde, sommige
cummulatieve verdelingsfuncties zullen door het punt P(0,0) gaan
2.3.2 De kansdichtheidsfunctie
De kans dat een waarde exact voorkomt bij continue toevalsveranderlijken is 0, maar je hebt
wel een aantal waarden dat een grotere kans hebben om ongeveer voor te komen
Dit drukken we uit in de kansdichtheidsfunctie
9