Statistiek, deel 1
0.1 objectieven van de statistiek en situering van de statistiekvakken hiertegenover
Verzamelen van gegevens
Soorten onderzoeksplannen
Experimenteel Correlationeel
• manipuleren van 1/ meerdere • Geen manipulatie, van ‘nature’
variabelen = ONAFHANKELIJKE • Verband tussen variabelen
VARIABELE Bv angstklachten (v1) groter bij meer mensen
• NAGAAN VAN EFECT OP 1/ meerdere (v2)
variabelen = AFHANKELIJKE VARIABELE
Bv aantrekkelijkheid op begane grond en brug
Beschrijven van gegevens
• Gegevens overzichtelijk maken door ongewone observaties en patronen/relaties
Induceren van algemenere informatie
• Gegevens waarmee onderzoeker werkt en conclusies trekt = SPECIFIEK
• Onderzoeker geïnteresseerd in ALGEMENERE conclusies
• Overstijgen van gegevens = INDUCTIE
Deductie Inductie
1 Algemeen (major en minor) 1. Bijzonder/ specifiek
2 Bijzonder/specifiek 2. Algemeen
• Redenering is meestal zeker • Sprake van kans/waarschijnlijkheid
0.2 Enkele noties uit de verzamelingsleer
Symbool In woorden
𝑥 ∈𝐴/𝑥 ∉𝐴 X is een element van A / x is geen element van A
ℕ Natuurlijke getallen (1,2,10,50,167)
ℤ Gehele getallen (-18,-5,9,16)
ℚ Rationale getallen / breuken ( 4/3, -7,6)
ℝ Reële getallen (√2, 𝜋)
∅ Lege verzameling: bevat geen enkel element
𝜇 Universele verzameling (alle mogelijke scores, alle mensen)
Verzameling definiëren
1. 𝐴 = {𝐺𝑟𝑒𝑔, 𝐴𝑚𝑦, 𝐽𝑢𝑙𝑖𝑒, 𝐴𝑟𝑛𝑒, … } : opsomming van elementen
2. [0,1] = {𝑥 ∈ ℝ|0 ≤ 𝑥 ≤ 1} : regel die kenmerkende eigenschappen van element omschrijft
Venn-diagram
,Kardinaalgetal van een verzameling
• = het aantal elementen van die verzameling
• Notatie: #A = bv 123
Deelverzamelingen
• De ene verzameling is deel van de andere verzameling
• 𝐷 ⊂ 𝐴 ⟺ (∀ 𝑥 ∶ 𝑥 ∈ 𝐷 ⇒ 𝑥 ∈ 𝐴)
• = D is een deelverzameling van A als en slechts als voor alle x waarden geldt dat x element is
van D waaruit volgt dat x element is van A
Machtsverzamelingen
• Verzameling van alle mogelijke deelverzamelingen van A: 2 𝐴
• A= {𝑎, 𝑏, 𝑐}
• 2A= {∅, {𝑎}, {𝑏}, {𝑐}, {𝑎, 𝑏} {𝑏, 𝑐} {𝑎, 𝑐} {𝑎, 𝑏, 𝑐} }
• Gebruik gemaakt van accolades aangezien de volgorde hier niet uitmaakt (anders was er
sprake van (a,b) en (b,a))
• Kardinaalgetal= #2A = 2#A = 23 = 8
Bewerkingen op verzamelingen
1. Doorsnede (∩): elementen die deel zijn van A EN B
2. Unie (∪): alle elementen die deel zijn van A EN/OF B (het geheel)
3. Verschil (∖): Alle elementen die deel zijn van A EN niet van B
4. Complement (C): 𝐴𝐶 = 𝒰 ∖ 𝐴 : het universum ZONDER A
Partitie
= opsplitsing van een verzameling in een stel niet-lege en niet-overlappende deelverzamelingen
Cartesiaans product
= productverzameling van alle geordende koppels
• A1 X A2 : = {(𝑎1, 𝑎2|𝑎1 ∈ 𝐴1 𝑒𝑛 𝑎2 ∈ 𝐴2}
• Aantal = #A1 X #A2
• R= relatie tussen 2 verzamelingen
Functie
= bij een functie f van A1 naar A2 wordt elk element van A1 gekoppeld aan precies 1 element van A2
• A1 is het domein
• Functiewaardes van A1 (dus f(A1) zijn het bereik
• BIJECTIE: functie f is een bijectie als en slechts als elk element van A2 de functiewaarde is van
precies 1 element uit A1
• INVERSE: pijlen omkeren ( geen functie meer als er niet bij elk element van A2 een pijl
vertrekt)
, Deel 1: beschrijvende statistiek
I.0 conceptueel kader
• Gegevens komen tot stand als resultaat van een experiment
• Slechts een gedeelte van de informatie die proef oplevert zal worden geregistreerd
➢ 𝜔= uitkomst van de proef
➢ Ω= alle mogelijke uitkomsten
➢ 𝑛= aantal objecten/experimentele eenheden
➢ 𝑥 i= eender welk element in de verzameling of uitkomsten
Kwalitatieve variabelen Kwantitatieve variabelen
• Bereik bestaat uit een aantal waarden • Bereik bestaat uit numerieke waarden
• Geen verdere claims • Ordening, optellen en aftrekken is zinvol
I.1 Beschrijvende statistiek met 1 variabele
I.1.1 frequentiefuncties
A. Kwalitatieve variabele
Frequentie
= hoevaak een bepaald element terug komt ( bv 7 van 30 keer thuis)
• Freq (x1) + freq(x2) + … + freq (xm) = n
• Of ∑𝑚
𝑗=1 𝑓𝑟𝑒𝑞 (𝑥𝑗 )
Relatieve frequentie
= PROPORTIE = hoevaak element voorkomt tov totaal aantal observaties
𝐹𝑟𝑒𝑞 (𝑥𝑗 )
• p(xj) = 𝑛
• Proportiewaardes zullen altijd tussen 0 en 1 liggen
• Totale proportiewaardes zullen gelijk zijn aan 1
• Voorstellen van frequentie en proportiefunctie
1. Lijndiagram (op x-as staan woorden)
2. Staafdiagram (plaats tussen de staven bij kwalitatieve variabele)
3. Taartdiagram
B. Kwantitatieve variabele
• Opnieuw kunnen frequentiefunctie freq(x) en proportiefunctie p(x) berekend worden
• Voorstellen
1. Lijndiagram (op x-as staan getallen)
2. Diagram (staven zijn aansluitend)
➢ Polygoon waarbij middelpunten van staven verbonden worden
Negatieve scheefheid Positieve scheefheid