Samenvatting: statistiek
H1: Samenvatten en representeren van Data
1.1 verschillende soorten data
Kwalitatieve data
Het hier om een beperk aantal uitkomstcategorieën die niet numeriek zijn.
Een vb: kleur, man/vrouw, dood/levend,….
Al deze gegevens kunnen geplaatst worden in een categorisch systeem.
Eenvoudigste voorbeeld: dichotomie= een categorisch systeem met 2 categorieën (man/vrouw).
Als men meer dan 2 categorieën heeft:
- Niet geordende categorische systemen (nominale data)
- Geordende categorische systemen (ordinale data)
Nominale data: bloedgroepen A, B, AB, O
Ordinale data: ernstig, matig, goed
Kwantitatieve data
Dit zijn gegevens die een hoeveelheid uitdrukken en verkregen worden door meten, wegen,….
Dit zijn numerieke data en kan onderverdeeld worden:
- Discreet
- Continu
Het is discreet als de observaties van die uitgedrukt worden door gehele getallen.
Vb: aantal hartslagen, aantal zwangerschappen,…
Als het continu is kan de observatie elk numerieke waarde aannemen.
Vb: bloeddruk, lengte, gewicht,…
1.2 Voorstellen van data
Frequentietabel voor categorische systemen
Elk categorie van het systeem opschrijven en d.m.v. turven bepalen hoe dikwijls
elke categorie voorkomt, zo bekomen we de frequentie van elke categorie.
Frequentietabel voor discrete data
Wanneer we n gegevens hebben, worden deze in een niet-dalende volgorde
Xi Fi
gerangschikt.
8 1
➔ Gerangschikte tabel
10 1
Een grafische voorstelling van de frequentietabel is een staafdiagram. 11 2
12 4
14 1
15 1
Totaal 10
,Frequentietabel voor continue data
Overzichtelijk door een frequentietabel met klassenindeling
Werkwijze:
1. Zoek de grootste en kleinste gegevens (afgerond)
2. Feitelijke grootste en kleinste gegevens
3. Bereken het verschil tussen de feitelijke extreme waarden
4. Deel dit door uw intervallen (gekozen: 10, 20, …)
5. Uitkomst is de klassenbreedte
Klassengrenzen= zijn de feitelijke kleinste en grootste grens van een klasse, de onder- en bovengrens
worden niet bereikt.
Klassebreedte= het verschil tussen de grootste en de kleinste klassengrens van een klasse.
Klassenmidden= de helft van de som van de grootste en kleinste klassengrens van een klasse.
Klassenfrequentie= de klassenfrequentie fi van de i-de klassen is het aantal waarnemingsgetallen dat
tot deze klasse behoort. De getallen fi vindt men door te turven.
1.3 Data resumeren
Kengetallen voor locatie
De plaats van waar de observaties zicht bevinden zijn van belang.
Gemiddelde: om het centrum van een dataset te kenmerken kan men gebruik maken van een
gemiddelde.
𝑛
1
𝑓𝑜𝑟𝑚𝑢𝑙𝑒: 𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1
Het gemiddelde wordt sterk beïnvloed door uitschieters -> mediaan
Mediaan: een rij van numerieke gegevens van groot naar klein gerangschikt en het mediaan is:
- Het middelste (oneven getallen)
- Gemiddelde van 2 middelste getallen (even getallen)
Een uitbreiding van het mediaan zijn de kwartielen.
Elke observatie in een geordende rij heeft een rangnummer.
niet-gehele rangnummers worden als volgt gedefinieerd:
𝑥(𝑖) + 𝑝(𝑥(𝑖+1) − 𝑥𝑖 )
rangnummers:
𝑛+1
- Eerste kwartiel (Q1): 4
𝑛+1
- Tweede kwartiel (Q2)/mediaan: 2
𝑛+1
- Derde kwartiel (Q3): 3 4
,Kengetallen voor spreiding
Een spreiding kan verschillende variabiliteit.
De variantie en de standaardafwijking
1
de variantie s2 van de numerieke gegevens: 𝑠 2 = ∑𝑛 (𝑥 − 𝑥̅ )2
𝑛−1 𝑖=1 𝑖
(177−200)2 +⋯.+(226−200)2
vb: 𝑠 2 = = 340
4
1
de standaardafwijking s van de numerieke gegevens: 𝑠 = √𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
vb: 𝑠 = √340 = 18.4
het bereik van de numerieke gegevens: 𝑏𝑒𝑟𝑒𝑖𝑘 = 𝑚𝑎𝑥1≤𝑖≤𝑛 𝑥𝑖 − 𝑚𝑖𝑛1≤𝑖≤𝑛 𝑥𝑖 = 𝑥𝑛 − 𝑥1
vb: bereik = 226 − 177 = 49
de interkwartielafstand van numerieke gegevens: 𝑖𝑛𝑡𝑒𝑟𝑘𝑤𝑎𝑟𝑡𝑖𝑒𝑙𝑎𝑓𝑠𝑡𝑎𝑛𝑑 = 𝑄3 − 𝑄1
vb: 𝑖𝑛𝑡𝑒𝑟𝑘𝑤𝑎𝑟𝑡𝑖𝑒𝑙𝑎𝑓𝑠𝑡𝑎𝑛𝑑 = 17 − 9.75 = 7.25
De box-plot
De box-plot is een eenvoudige grafische samenvatting van enkele belangrijke kengetallen.
Opmerkingen:
1. De box-plot laat toe sommige belangrijke kengetallen van de dataset onmiddellijk af te lezen
2. Symmetrie of scheefheid direct af te lezen
3. Kan worden gebruikt om 2 of meerdere datasets te vergelijken
, H2: kansen
2.1 universum en gebeurtenissen
Het universum van een experiment is de verzameling van alle mogelijke uitkomsten van dit
experiment.
Regels:
- 𝐴𝑐 = 1 − 𝐴 (compliment)
- 𝐴1 ∩ 𝐴2 (doorsnede, “en”)
- 𝐴1 ∪ 𝐴2 (unie, “of”)
Deelverzamelingen van een universum zullen wij in het vervolg gebeurtenissen
2.2 het intuïtieve begrip kans
noemen.
Kans bij de eerste benadering.
𝑎𝑎𝑛𝑡𝑎𝑙 𝑔𝑢𝑛𝑠𝑡𝑖𝑔𝑒 𝑔𝑒𝑣𝑎𝑙𝑙𝑒𝑛 𝑣𝑜𝑜𝑟 𝐴
De formule: 𝑃(𝐴) = 𝑎𝑎𝑛𝑡𝑎𝑙 𝑚𝑜𝑔𝑒𝑙𝑖𝑗𝑘𝑒 𝑔𝑒𝑣𝑎𝑙𝑙𝑒𝑛
Dit geldt alleen voor een eerlijke kanswaarde (eerlijke dobbelsteen,…)
Kans bij de tweede benadering
Hierbij gaan we op voorhand onderstellingen opstellen: bij zoveel keer komen we zoveel keer dit uit.
𝑛(𝐴)
De formule: 𝑃(𝐴) = lim
𝑛→∞ 𝑛
Deze is algemener dan de eerste benadering maar het nadeel hieraan is dat deze oneindig lang moet
worden uitgevoerd. Dus stellen we axioma’s in.
De axiomatische definitie is de enige die een correcte voldoening geeft aan een kanstheorie.
2.4 voorwaardelijke kans
Voorwaardelijke kans
De voorwaardelijke kans van een gebeurtenis A, gegeven dat een gebeurtenis B is gegeven:
𝑃(𝐴∩𝐵)
Formule: 𝑃(𝐴/𝐵) = 𝑃(𝐵)
Hieruit kunnen we andere regels van uit afleiden:
𝑃(𝐴∩𝐵)
1. 𝑃(𝐵/𝐴) = 𝑃(𝐴)
2. 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴/𝐵)𝑃(𝐴)
3. 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵/𝐴)𝑃(𝐵)
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur SD100. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €9,99. Vous n'êtes lié à rien après votre achat.