Beschrijvende En Inferentiele Statistiek (S_PMBIS)
Institution
Vrije Universiteit Amsterdam (VU)
Een beknopte samenvatting van 33 bladzijdes waar alle stof van module 0 t/m 13 aanbod komt.
Van de kennisclips tot de hoorcolleges en van de literatuur tot de oefentoetsen! (eindcijfer 8.5)
5. De steekproevenverdeling ........................................................................................................................ 12
12. Beschouwing van het effect van X op Y en van verklaarde variantie ........................................................ 30
13. Het interpreteren van regressieresultaten .............................................................................................. 33
,0. Introductie & Statistische concepten
Ultieme doel is door middel van data, kennis vergaren over de wereld om ons heen. Gegevens
(data) verzamelen, bewerken, interpreteren en presenteren
Beschrijvende statistiek = samenvatting van de verkregen data - hoe zien de data eruit?
Inferentiële statistiek = uitspraken en voorspellingen doen over hele populatie op basic van
de verkregen data (steekproef) wat zeggen de data van de steekproef over de gehele
populatie?
Variabelen zijn kenmerken van iets of iemand = kenmerken (v.d. speler zoals aantal goals en
leeftijd) Cases zijn die dingen of personen = spelers/team/school/bedrijf
Variabelen = verschillen (uit welke stad komen de teams uit de eredivisie?
Contant = hetzelfde (uit welk land komen de teams uit de eredivisie?
Categorische variabelen:
- Bestaan uit woorden, kenmerken en categorieën (geslacht, nationaliteit, religie)
- Nominaal = zonder rangorde, zoals nationaliteit
- Ordinaal = met rangorde, zoals team in een voetbalcompetitie
Kwalitatieve variabelen:
- Interval en ratio
- In cijfers en getallen
- Bijvoorbeeld leeftijd, gewicht, inkomen
- Hier is ook vaak een rangorde in (hoogste VS laagste of lichtste VS zwaarste)
- Discreet = variabelen met hele cijfers. Hoeveel kinderen: 0, 1, 2, 3 ect.
- Continue (Continuous) = variabelen zonder hele cijfers. Lengte, gewicht ect.
Levels of measurement
- Nominale variabele met twee categorieën = dichotoom
- Onderscheid tussen interval en ratio is niet belangrijk
- Een beter voorbeeld van een interval variabele (i.p.v. leeftijd) is tempratuur
- Leeftijd is in veel gevallen wel een ratio variabelen
2
,1. Beschrijvende statistieken
Data (statistische analyses) wordt in een data matrix gezet. (Overzicht wat altijd nodig is)
Verticaal staan alle cases (spelers) en horizontaal staan alle variabelen (leeftijd, gewicht)
CASES VARIABELEN
Player 1 Blond
Player 2 Bruin
Player 3 Blond
Player 4 Zwart
Ect. Ect.
Een data matrix kan zo heel lang doorgaan als er veel cases zijn (b.v. spelers in een
competitie). In plaats van een data matrix kan er daarom een frequentietabel gebruikt
worden met alle mogelijke variabelen.
Cumulatief percentage = percentages bij elkaar opgeteld.
Bij Continue (Continuous) categorieën = geen gehele getallen
= Intervallen gebruiken (gewicht = minder dan 70, 70-75, 76 – 80)
Van discreet naar continue is erg makkelijk, andersom is niet mogelijk.
Data samenvatten -> een frequentietabel -> grafiek
Categoriale variabelen =
- Cirkeldiagram (zie je beter het percentage, beter bij weinig categorieën)
- Staafdiagram (zie je beter de hoeveelheid cases, beter bij meer categorieën)
Kwalitatieve variabelen =
- Puntplot (handig bij maar paar observaties)
- Histogram – pareto charts (handig bij meer observaties)
- Klokvormig/symmetrisch
- Uni modaal is histogram met 1 piek en bimodaal is histogram met 2 pieken
- Scheef (niet eerlijk verdeeld, uitsteeksel)
- scheef naar links verdeeld is als je links de berg af kan skiën
3
, 1.2 Maten van centraliteit
§ Modus (MODE)
- De waarde die het meeste voorkomend
- Komt vaak voor bij nominaal of ordinaal
- Kunnen ook twee modus zijn
§ Mediaan (MEDIAN)
- De middelste waarde van je observatie
- In orde zetten van hoog naar laag
- Bij een even aantal observatie het gemiddelde nemen
- Is resistent tegen veranderingen. Als een cijfer veranderd blijft mediaan hetzelfde
§ Middel van het gemiddelde (MEAN)
- Het gemiddelde van alle waardes
- Alle waardes bij elkaar optellen gedeeld door aantal waardes
- Is niet resistent tegen veranderingen. Als een cijfer veranderd, veranderd de mean
Categoriaal = alleen modus mogelijk
Kwantitatief = mediaan of modus gebruiken
1.3 Maten van variantie
Twee maten van variabiliteit = het bereik en de interkwartielafstand
- Bereik (RANGE) = het verschil tussen de hoogste en laagste waarde
(Geen goede impressie van de variabiliteit)
- Interkwartielafstand = De afstand tussen Q1 en Q3 (IKA)
- Boxplot = is een box tussen de mediaan van Q1 en Q3
- Outliers = alles meer dan 1.5 keer de interkwartielafstand (IKA) van Q1 en Q3
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Amber2308. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.01. You're not tied to anything after your purchase.