Samenvatting Statistiek 1. Incl. uitleg hoe je een berekening moet intypen in je grafische rekenmachine. In het rood aangegeven wat belangrijk is voor het tentamen. Voor dit vak was geen boek. 8,8 tentamencijfer
Samenvatting Statistiek
Verzamelen van gegevens → Rangschikken → Analyseren → Bepaalde conclusie trekken
Het rangschikken en analyseren van gegevens = beschrijvende statistiek. VB. aloude volkstelling. Er wordt
dan niet naar verbanden of verklaringen gezocht. Als we wel naar verbanden zoeken m.b.v. statistische
methoden dan is het mathematische statistiek.
Trekken van conclusies uit gegevens= mathematische statistiek (toetsen en schatten)
Populatie= de verzameling van onderzoekseenheden waarop het onderzoek betrekking heeft. Men doet een
steekproef, omdat het verzamelen van gegevens van een gehele populatie tijdrovend en kostbaar is. Deze
steekproef moet wel representatief en aselect (willekeurig) zijn.
Variabelen
- Een variabele is een geoperationaliseerd begrip waarvan precies is aangegeven hoe het wordt
gemeten. Variabelen variëren en dus verschillende waarden aannemen. Zo heeft de variabele
‘woningtype’. VB de waarden ‘koopwoning’ en ‘huurwoning’
- Er zijn discrete variabelen (waarden zijn gehele getallen) en continue variabelen (verschil tussen
twee waarden kan willekeurig klein zijn).
o VB aantal vrienden op facebook → discrete variabele (dit kan geen komma getal zijn, want
je kan geen 1,5 vriend hebben)
o VB gemiddelde tijd per dag op facebook → continue variabele (de ene zit 1,5 uur op
facebook en de ander 45 min, dit kunnen komma getallen zijn maar kan ook discreet zijn
(1 uur op facebook))
Operationaliseren en meten: meetniveaus (NOIR) 4 schalen:
1. Nominaal
o Enkel onderscheid in categorieën
o Geen sprake van ordening
o VB: geslacht, woonplaats, huurwoning, koopwoning
2. Ordinaal
o Onderscheid in de categorieën, én er zit een ordening in de categorieën
o VB. maat kleding (S, M, L, XL). Helemaal mee eens, mee eens, neutraal, oneens, helemaal
oneens.
o Verschillen tussen deze uitkomsten zijn betekenisloos.
3. Interval
o Verschillen tussen de uitkomsten zijn wel van betekenis.
o Er is géén absoluut nulpunt, het interval tussen 2 schaalpunten heeft een numerieke
betekenis
o VB: temperatuur in graden Celsius, bouwjaar, Fahrenheit. Huis A (1970) is 20 jaar ouder
dan B (1990) en 15 jaar ouder dan C (1985)
4. Ratio
o De verhouding tussen 2 schaalpunten heeft een numerieke betekenis, er is wél een
absoluut nulpunt
o VB: lengte, gewicht, inkomen, Kelvin
Nominale en ordinale schalen worden soms ook wel categorale schalen genoemd. Berekenen van een
rekenkundig gemiddelde is uit den boze.
Interval en ratioschalen worden ook wel metrische schalen genoemd. Berekenen van een gemiddelde is wel
mogelijk en vaak zinvol.
Voorbeelden
- Het aantal verkochte oranje tompouces op Koningsdag → discreet
- De dikte van een tompouces → continu
- Het aantal milliliters regen in de maand april → continu
- Welke kleur had de tompouce toen u hem kocht: → nominaal
o Roze, Oranje, Wit of Anders
, - Hoeveel biertjes heb je thuis gedronken op Koningsdag: → 2
ordinaal
o 0 bier
o 1-2 bier
o 3-4 bier
o Meer dan 4 bier
- Heb je het Wilhelmus meegezongen op Koningsdag? → nominaal
o Ja, uit volle borst
o Ja, heel zachtjes
o Ja, gedeeltelijk (wist de tekst niet meer)
o Nee
Rangschikken
Om een indicatie te krijgen hoeveel klassen er gekozen moeten worden, gebruikt men ook wel eens deze
vuistregel: kies het aantal klassen ongeveer gelijk aan de wortel uit het aantal waarnemingen. Als bij een
indeling in gelijke klassen een aantal klassen zeer slecht bezet zouden zijn, kan men beter met klassen van
ongelijke breedte werken.
Frequentieverdelingen
- Absolute frequentie: het aantal waarnemingen per klasse
Relatieve freq. =
Frequentie : - Relatieve frequentie: ten opzichte van iets anders bepaald is. Deel van het totaal.
Totale frequentie Het aantal waarnemingen per klasse : het totaal aantal waarnemingen x 100%
- Cumulatieve frequentie of relatieve cumulatieve frequentie: percentage van
hoogstens een bepaalde waarde. Valide percentages bij elkaar optellen. Het
aantal waarnemingen dat in totaal beneden een bepaalde grens ligt. De cumulatieve frequentie kan
zowel absoluut als relatief genomen worden. 1e relatieve freq. + 2e relatieve freq. = 2e cum. 2e cum
+ 3e relatieve freq = 3e etc.
Relatief freq. Cum.freq
2 2
Data indelen in klassen 5 2+5= 7
Overzichtelijkheid voor de lezer staat voorop. In 1 oogopslag duidelijk zijn. 13 13 + 7= 20
24 24+20= 42
30 30+42= 72
Grafieken
1. Cirkeldiagram (taartdiagram, pie-chart) Rel. freq.= L2 : totaal frquentie
o Nominale variabelen
o Als je procentuele verschillen (aandeel) wil laten zien. Vlakverdeling geeft de relatieve
frequentie in percentage aan.
o Geschikt wanneer je te maken hebt met gegevens die gemeten worden op een categorale
schaal
2. Staafdiagram (bar chart)
o Nominale- of ordinale variabelen
o Staven los van elkaar tekenen, niet aan elkaar vast.
o Geschikt wanneer je te maken hebt met gegevens die gemeten worden op een categorale
schaal.
o Komt ook weleens voor in de vorm van een naalddiagram of een beelddiagram
3. Histogram
o Scale variabelen (interval en ratio variabelen)
o Geschikt wanneer je te maken hebt met gegevens die gemeten worden op een metrische
schaal
o Frequentiedichtheid= frequentie : klassenbreedte
o Bestaat uit aaneengesloten kolommen. Als je een histogram maakt van een
frequentieverdeling met ongelijke klassenbreedten is de frequentiedichtheid niet altijd
gelijk aan de frequentie.
4. Boxplot
o Scale variabelen (interval en ratio variabelen)
Centrale liggen
Voor centrale ligging speelt dit een rol:
- Maatstaven
- Spreiding van de waarnemingsuitkomsten
, 3
Ligging en spreiding bij frequentieverdelingen
Je kan indelen in:
- Losse waarnemingen
o Frequenties
o Geen frequenties
▪ Als het aantal orders allemaal 1 is, want dan heeft het geen zin om het aantal te
noemen.
- Klasse waarnemingen
o Klassen
o Klassengrenzen
o Aantal waarnemingen binnen een klasse
Centrummaten (maatstaven) voor ligging bij losse waarnemingen
- Waar ligt het zwaartepunt van de frequentieverdeling
o Wat hebben de meeste studenten gehaald (modus)
o Wat is het gemiddelde cijfer
- Gemiddelde = de som van alle scores : het aantal scores → x met een streepje erop
- Mediaan is de middelste waarneming ná ordening in grootte! → Xme
o Oneven aantal waarnemingen → middelste waarneming
o Even aantal waarnemingen → gemiddelde van de middelste 2 waarnemingen
o Als er uitschieters zijn
o GR rekent deze uit
- Modus geeft de waarneming met de hoogste frequentie aan (vaakst voorkomt) → Xmo
o Als er meerdere waarnemingen zijn die een gelijke (hoogste) frequentie hebben, is de
modus niet gedefinieerd (een gedeelde 1e plaats is niet mogelijk).
o VB. een 7,8 en een 5,6 komen het meeste voor. Als dit zo is dan is de modus geen goede
centrummaat te gebruiken
Percentielscore is een cumulatief percentage
Kwartiel- en deciel score = de scores worden opgedeeld in groepjes van respectievelijk 25% en 10%.
Sigma ∑
Sigma ∑ staat voor sommatie
→ optellen
Wiskundigen gebruiken vaak
de letter x met een ‘index’ (i)
die van 1 tot n loopt
Andere gemiddelden
Heel vaak bedoelen we met ‘het gemiddelde’ het rekenkundig
gemiddelde. Maar er zijn meerdere gemiddelden (verzonnen
receptjes om een centrummaat te bepalen):
- Gewogen gemiddelde
- Voortschrijdend gemiddelde
- Meetkundig gemiddelde
- Harmonisch gemiddelde
- Getrimd/ geminoriseerd gemiddelde
Welke centrummaat is bij deze variabele het meest geschikt en
waarom?
- Gemiddeld aantal whatsapp berichten van 15 V&M
studenten: 20, 43, 55, 34, 67, 47, 59, 61, 26, 37, 635, 39, 24, 32, 53 → mediaan, want die 635
trekt het gemiddelde erg omhoog.
- Lievelingskleur van 15 V&M studenten: geel, blauw, blauw, rood, groen, oranje, paars, blauw,
rood, roze, groen, blauw, geel, blauw, zwart →modus, kijken welke het meeste voorkomt.
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur EvelineSchipperHR. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €6,49. Vous n'êtes lié à rien après votre achat.