Samenvatting statistiek (Kamiel)
Algemene begrippen
Statistiek -> studie van gegevens
Populatie = alle verzamelingen die voorwerp zijn van een studie (bv. amerikanen)
Variabelen = alle kenmerken van een object dat je met een cijfer kan uitdrukken of via label.
(bv.lengte,...)
Steekproef = het gemeten gedeelte van de populatie aangezien heel de populatie
ondervragen meestal onmogelijk is. Enkel een steekproef nemen bevordert : de kosten van
het onderzoek, de duur, individuen worden telkens bijgemaakt -> moeilijk of omdat het
onderzoek een vernietigend karakter heeft.
Populatieparameter = waarde berekent uit alle elementen van de populatie -> gans de
populatie is ondervraagt en je berekent vervolgens het gemiddelde.
Steekproefparameter = waarde berekent uit de resultaten van een steekproef.
We maken alsook een onderscheidt tussen beschrijvende en verklarende statistiek.
Beschrijvende statistiek = de verzamelde gegevens samenvatten en presenteren :
- Numerieke methode -> frequentietabellen,...
- Grafische methode -> histogram, boxplot,...
Verklarende statistiek = uitspraken doen over de populatie op basis van
steekproefresultaten.
- Schattingstheorie -> schatting vd populatieparameter adhv de steekproefparameter.
- Toetsingstheorie -> we hebben een “hypothese” en we gaan deze verwerpen of
bevestigen.
De populatieparamer is altijd hetzelfe getal, deze groep kan niet wijzigen. Bij een
steekproefparameter kan het getal van onderzoek tot onderzoek licht wijzigen doordat andere
mensen binnen de populatie bevraagd worden. Je mag overigens nooit zeggen -> dit is een groot
verschil want dat is subjectief, je moet dit bewijzen met standaardafwijkingen etc.
Hoofdstuk 2 : Gegevens verzamelen
Er zijn 2 verschillende soorten variabelen :
Kwalitatieve variabele -> iets dat niet meetbaar is bv. geslacht
Kwantitatieve variabele - > iets dat meetbaar is dus altijd een numerieke waarde. Hieronder
hebben we nog een verschil tussen een discrete variabele = kan niet oneindig zijn. Of een
continue variabele = alle waarden binnen intervalgrenzen.
Het meetniveau van de variabelen :
Nominaal = er is geen logische volgorde ofzo -> bv. hoe kom je naar school ?
,Ordinaal = er is een duidelijke volgorde maar eigenlijk geen exacte afstand tussen 2
antwoorden. Bv. keuzemogelijkheden -> * slechte *matig *goed. Likert: des te meer
tussenstations, des te correcter.
Interval = hetzelfe als ordinaal maar hoe hoger de score, hoe meer het aanwezig is bij
iemand. Bv. een IQ test, des te hoger de score, des te slimmer je bent.
Ratio = hetzelfde als interval maar er is een écht nulpunt. Bv. het gewicht van iets.
Je hebt primaire bronnen en secundaire bronnen.
Je hebt verschillende soorten steekproeftrekkingen, je hebt de niet-kanssteekproeven (niet
goed) en de kanssteekproeven. Wij bekijken altijd de “aselecte steekproef”
(=kanssteekproef). Men spreekt over een aselecte steekproef als gans de populatie even
veel kans heeft om deel te nemen aan de steekproef.
Hoofdstuk 3 : Univariate analyse
Kwalitatieve variabele (nominaal)
Numerieke methode -> er wordt meestal gesproken over een absolute frequentie en een
relatieve frequentie. De absolute opgeteld geeft het aantal observaties terwijl de relatieve
opgeteld (aantal uitkomsten/totaal aantal observaties) opgeteld 1 geeft.
- Frequentietabel : cijfers in een tabel
- Kerngetallen : hoofdstuk 4 en 6
Grafische methode -> wordt voor ordinaal of nominaal meetniveau gebruikt.
- Kolomgrafiek : categorieën op de horizontale as en cijfers op de verticale as.
- Reepdiagram : omgekeerde van kolomgrafiek
- Cirkeldiagram : logisch
- Pareto-diagram : hier wordt een kolomgrafiek gecombineerd met een lijngrafiek. De
kolomgrafiek is gerangschikt van groot naar klein (relatieve waarden). De lijngrafiek
geeft de “gecummuleerde” relatieve frequentie. Dit is echt enkel mogelijk met
nominaal meetniveau.
Kwantitatieve variabele (continu) continuïteitscorrectie : je rondt alles af op 1 kg. Je
resultaat is 22kg. Het echte resultaat kan dus 21,5 of 22,4 zijn.
Numerieke methode
- Frequentietabellen : het is vaak lastig om uit 200 cijfers een conclusie te trekken.
Daarom werken we met frequentietabellen die alles in klasse verdeeld. Deze moeten
overal even breed zijn. Het klassecentrum is het getal dat exact in het midden van 1
interval ligt (er zijn er dus meerdere). Als er toch een reden blijkt te zijn om de
klassenbreedten niet gelijk te maken berekent men de frequentiedichtheid. Dit
bereken je door de absolute frequentie te delen door de klassebreedte. Bv. klasse 1 is
10 groot en 30 mensen hebben zitten hiertussen -> freq. Dichth. = 3. Maar als klasse
2 maar 5 groot is en 20 mensen zitten hiertussen -> freq. Dichth. = 4.
, Men gaat het minimum bekijken van de uitslag en het maximum en deelt dan door
het aantal klassen om te bepalen hoe breedt de klassen moeten zijn. Meestal neemt
men er 5 of 10. Deze uitkomst wordt dan de klasse-interval genoemd.
De afspraak is dat als een observatie exact op een bovengrens ligt, we deze wel
meetellen, degene op de ondergrens tellen we niet mee.
De dichtheid is de relatieve frequentie delen door de klassebreedte.
- Kengetallen : hoofdstukken 4 en 6
Grafische methode
- Stem and leaf plots : mengvorm van grafiek en een tabel.
- Histogram : dit wordt gebruikt voor alles van de vorm interval of ratio. Hier geldt ook
dat als de klassebreedten niet allemaal gelijk zijn je de frequentiedichtheid moet
nemen.
- Frequentiepolygoon : je gaat een staafdiagram maken met een lijndiagram tegelijk.
- Density plot : verfijning van een histogram en een polygoon ( de dichtheid staat op de
verticale as).
- Cumulatief frequentieplygoon (ogief) : je gaat de frequentiedichtheid cummulerend
weergeven.
Kwantitatieve variabele
Ongegroepeerde waarnemingsgetallen -> frequentietabel en een kengetal = numeriek.
Histogram als een dunne lijn en cumulatief frequentiepolygoon = vorm van een trapfunctie.
Gegroepeerde waarnemingsgetallen -> hier is geen continuïteitscorrectie toegepast +
cumulatief frequentiepolygoon en een histogram.
Percentielen
Vooraleer je percentielen kan benoemen moet je op zen minst gegevens hebben van
ordinaal niveau. Van zaken op nominaal niveau kan je niet de percentielen berekenen. Als
het gaat over 20 mensen hebben een koe en 15 mensen een varken etc. kan je geen
percentiel maken. De percentielscore is het percentage observaties dat onder een bepaalde
score ligt of er gelijk aan is. Als je een 8/10 hebt en er is een percentielscore van 0,85
betekent dat dat 85 procent van de klas minder dan 8/10 heeft of een 8/10. Een
percentielscore ligt dus altijd tussen de 0 en de 100. Men spreekt over het X-te percentiel
dan.
Berekeningsmethoden van percentielen
Een percentiel bij een kwalitatieve variabele moet je van klein naar groot ordenen. Bij
kwantitatieve variabele is dat niet zo omdat dit automatisch is.
Kwantitatief
Gegroepeerd -> formule van interpolatie, zie formularium k m is de klasse waarin het getal
zich bevindt : Pp= Lkm + v/nkm (N*p/100 -cnkm-1)
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur robbesols22. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €7,49. Vous n'êtes lié à rien après votre achat.