Met deze samenvatting haalde ik een 12 in tweede zit.
Aangeraden!!!: neem deze samenvatting mee naar de lessen! Zonder de bijhorende uitleg kan het nog steeds Chinees lijken, maar met de bijhorende uitleg van de prof, zou je alvast de theorie veel beter beet moeten hebben waardoor de oefeningen o...
De cursus vertrekt vanuit univariate, bivariate en multivariate statistiek. Het verschil tussen deze is vrij eenvoudig!
1. Univariate: we doen een analyse aan de hand van 1 kenmerk dat varieert. Belangrijk hierbij is om de verdeling
accuraat te beschrijven (centrum en spreidingsmaten) -> dit komt dus overeen met beschrijvende statistiek = gaat op
in haar datareductietechniek en kijkt hoe we data overzichtelijk kunnen presenteren. Gegevens wprden dus tot
categorieën terug gebracht.
2. Bivariate: hierbij bespreken we een verband tussen x en y. Het gaat hier om de samenhang tussen 2 kenmerken
3. Multivariate: we doen een analyse over meer dan twee kenmerken
1..1 basisconcepten
..
1) onderzoekspopulatie: dit is de verzameling van individuen waarover we een uitspraak
willen doen of de verzameling van onderzoekselementen
-een eenduidige definitie is van belang alsook het feit dat deze onderzoekspopulatie vaak
gebonden is aantijd en ruimte-> zo zal het onderzoek dat je kan uitvoeren afhangen van je
populatie. Dit is bv. Belangrijk voor je veralgemening
2)onderzoekselementen/ statische eenheden/ cases (deze termen slaan dus allemaal
op hetzelfde!) : dit zijn de eenheden aar we uitspraken over willen doen. Dit zijn
onderdelen van de realiteit waarop ons onderzoek betrekking heeft (inwoners van een
bepaald gebied, studenten/leerlingen van een school)
3) analyse-eenheid: de eenheid waarop de analyse gebeurt-> hierbij hebben we het dus
over bv. Een onderzoek dat gebeurt via kranten
4) kenmerk: een eigenschap van een element
5) variabele: dit zijn de kenmerken van de eenheden die varieren en die verschillende
scores kunnen hebben op een bepaald kenmerk.
6) de uitkomstenverzameling: alle mogelijke uitkomsten van een variabele
7) meten: volgens een bepaalde procedure vaststellen van de waarde van een kenmerk bij
een element. Hier ga je waarde toekennen aan de variabele
-> de eenheden waar je uitspreken over doet dienen bij voorkeur spreiding te vertonen ->
je wil immers de verschillen en de tendensen onderzoeken
-> iets wat niet varieert is een constante en kan je dus niet gebruiken voor statistisch
onderzoek —> belangrijk bij het meten!
1. Nauwkeurigheid/exactheid
2. Betrouwbaarheid
3. Validiteit= mate waarin de indicator/metingen en het theoretische
concept/fenomeen dat je wil onderzioeken, overeenkomen —> het gaat hier
dus om de mate van afwezigheid van systematische fouten
-> we moeten dus meten wat er gemeten moet worden voor ons onderzoek
, Hier deel ik al even het verschil mee tussen beschrijvende Hypothesen zijn specifieke stellingen betreffende de (causale)
en inductieve statistiek:
relatie tussen twee of meer concepten die afgeleid zijn uit
1. Beschrijvende: logischerwijs gaan we het hier hebben
over het categoriseren en het beschrijven van
een theorie -> je hebt 3 soorten hypothesen
gegevens. De wereld beschrijven en verklaren. We 1) een onderzoekshypothese: formuleert de stellingen in een
kunnen causaliteit niet vaststellen, wel kan je positieve zin en dus in de richting van de verwachtingen van de
samenhang vaststellen. Beschrijvende statistiek onderzoeker
wordt gezien als reductie van gegevens en is dus niet
2)een nulphypothese: dit is het omgekeerde van wat je
door iedereen geliefd.
verwacht. Dit is dus een hypothese met de verwachting dat er
2. Bij inductieve statistiek willen we gegevens
veralgemenen naar de onderzoekspopulatie. We helemaal geen verband bestaat. Wanneer we onze nulhypothese
vormen stellingen waaruit hypothesen voortvloeien. mogen verwerpen en er zo dus van uit mogen gaan dat er wel
we willen dus adhv gegevens uit de steekproef uitspraken degelijk een verband bestaat, dan gaat de alternatieve
doen over de gehele onderzoekspopulatie hypothese op.
Steekproefbasisconcepten
1. Steekproef= omvat een selectie van de eenheden uit onze steekproef
-> een steekproef is dus een deelverzameling van n uit de populatie
2. Steekproefgrootheid: dit zijn cijfers die we afleiden uit de steekproef (gemiddeldes, modus,…)
->dit cijfer op zich is minder belangrijk-> het gaat om wat we hieruit kunnen veralgemenen naar
de bevolking
3. Populatieparameter: een waarde die heel de populatie beschrijft
-> deze populatieparameter kunnen we beschrijven adhv van de steekproefgrootheden
2 soorten steekproeven (toeval/aselect en niet-toeval/select)
• toeval: zijn enkelvoudige aselecte steekproeftrekkingen (in de praktijk gebeurt dit niet vaak in
1 stap wegens praktische redenen bv. Afstand).
• Niet-toeval: zelfselectie of selecte steekproeven-> deze gegevens kan je niet veralgemenen
naar de bevolking!!! Je kan dus enkel iets zeggen over de mensen die geselecteerd zijn
binnen deze steekproef
Datamatrix als input voor statische analyse
-de gegevens die we verzameld hebben, gaan we omzetten in een datamatrix
-> deze gegevensset bevat info over elke eenheid die bestudeerd werd en heeft
betrekking op de kenmerken die varieren. Ze nemen dus verschillende waarden aan
-> simpelweg bevat deze gegevensset de gegevens die we verzameld hebben en
deze verschillen in waarden en werden bestudeerd op kenmerken die varieren ten
opzichte van elkaar
-> krijgt meermaals een r x k vorm (rijen maal kolommen)
-> daarnaast worden er ook vaak numerieke codes toegekend zoals in het
voorbeeld hiernaast. Hier krijgt elke man een 0 en elke vrouw een 1
, De verschillende meetniveaus
Hoe je iets meet, bepaalt het meetniveau! -> hoe hoger een niveau, hoe
meer analysetechnieken er mogelijk zijn. Er zijn dus meer opties voor het
meten van zaken op een hoger niveau dan op een lager niveau. We
proberen altijd alle kenmerken op een zo hoog mogelijk niveau te krijgen in
de mate dat dit inhoudelijk zinvol is.
• er zijn 4 meetniveaus
1. Nominaal: elkaar uitsluitende categorieën. Hier is de waarde enkel de
naam van de categorie (daarom spreekt men dus van categorische
1) nominaal Categorische variabelen gegevens). er is geen rangorde tussen de categorieën. Categoriseren
2) ordinaal Kwalitatieve variabelen doen we hier door zoveel mogelijk homogene karakteristieken bij
elkaar te brengen die zich differentiëren van de andere. We maken
3) interval Metrische variabelen hier geen veronderstelling over de relatie tussen de categorieën. Bv.
4)ratio Kwantitatieve variabelen Geslacht
-> soms is het moeilijk-> bv. Nationaliteit-> wat met mensen die meerdere
nationaliteiten bevatten? -> definitie van de categorie beter afbakenen!
-> Zorg voor exclusiviteit: de categorieën mogen elkaar niet overlappen
-er mag dus eigenlijk maar 1 criterium aan de basis van de categorie
liggen.
-> Zorg voor exhaustiviteit: elk geval moet in een categorie kunnen
worden onder gebracht!
2. Ordinaal: ordinaal staat voor de ordenbaarheid van de categorieën. Er
zijn dus steeds uitspraken mogelijk over meer of minder. Maar -> we
kunnen niet zeggen hoeveel meer of hoeveel minder! We spreken hier van
geordend categoriserend meten
3. Interval: niet alleen rangorde, maar ordening tussen de variabelen heef
een betekenis. Meest bekende voorbeeld is temperatuur-> de hoeveelheid
die zich bevindt tussen 5 en 10 graden, is dezelfde hoeveelheid die zich
bevindt tussen 10 en 15 graden. We kennen een betekenis toe aan de
Bij de volgende klassen:
21-25, 26-31 en 31-35
- afstanden tussen deze variabelen. Maar: er is geen nulpunt! Je kan dus nie
zeggen dat 20 graden dubbel zo warm is als 10 graden! Bij farhenheit is
Kan je zeggen dat het verschil tussen de klassen even groot is, er een ander nulpunt dan bij celcius. Ook leeftijdsgroepen en inkomens zij
maar je kan niet zeggen dat iemand uit de vierde klasse dubbel zo interval!-> enkel wanneer er voor zorgt dat de afstanden tussen de
oud is als uit de tweede klassen waarden altijd even groot zijn
4. Ratio: er is een absoluut nulpunt
aanwezig
Bv. Cm (iets dat 0 cm is, heeft geen lengte)
Niet laten verwarren door milimeter! -> het
gaat er om dat iets gemeten op een bepaald
kenmerk geen negatieve waarde kan
aannemen
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur ranibuyse. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €8,39. Vous n'êtes lié à rien après votre achat.