ALLE hoorcollege samenvattingen TAK + SPSS outputs
Tout pour ce livre (27)
École, étude et sujet
Universiteit van Amsterdam (UvA)
Interdisciplinaire Sociale Wetenschappen
Onderzoeksmethoden 3 - Statistiek
Tous les documents sur ce sujet (2)
Vendeur
S'abonner
harmkekoning
Aperçu du contenu
HC1 - Variabelen, meetniveaus, hypothesen
Unit of analysis is datgene waarover je informatie verzamelt, meestal individuen of landen.
Variabelen zijn de gemeten kenmerken van de unit of analysis, dit zijn de vragen in je
vragenlijst. Values zijn de scores van een unit of analysis op een variabele. DUS:
- Wie/wat wordt in een rij gerepresenteerd? Unit of analysis.
- Kenmerken van unit of analysis = variabelen.
- Individuele scores = values.
Onafhankelijke variabele (X) is de predictor, de vermoedelijke oorzaak. Deze oefent invloed
uit op de afhankelijke variabele (Y). Dit is de outcome of het vermoedelijke gevolg. Hier is er
maar één van in je model, dit is namelijk het concept dat je wilt verklaren door een of
meerdere predictoren. Theorie en hoofdvraag zijn bepalend voor het uikiezen van je
variabelen.
Meetniveas zijn categoriaal of continu. Het meetniveau is bepalend voor welke statistische
toets mogelijk is (o.a. door de antwoordopties). Voor de afhankelijke variabele werken we
het liefst met een interval/ratio variabele, of een schaal samengesteld uit meerdere
Likert-scales (=ordinaal).
- Categoriaal, variabelen zijn onderverdeeld in groepen of categorieën. Respondenten
vallen exclusief in de ene of de andere groep.
- Binair = 2 categorieën.
- Nominaal = meer dan 2 categorieën.
- Ordinaal = inherente orderning in categorieën (vanaf 7 categorieën is een
Likert-scale ook te gebruiken als een interval/ratio).
- Continu, respondenten kunnen alle mogelijke waarden aannemen binnen de
variabele.
- Interval = verschillen op de schaal zijn betekenisvol.
- Ratio = er is een betekenisvol nulpunt.
SPSS onderscheidt alleen nominal/ordinal/scale.
Meetniveau’s zijn niet vaststaand, de antwoordopties van een vraag bepalen het meetniveau
van de variabele.
Centrummaten geven aan waar het centrum ligt van alle variabelen. Dit zijn: mediaan,
modus, gemiddelde.
Spreidingsmaten geven aan of waarden binnen een variabele ver uit elkaar liggen of niet. Dit
zijn: range en
standaarddeviatie
(=gemiddelde afwijking van
het gemiddelde). Deze maat
zegt iets over de spreiding in
de data, en dus ook: maat
voor error in de data en hoe
representatief het gemiddelde
is voor de data.
Standaarddeviatie is kleiner
bij minder spreiding rondom
het gemiddelde.
, - Om de standaarddeviatie te berekenen:
1. Bereken het gemiddelde.
2. Bereken voor iedere score de afstand tot het gemiddelde.
3. Kwadrateer al die getallen.
4. Tel de uitkomsten op.
5. Deel dat getal door het totale aantal scores minus 1.
6. Neem daar de wortel van.
Een kwalitatief toetsbare hypothese is specifiek geformuleerd per toets, beschrijft de
verwachte relatie tussen 2 variabelen en is potentieel falsifieerbaar (=goed of fout, niks er
tussenin).
H1 = Er is wel een effect (dat wat je verwacht o.b.v. je idee).
H0 = Er is geen effect (ontkenning van je idee).
Er zijn twee types hypothesen: (1) verschil tussen twee of meer groepen (2) samenhang
tussen twee variabelen (vaak getoetst met variabelen van interval/ratio meetniveau). Deze
verschil/- of samenhanghypothese kan je vervolgens toetsen op eenzijdige en tweezijdige
manier.
- Eenzijdig toetsen = je hebt een vermoeden over de richting van het verband.
- Tweezijdig toetsen = je hebt geen vermoeden over de richting van het verband.
Dat heeft invloed op hoe je toetst en de overschrijdingskans. Komt tot uiting in je hypothesen
(maar soms ook al zichtbaar in je onderzoeksvraag).
Een hypothese is een idee over de populatie die je gaat toetsen d.m.v. een steekproef om zo
iets over de gehele populatie te kunnen zeggen. In deze steekproef vindt je eigenlijk altijd
een klein effect of verschil, maar d.m.v. toetsen ga je bepalen wat de kans is op het vinden
van een effect in de steekproef terwijl dit er eigenlijk niet is in de populatie.
- Hoe groot is de kans deze waarden in de
steekproef te vinden (H1), terwijl H0 eigenlijk waar
is? Is de kans groot dan verwerpen we H1 (het
effect is dan niet significant, p > 0.05). Als de
kans klein is nemen we H1 aan (het effect is dan
significant).
Waar hangt die kans dan van af? De grootte van het
gevonden effect, het aantal respondenten en de
standaarddeviatie.
De p-waarde geeft aan of het effect significant is. Als p kleiner is dan 0.05 neem je H1 aan,
dan is de kans op een foutieve conclusie voldoende klein. P is afhankelijk van je sample
size, de standaardeviatie en de grootte van het gevonden effect.
Field H1 - Why is my lecturer forcing me to learn statistics?
Independent variable = a variable thought to be the cause of some effect, a variable that
the experiment has manipulated. Predictor.
Dependent variable = a variable thought to be affected by changes in an independent
, variable, think of it as outcome.
Variables can be split into categorical and continuous, within these types there are
different levels of measurement.
- Categorical (distinct categories):
- Binary = only two categories.
- Nominal = more than two categories.
- Ordinal = categories have a logical order.
- Continuous (distinct score):
- Interval = equal intervals on the scale represent equal differences in the
property being measured.
- Ratio = scale must have a meaningful zero point.
The mean is the sum of all scores divided by the number of scores. This value can be
influenced heavily by extreme scores, but it uses every score and is stable in different
samples. The median is the middle score when the scores are placed in ascending order.
It is not as influenced by extreme scores. The mode is the score that occurs most
frequently.
- The deviance of error is the distance of each score from the mean.
- The sum of squared errors is the total amount of error in the mean.
- The variance is the average distance of scores from the mean. It is the sum of
squared errors divided by the number of scores. It tells us about how widely
dispersed scores are around the mean.
- The standard deviation is the square root of the variance. Large standard
deviations suggest data are widely spread around the mean, while small standard
deviations suggest data are closely packed.
- The range is the distance between the highest and the lowest score.
- The interquartile range is the range of the middle 50% of scores.
Scores are sometimes expressed in a standard form, called z-scores. To transform a
score into a z-score you subtract from it the mean of all scores divide the result by the
standard deviation of all scores. The sign of the z-scores tells us wheter the original score
was above or below the mean; the value of z-score tells us how far the score was from the
mean in standard deviation units.
Field H4 - The IBM statistics environment
Zie: SPPS handleiding en werkgroepopdrachten.
HC 2- Steekproef, populatie, significantie
Vraag een frequentieverdeling op om afwijkende data op te sporen en je dataset te checken.
Dit kan van iedere schaalvariabele, niet zo nuttig bij categorische variabelen.
Bell-curve is bruikbaar om
normaalverdeling aan te duiden (niet om
exacte kansen te berekenen). Op basis
hiervan kan wel geconstateerd worden hoe
uitzonderlijk een bepaalde score is.
, Wanneer je data of variabelen normaal verdeelt zijn, kan je deze omvormen tot een
standaard normaalverdeling. Het gemiddelde is dan gelijk aan 0 en de standaarddevatie aan
1. Op deze manier weten we van elke plek in de verdeling de kans is, zie:
overschrijdingskansen.
- Standaard
normaalverdeling is
gebaseerd op Z-scores,
dit is de waarde van een
observatie uitgedrukt in
eenheden
standaarddeviatie. OF het
aantal standaarddeviaties
dat de score verwijderd is
van het gemiddelde. Je
standaardiseert scores op
deze manier t.o.v. andere
scores.
Een Z-tabel bevat alle Z-scores, hierin krijgt elke Z-score een waarde. Deze waarde is
gebaseerd op de kans dat een die waarde lager is dan een bepaalde Z-waarde (en dus in
het grijze gebied van de
normaalverdeling zit).
- Tabel zegt iets over: proportie
boven/onder die specifieke
Z-score en daarmee zijn plaats in
de normaalverdeling.
- Tabel bevat getallen tussen 0 en
1. Een afgelezen score van
0.9131 betekent dat 91% van de
waarden zich onder die Z-score
bevindt en 9% daarboven. De
proportie boven de Z-score zegt
iets over de overschrijdingskans!
- Met Z-scores kan je de kans op
een uitzonderlijke waarde achterhalen, omdat de originele waarden zijn omgezet in
gestandaardiseerde waarden met een gemiddelde van 0 en std.dv. van 1.
Idealiter zit de overschrijdingskans zover mogelijk in de hoek van de normaalverdeling, want
onder de 5% is deze significant (de foutkans is dan kleiner dan 5% en acceptabel).
- Wat is de kans om een bepaalde waarde op een variabele te hebben?
- Hoe uitzonderlijk zijn bepaalde waarden?
Deze vragen kan je met Z-scores beantwoorden, omdat de kansen gebaseerd zijn op
gestandaardiseerde waarden. En dus zijn ze vergelijkbaar.
Wat is de kans dat…?
1. Z-score berekenen (waarde - gemiddelde /
standaarddeviatie).
2. Checken in Z-tabel.
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur harmkekoning. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €6,09. Vous n'êtes lié à rien après votre achat.