Resume

Samenvatting Begrippenlijst statistiek II

156 vues 6 fois vendu

Cours
Statistiek 2

Établissement
Universiteit Antwerpen (UA)

Samenvatting van alle begrippen die je per hoofdstuk achteraan terug kan vinden in het boek 'Inleiding Multivariate Analyse' voor de sociale wetenschappen. de begrippen zijn aangevuld met informatie uit het boek slides en eigen notities en voorbeelden om statistiek op een begrijpbare manier uit t...

[Montrer plus]

Aperçu 4 sur 57 pages

Voir l'exemple

Publié le 9 juin 2020
Nombre de pages 57
Écrit en 2019/2020
Type Resume

karolienvanhoof Membre depuis 5 année 167 documents vendus

Kernbegrippen statistiek II

Hoofdstuk 1: Van probleem naar analyse
Probleemkenmerk = Bij onderzoek naar politiek vertrouwen of zittenblijven kijken welke factoren
de variatie in dit kenmerk kunnen verklaren.

Probleemrelatie = Bij onderzoek naar de relatie tussen leeftijd en druggebruik kan je onderzoeken in
welke mate dit verband kan worden verklaard door andere relevante kenmerken.

Datareductie (synthese) = Opinies van respondenten over bepaalde maatschappelijke thema’s
onderzoeken door een veelheid van uitspraken/items te bevragen in de vorm van een survey. Je tracht
hierbij een veelheid aan indicatoren te herleiden tot enkele achterliggende concepten of dimensies.

Manifeste variabele = variabelen/factoren dat rechtstreeks geobserveerd kan worden.
Latente variabele = Variabelen/factoren die niet rechtstreeks geobserveerd kunnen worden en
gebruik maken van manifeste variabelen/factoren om relaties aan te duiden in een set variabelen. Een
latente variabele wordt ook wel benoemd als een construct. Bij het opmeten van zulke variabele ga je
vaak een set aan uitspraken bevragen via een schaal om te meten hoe egocentrisch iemand
bijvoorbeeld is.

Symmetrische samenhang = Je kan/wil geen uitspraak doen over welke variabele de andere
verklaard. Er wordt dus geen onderscheid gemaakt tussen de verklarende - en de te verklaren
variabele.

Assymetrische samenhang (causaal effect) = de onafhankelijke variabele heeft een effect op de
afhankelijke variabele. Assymetrische effecten worden aangeduid als causale effecten, er doet zich
namelijk causaliteit voor tussen de onafhankelijke – en de afhankelijke variabele. Voor causale
relaties is het belangrijk dat gegevens random vanuit een experimenteel design verkregen zijn.

Lineair effect = Een verandering in de onafhankelijke variabele zal eenzelfde verandering geven in
de afhankelijke variabele. Als je bijvoorbeeld per gestudeerd jaar 100 euro meer zou verdienen zal je
bij +1 jaar studeren ook altijd +100 euro meer verdienen.

Additiviteit = Een voorwaarde voor lineariteit waarbij f (x + y) = f (x) + f (y)

Niet-lineair effect = Een verandering in de onafhankelijke variabele zal een gradueel groter of
kleiner effect teweeg brengen in de afhankelijke variabele. De invloed van het aantal schooljaren op
het loon neemt af vanaf je 25 bent omdat je mogelijks onvoldoende werkervaring opdoet.

Interactie-effect = De combinatie van twee of meer onafhankelijke variabelen heeft effect op de
afhankelijke variabele. De interactie speelt zich hier af tussen de onafhankelijke variabelen. De

1

,invloed van roken en drinken vergroot bijvooreeld samen het risico op hartproblemen.
Bivariate causale structuur = Bij een bivariate structuur ga je uit van een direct causaal effect van
een onafhankelijke variabele op de afhankelijke variabele. In een bivariate causale structuur kan je
nooit met 100% zekerheid een causale relatie aanduiden omdat er mogelijks nog andere variabelen
zijn die mede invloed hebben op je afhankelijke variabele.

Schijnbare causaliteit = Multivariate analyse waarbij de causaliteit tussen de onafhankelijke en
afhankelijke variabele (bivariate causale structuur) wegverklaard wordt door een tweede
onafhankelijke variabele. De invloed van werk op overgewicht zou volledig wegverklaard worden als
je telkens kijkt naar respondenten met dezelfde leeftijd. In dit geval zal de nieuwe onafhankelijke
variabele het verband tussen de oorspronkelijke onafhankelijke – en afhankelijke variabele
wegverklaren. Om de invloed van beide onafhankelijke variabelen op de afhankelijke variabele te
testen, maak je gebruik van kruistabellen. Kruistabellen worden echter niet vaak gebruikt in de
sociale wetenschappen dus zal er gebruik gemaakt worden van multivariate regressietechnieken
(logistische regressie = vergelijking van meerdere modelspecificaties om initieel vastgestelde
probleemrelatie te ontleden). Verschillende modellen (invloed van werk/invloed van leeftijd/ …)
maken dat je wel met een bivariate causale relatie kan werken omdat je elke variabele die invloed
heeft op je onderzoek even apart neemt. Vb. De relatie tussen werken en overgewicht kan weg
verklaard worden door te controleren op de invloed van leeftijd op overgewicht. Indien je allemaal
mensen van dezelfde leeftijd zou onderzoeken zou je de invloed van leeftijd buiten spel kunnen zetten
en kan je alsnog de bivariate causaliteit tussen werken en overgewicht onderzoeken.

Indirecte causaliteit = Binnen een bivariate causale structuur kan er een intermediaire of
tussenliggende variabele aangeduid worden die de relatie tussen de onafhankelijk – en afhankelijke
variabele verduidelijkt. Het verband wordt dus niet wegverklaard, zoals dit bij schijnbare causaliteit
wel het geval is. Het verband verdwijnt wel na controle voor deze intermediaire variabele, maar we
kunnen niet zeggen dat dit een schijnverband is. De intermediaire variabele maakt enkel duidelijk hoe
het oorspronkelijke verband, in de bivariate causale structuur, tot stand is gekomen. Indirecte
causaliteit kan je analyseren aan de hand van kruistabellen of met een bivariate modelspecificatie
waarbij je de resultaten zal vergelijken bij hetzelfde effect, na controle voor andere onafhankelijke
variabelen. vb. de relatie tussen regio en objectieve bestaansonzekerheid kan weg verklaard worden
door de sociaal-economische activiteit. Indien je mensen met eenzelfde sociaal-economische
activiteit zou onderzoeken kan je het effect van deze intermediaire variabele buiten spel zetten en kan
je alsnog de bivariate causaliteit tussen regio en objectieve bestaansonzekerheid onderzoeken.

Suppressie van samenhang = Indien er nauwlijks sprake is van samenhang tussen een
onafhankelijke en afhankelijke variabele door de invloed van een suppressorvariabele. Deze
suppressorvariabele onderdrukt of maskeert het verband dat in realiteit aanwezig is. De invloed van
deze variabele word zichtbaar na controle voor de supressorvariabele via kruistabellen of
verschillende modelspecificaties.
Vb. Het zwakke verband tussen leeftijd en subjectieve bestaanszekerheid is het gevolg van twee
tegengestelde effecten die elkaar opheffen: ouderen hebben een lager inkomen dan jongeren + bij
eenzelfde inkomen zijn ouderen vaak minder subjectief onzeker dan jongeren  hoewel ze dus meer

2

,bestaansonzekerheid hebben, voelen ze zich niet zo (heft elkaar op). Het negatieve verband wordt
hier veroorzaakt door controle voor gezinsinkomen dat als suppressor werkt tussen leeftijd en
subjectieve bestaanszekerheid

De interactieve structuur = Wanneer twee onafhankelijke variabelen individueel invloed hebben op
de afhankelijke variabele, maar ook het gecombineerde effect van beide onafhankelijke variabelen
effect heeft op de afhankelijke variabele. De interactieve structuur wordt geanalyseerd via
kruistabellen of een modelspecificatie uitgebreid met producttermen tussen de onafhankelijke
variabelen onderling.

Convergente causale structuur = Indien de invloed van meerdere verklarende variabelen wordt
onderzocht op de te verklaren variabele. Er zijn in dit geval meerdere mogelijke oorzaken die getest
worden binnen een meervoudige regressie die de effecten van alle verklarende variabelen in kaart
brengen. Idealiter is er geen samenhang tussen de verklarende variabelen maar in realiteit zal er altijd
enige samenhang zijn (additieve modelspecificatie met niet-gecorreleerde predictoren komt amper
voor).

Multicollineariteit = Twee of meerdere verklarende (onafhankelijke) variabelen zijn onderling sterk
gecorreleerd, door hun overlap kan dit de betrouwbaarheid van het model reduceren.

Meervoudige regressie = Wanneer een model meerdere verklarende variabelen bevat voor het
verklaren/voorspellen van een (kwantitatieve) afhankelijke variabele.

Dummy-regressie = een meervoudige regressie met dummyvariabelen: indien er zowel
kwantitatieve – als categorische (kwalitatief) onafhankelijke variabelen effect hebben op de
kwantitatieve afhankelijke variabele. In het geval van dichotome variabelen (nominaal/ordinaal
niveau) ga je deze eerst omzetten naar een set van dummy-variabelen om deze te brengen op
kwantitatief meetniveau.

T-test = Berekend verschillen tussen gemiddelden en zegt iets over de significantie per
onafhankelijke variabele.
F-test (variantieanalyse) = Gaat bij een normale verdeling na wat de verschillen tussen de varianties
zijn en bepaalt of je modelspecificatie significant is.

Logistische regressie = Laat mits het gebruik van een logit-transformatie toe om de effecten van
verklarende variabelen op een dichotome afhankelijke variabele in kaart te brengen. Net zoals bij
de dummy-regressie kan je in dit model zowel kwantitatieve - als categorische onafhankelijke
variabelen met hun effect op de afhankelijke variabele testen.

Multinomial logit model = Uitbreiding op de logistische regressie waarbij kwantitatieve – en
categorische onafhankelijke variabelen verklaring kunnen geven voor een polytome afhankelijke
variabele (variabele met 3 of meer categorieën).

3

, Principale Componentenanalyse = Bij een latente structuur wordt getracht om informatie dat vervat
zit in een set items, te reduceren tot een beperkt aantal geconstrueerde schalen. Via de principale
componentenanalyse tracht men nieuwe latente variabelen of schalen te construeren die maximaal
informatie halen uit de oorspronkelijke set items. De schalen kunnen van orthogonaal roteren
(schalen zijn onderling niet gecorreleerd) of obliek roteren (schalen zijn onderling gecorreleerd). Dit
is een eenvoudige techniek maar heeft als nadeel dat ze alle informatie opneemt in de schalen.

Principale Factoranalyse = unieke variantie van een item wordt afgezonderd in een unieke factor
en de gemeenschappelijke informatie wordt gebruikt voor de constructie van schalen. Ook hier kan je
aan orthogonale - en oblieke rotatie doen. In tegenstelling tot PCA is PFA meer gericht op het duiden
van correlaties tussen items en het vinden van gemeenschappelijke informatie in een set van items.

Dependente/niet dependente technieken = Bij de dependente technieken is er een duidelijke
afhankelijke variabele, dit zie je in de regressietechnieken terugkomen. De niet dependente
technieken omvatten vaak meerdere afhankelijke variabelen en betreffen alle andere technieken.

Hoofdstuk 2: Meten en meetniveaus
Equivalentieklasse = Deelverzameling uit de populatie (P) die alle observaties groepeert die voor
het bestudeerde kenmerk als gelijkwaardig of equivalent kunnen worden beschouwd. Vb. je zal
mensen binnen dezelfde provincie beschouwen alsof ze allemaal dezelfde woonplaats hebben.

Meetschaal = Toekennen van een kwalitatieve of kwantitatieve waarde aan de equivalentieklasse
van het ongeschaalde kenmerk. Een variabele is een afbeelding van een bevolking P in een
verzameling X van waarden. Kwalitatieve waarden zijn in datasets enorm onhandig dus proberen
we deze om te zetten naar cijfers. Het geven van een cijfer aan een kwalitatieve waarde wil nog
niet zeggen dat dit cijfer betekenis heeft, je mag hier dus geen berekeningen mee doen zoals
bijvoorbeeld het gemiddelde nemen.

Meetniveau = Naargelang de eigenschappen: ordenbaarheid, meeteenheid en absoluut nulpunt al
dan niet aanwezig zijn kan je vier types variabelen onderscheiden: Nominaal, ordinaal, interval en
ratio. Bewerkingen toegelaten voor variabelen van een bepaald meetniveau mogen enkel toegepast

4

Les avantages d'acheter des résumés chez Stuvia:

Qualité garantie par les avis des clients

Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.

L’achat facile et rapide

Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.

Focus sur l’essentiel

Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.

Foire aux questions

Qu'est-ce que j'obtiens en achetant ce document ?

Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.

Garantie de remboursement : comment ça marche ?

Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.

Auprès de qui est-ce que j'achète ce résumé ?

Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur karolienvanhoof. Stuvia facilite les paiements au vendeur.

Est-ce que j'aurai un abonnement?

Non, vous n'achetez ce résumé que pour €7,49. Vous n'êtes lié à rien après votre achat.

Peut-on faire confiance à Stuvia ?

4.6 étoiles sur Google & Trustpilot (+1000 avis)

79202 résumés ont été vendus ces 30 derniers jours

Fondée en 2010, la référence pour acheter des résumés depuis déjà 14 ans

Commencez à vendre!

Populaire universiteiten

Populaire hogescholen

Populaire studieboeken voor Communicatie en Taal

Populaire studieboeken voor Economie en Bedrijf

Populaire studieboeken voor Exact en Informatica

Populaire studieboeken voor Gedrag en Maatschappij

Populaire studieboeken voor Gezondheid en Geneeskunde

Populaire studieboeken voor Recht en Bestuur

Resume

Samenvatting Begrippenlijst statistiek II

Infos sur le Document

Sujets

École, étude et sujet

Vendeur

Avis reçus

Aperçu du contenu