Uitgebreide samenvatting van alle colleges van het vak Analyse 4 inclusief plaatjes uit de slides. Daarnaast antwoorden van de quiz en de oefententamenvragen (met uitleg), welke ook terugkwamen in het tentamen. Zelf met deze samenvatting een 9 behaald!
Analyse 4
HC1 – introductie
08-09-2022
Nomothetische benadering
o Groepen mensen bestuderen om algemene wetmatigheden te ontdekken
Idiografische benadering
o Uniciteit van het individu bestuderen
o Niet vergeleken met anderen, maar kijken of jouw individu voortgang laat zien vergeleken
met zichzelf; dynamiek van het gedrag analyseren
o Wat werkt voor wie, wanneer en onder welke omstandigheden
Data die heel frequent is gemeten over de tijd bij individuen= tijdseries
dus meerdere observaties bij paar individuen
Waarom geen enkele meting over de tijd, maar een heleboel metingen over de tijd (tijdseries):
Gedrag is dynamisch, verandert van moment tot moment
Afhankelijk van de situatie waarin je je begeeft
Hoe je je gemiddeld voelt is moeilijk te duiden, elk moment is anders
Dus dat duiden in een patroon (figuur met bijv. lijn die elk moment fluctueert)
Wanneer je minder metingen hebt, mis je dus veel data, je hebt minder fluctuaties, dus je bent
meer afhankelijk van de aantal metingen die je hebt die wellicht niet alles zeggen over die
bepaalde persoon
Op basis van 1 of enkele meting kun je een individu niet begrijpen
Inhoudelijk
Over de onbruikbaarheid van psychologische testen voor uitspraken over een individu
Er wordt uitgegaan dat het gemiddelde die uit psychologische testen naar voren komt voor iedereen geldt
Mismatch tussen het gemiddelde en als je de test bij een individu uitvoert
Zelfs in het beste geval, mag je van een correlatie die je hebt gevonden in een steekproef niet
zeggen dat die generaliseerbaar is naar een individu
Wanneer je op groepsniveau kijkt en daar kom je uit op een bepaald gemiddelde met een
standaarddeviatie zegt dat niets over hoe een individu is/scoort, kan nog steeds andere patronen hebben
Test-getest artikel:
Ergodiciteit: de assumpties van statistische tests
o Onafhankelijkheid
o Homogeniteit van de variantie
o Metingen moeten normaal/symmetrisch verdeeld zijn
o Additivity en linearity= unieke effecten kun je isoleren en die mag je bij elkaar optellen en
dat is dan de totale variantie
Deze condities heten ergodiciteit= het ruimtelijke gemiddelde/gemiddelde in de steekproef is
gelijk aan het tijdgemiddelde/een individu over de tijd lang meten
bijv. als je 100 dobbelstenen gooien moet je evenveel 1,2,3,4,5,6 hebben gegooid (space)
als je dan vervolgens met 1 dobbelsteen 100 keer gooit, verwacht je zelfde uitkomt (time)
Hetgeen wat je meet mag geen geheugen hebben; geen correlaties ontstaan (memorylessness)
Persoonlijke verdeling vs. populatie verdeling
Inter-individuele (between) en intra-individuele (within) variabiliteit
,Hoe wordt de betrouwbaarheid van een testscore bepaald?
Aan de hand van normeringsmodellen wordt een persoon geplaatst na het maken van een test
Foutentheorie Galileo:
Er bestaat maar één waarde die de afstand van de ster naar het centrum van de aarde het meest
accuraat weergeeft: de ware afstand
Alle observaties bevatten meetfouten die toe te schrijven zijn aan de observator en/of het
instrument en/of andere omstandigheden tijdens de meting; deze vallen tegen elkaar weg
De observaties liggen symmetrisch rondom de ware waarde soms beetje erboven soms beetje
eronder; oneindig herhaalde metingen leveren een normaalverdeling op
Kleine afwijkingen/fouten komen vaker voor dan grote afwijkingen/fouten (extreme)
Verwachte waarde = gewogen gemiddelde
Met de standaardafwijking (SD) werd het mogelijk om de onzekerheid/fout van een meting/observatie te
kwantificeren hoe groter de SD, hoe onbetrouwbaarder de meetprocedure (dus betrouwbaarheid kan
worden bepaald)
Foutentheorie gaf inzicht in de verdeling van meetfouten
Kanstheorie voegde hier de theorievorming toe over waarschijnlijkheid
Er wordt niet heel vaak bij 1 individu gemeten, omdat je dan niet meer kan voldoen aan
onafhankelijkheid
Quelet en Lord & Novick (KTT) vonden dat:
Intra- en intra-individuele data zijn inwisselbaar maakt niet zoveel uit of je in een keer een hele groep
meet of meteen naar één individu gaat (je kunt dit individu plaatsen in de normaalverdeling van een
groep) = dat is wat ergodiciteit zegt (groep geeft representatief beeld van meting van één persoon)
De KTT vereist een intra-individuele meting die bestaat dat we (1) oneindig vaak, (2) dezelfde test
afnemen, (3) onder gelijkblijvende omstandigheden, (4) waarbij alle testafnames onderling van elkaar
onafhankelijk zijn = stochatistische foutentheorie dus eigenlijk moet je een soort brainwashen
Niet mogelijk, dus dan maar bij steekproeven meten (inter-individueel) = wordt als gelijk gezien (?!)
,Dit is gek dat een groep vergeleken kan worden met 1 persoon:
De eigenschappen van zo’n groep moeten onveranderd blijven door de tijd heen (stationair)
o Niet toepasbaar op mensen
Steekproef moet uit identieke/homogene kopieën bestaan
o Niet toepasbaar op mensen
Mensen zijn dus niet ergodisch, dus dat je niet mag zeggen dat intra (1 persoon) inwisselbaar is met inter
(een groep personen)
Dus oplossing idiografisch (small data paradigm)
Eerst gegevens analyseren
voordat gegevens worden
samengevoegd en verbanden
worden gelegd, dus eerst kijken
naar patronen in een individu
totdat er één collectief inzicht
gecreëerd wordt
groep naar individu individu naar groep (in de praktijk wil je dat niet per se; je wilt
gepersonaliseerd)
Voordelen van small data paradigm:
Voorspellingen op het niveau van de eenheid die de data verzamelt (client en zijn/haar systeem)
Individu bepaalt met welk doel data worden verzameld
Data zijn direct relevant en bruikbaar voor client en zijn/haar behandelaar
Biedt unieke mogelijkheden in het beter begrijpen en managen van complexe fenomenen die zich
dynamisch (=veranderd over tijd), multi-causaal (=meerdere invloeden tot zelfde uitkomst kunnen
leiden) en idiosyncratisch (=per individu verschillend, personaliserend) manifesteren
Niet kijken volgens een statisch entiteit (die heeft een depressie en dit niet volgens DSM)
Complexe systeem benadering:
Levende systemen: zoals mensen en dieren
Tegenovergestelde van ergodiciteit; hebben tegenovergestelde kenmerken (geheugen,
aanpasbaarheid enz.)
Kenmerken:
o Adaptief
Leren en ontwikkeling, individuele geschiedenis van een systeem is van belang
o Emergentie
Gedrag emergeert uit de interacties tussen veel verschillende processen die zich op
veel verschillende (tijd)schalen afspelen; daardoor vaak onvoorpspelbaar,
onverwacht (nieuw) en niet-lineair
o Zelforganisatie
Gedrag wordt niet aangestuurd vanuit 1 centrale processor, maar organiseert
zichzelf in stabiele toestanden
Geen onafhankelijkheid dus
Dus geen gebruik maken van statistische modellen assumpties worden geschonden en te grote
rol van individuele geschiedenis
,Analyse 4
HC 2 – introductie tijdseries
15-09-2022
Tijdserie:
Verzameling van metingen die van nature geordend zijn in de tijd; verzameling van datapunten en
daarbij de natuurlijke ordening houdt (de bepaalde volgorde blijft intact)
Dit onderscheidt tijdreeksanalyse van andere analyses, waarbij de natuurlijke ordening van de
waarnemingen niet in rekenschap gebracht wordt
Vaak worden tijdseries eerst gemiddeld, voor er geanalyseerd wordt
Doel= eigenschappen van individu begrijpen, menselijk gedrag beter begrijpen als
veranderingsprocessen (zijn vaak niet stabiel/homogeen ontwikkeling, vermoeidheid enz.)
Soorten tijdseries:
Hoe wordt het gemeten?
Tijdreeksen (continu metingen)
o Waarden worden continu gemeten over de tijd met een vast interval
o Bijv. ademhaling, beweging, EEG, binaire processen (kijkgedrag) op een continue
tijdschaal
o Zowel tijd als volgorde kunnen afgelezen worden, vast interval
Event reeksen (discrete metingen)
o Waarden worden enkel gemeten op basis van een bepaalde gebeurtenis
o De metingen beschrijven de tijdsduur van een gebeurtenis
o Bijv. reactietijden, hartslagintervallen wanneer er dus wat gebeurd
o Enkel volgorde van de metingen wordt weergegeven, de tijd niet
Wat wordt er gemeten?
Categorisch/nominaal
o Waarden zijn arbitrair (bepaald door willekeur)
o Kunnen niet gemiddeld worden (zoals geslacht)
o Bijv. videocorderingen van moeder-kind interactie
Schaal/interval
o Waarden hebben een betekenisvolle waarde (kwantitatieve variabele)
o Verschil tussen waarden is interpreteerbaar
o Kunnen onder bepaalde voorwaarden gemiddeld worden
o Bijv. reactietijden
Nog een onderscheid:
Univariaat
o Het kwantificeren van één variabele over tijd auto…
o Bijv. fluctuaties in stemming, reactietijden in een experiment
Multivariaat
o Het kwantificeren van meerder variabelen over tijd cross…
, o Bijv. kijkgedrag van moeder en kind, stemming en slaapkwaliteit, ademhaling, hartslag
Toetsende statistiek vs. tijdserieanalyse
Inferentiële (toetsende) statistiek
o Richt zich op systematische patronen binnen een grote steekproef
o Gebaseerd op M en SD in een steekproef, om u en o te schatten
o Maakt inferenties over een populatie, niet het individu
o Vaak één meetfout per individu
Nomothetische benadering
Tijdserieanalyse
o Richt zich op systematische patronen over de tijd, vaak binnen één individu.
o Gebaseerd op patronen van verandering over de tijd
o Doel is vaak niet om te generaliseren naar een populatie, je wilt eigenschappen individu
o Vele herhaalde metingen
Idiografische benadering
Wanneer gemiddelde inzichtelijk: Voorwaarden:
Ergodiciteit:
o Intra-individuele variantie is inwisselbaar met inter-individuele variantie
Stationariteit
o De statische eigenschappen van het proces veranderen niet tijdens het meten (M en SD)
Intermezzo:
Bij niet-stationaire processen blijft het gemiddelde of spreiding veranderen
Herhaalde metingen zijn vaak niet onafhankelijk, maar vormen een temporeel patroon
Intra-individuele variantie is dan dus meer dan alleen ‘een willekeurige meetfout’
o Meetfouten middelen elkaar niet uit
o Meer data leidt niet tot een betere benadering van T
o Er is dus geen zinvolle ware score
Gemiddelden kunnen eigenschappen van individuele veranderingsprocessen verbergen
Kan er meer geleerd worden door tijdserieanalyse?
Random processen= onafhankelijke metingen, wet van de grote aantallen, centrale limiet theorema
Niet-random processen= afhankelijke metingen, geen betekenisvol gemiddelde, niet stationair, niet
ergodisch, geen ware score, temporele patronen (periodieke fluctuaties, vorm van sinusgolf)
Hoe te onderscheiden?
Surrogaatanalyse
Als een tijdserie regelmatigheden over de tijd vertoont
o Geen random proces
o M en SD geen volledige beschrijving
o Meer informatie uit temporele patronen
Wanneer vertoont een tijdserie regelmatigheden over de tijd?
Hoe aannemelijk is het dat deze regelmatigheden per toeval ontstaan?
o Door de natuurlijke ordening van de metingen te randomiseren verdwijnt ook
het temporele patroon
, o Het verschil tussen de oorspronkelijke en gerandomiseerde tijdserie (surrogaat),
geeft de informatie weer die toetsende statistiek niet meeneemt
Surrogaatanalyse: data shuffling
Het oorspronkelijke proces verschilt sterk van het gerandomiseerde proces
De tijdserie bevat meer informatie dan M en SD doen vermoeden
Visuele analyse
Tijdserieanalyse: kwantificeren van de dynamica
Dagelijkse zelf-rapportage stemming
o Het verschil tussen het oorspronkelijke en gerandomiseerde proces is veel minder duidelijk
Visuele inspectie niet genoeg
Beter: informatie over de dynamica vergelijken
Door middel van tijdserieanalyse wordt de dynamica van een proces gekwantificeerd
Als de uitkomst van de tijdserieanalyse van een gemeten tijdserie verschilt van die van een
surrogaat serie, is het onwaarschijnlijk dat het gaat om onafhankelijke metingen
Dan geeft de analyse van de tijdseries je dus informatie die toetsende statistiek niet meeneemt
Deze informatie kan erg betekenisvol zijn
➔ Eerst analyseren dan (misschien) aggregeren, in plaats van andersom
Correlatie
Pearson
Mate van lineaire samenhang tussen twee variabelen
Autocorrelatie
Pearson
Mate van lineaire samenhang tussen een variabele en zichzelf
Auto-correlatie functie (ACF)
= geeft al mogelijke lags weer over een bepaalde tijd, weergave van meerdere autocorrelaties
Mate van lineaire samenhang tussen waarden van één tijdserie met zichzelf tussen moment n en
moment n+k
K= verschuiving van de tijd (lag/latentie= vertraging)
Meet de mate van seriële afhankelijkheid
o Onafhankelijke metingen?
o Long-range correlations (LRC)
Bij lag k=0: gewone Pearson correlatiecoëfficiënt
Bij auto-correlatie altijd 1
lag k=1 betekent bij auto-correlatie altijd symmetrisch
, o Positieve autocorrelatie (k=1)
Een hoge waarde Xn heeft een grotere kans dan verwacht per toeval om gevolgd te
worden door een hoge waarde Xn+k
Een lage waarde Xn heeft een grotere kans dan verwacht per toeval om gevolgd te
worden door een lage waarde van Xn+k
trager, meer systematisch patroon
o Negatieve autocorrelatie (k=1)
Een hoge waarde Xn heeft een grotere kans dan verwacht per toeval om gevolgd te
worden door een lage waarde van Xn+k
Een lage waarde Xn heeft een grotere kans dan verwacht per toeval om gevolgd te
worden door een hoge waarde Xn+k
wisselingen van hoog naar laag, gaat
heen en weer
Autocorrelatie: symmetrisch, aan de negatieve als positieve kant krijg je dezelfde tijdseries
Tentamenvraag: wat gebeurt er als je niet 1 maar bijv 2 stapjes verplaatst, of 3?
bij negatieve autocorrelatie lag 1 welke gaat naar lag 2 wordt het een positieve autocorrelatie
Perfecte sinusgolf: afwisselen tussen pos. en neg. autocorrelaties
Wanneer de datapunten vervolgens gerandomiseerd worden (surrogaat), zal autocorrelatie over alle lags
amper positieve of negatieve autocorrelaties vertonen
Surrogaatanalyse
M en SD blijven gelijk
Auto-correlaties vallen weg toeval
Cross-correlatie functie (XCF)
Mate van lineaire samenhang tussen waarden van twee verschillende tijdseries tussen moment i en
moment i+k (dus niet met zichzelf, maar 2 tijdseries)
K is de verschuiving in de tijd (lag)
Meet de mate van lineaire samenhang tussen twee processen (op verschillende tijdschalen)
Lag k=0: gewone Pearson correlatiecoëfficiënt
Bij cross-correlatie niet altijd 1
, Lag k=1 bij cross-correlatie niet symmetrisch
Synchronie, met vertraging bij kleine verschuivingen, maar bij grote verschuivingen niet veel
correlatie meer
Surrogaatanalyse
M en SD blijven gelijk
Cross-correlaties vallen weg
Correlatie is het sterkst bij een lag van ongeveer 0 hoogste piek
Sterke lineaire samenhang tussen beide tijdseries bij een lag van 100 betekent dat waarden van
beide tijdseries vergelijkbaar zijn (lineair samenhangen), maar de ene tijdserie loopt 100
datapunten voor op de ander, de ene tijdserie volgt dus later in de tijd op het gedrag van de andere.
Een sterke lineaire samenhang bij een lag van 0 geeft dus aan dat de tijdseries vergelijkbaar zijn
Return plot: visuele weergave van de autocorrelatie op lag x, kleine/grote waarden op moment t worden
gevolgd door kleine/grote waarden op moment t+1
Bij het berekenen van de correlatie bij grotere lags gaan er ook meer datapunten verloren
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur evivuden. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €7,99. Vous n'êtes lié à rien après votre achat.