P0S37A Thema’s uit de kwantitatieve methodologie
Academiejaar 2022-2023
0. Start R en kopieer het R script en de gegevensbestanden voor de oefeningen vanuit Toledo naar de desktop (of
een andere plaats op de laptop waar deze bestanden gemakkelijk bereikbaar zijn). De gegevens en het R script zijn
terug te vinden op Toledo
Het R script heeft als naam ‘Joos_script.txt’ en kan in de R Graphic User Interface (RGui) worden geopend via
File / Open script…
Standaard geeft R de extensie .R aan scripts, maar in dit geval is de extensie .txt, dus om de volledige lijst van
beschikbare bestanden op de desktop te zien moet er nog worden aangegeven:
Files of type: All files (*.*)
Ik geef er de voorkeur aan om met de extensie .txt te werken om duidelijk te maken dat het over een ongeformatteerd
tekstbestand gaat dat gemakkelijk met Notepad kan worden bewerkt.
Om het R script stap-voor-stap te doorlopen, selecteert u de lijn (of de lijnen) die u wilt uitvoeren, klik rechts op de
muis en selecteer
Run line or selection
De gegevens voor deze oefening bevinden zich in het csv-bestand ‘Joosdata123.csv’. Vergelijk het resultaat van het
vijfde model vanuit het script (“model5”) met het resultaat op bladzijde 104 van Joos, Onghena, en Pieters (1996). De
resultaten moeten gelijkaardig zijn. Kleine verschillen in de parameterschattingen kunnen voorkomen omwille van
nieuwe software en verbeterde schattingsalgoritmen.
Werken met R
Iedere lijn in R Console (script) een voor een aanduiden en drukken op ‘Run line’
, 2
1. Schat de lag 1 autocorrelatiecoëfficiënt voor de voorbeeldgegevens op dia 15 van het hoorcollege over
tijdreeksanalyse. De gegevens kunnen worden gevonden in het bestand ‘Example slide 15.csv’. Welke waarde komt u
uit? Waarom wijkt deze waarde af van de correlatie die op dia 18 werd berekend?
Tip: Schrijf een nieuw script op basis van de eerste lijnen uit Joos_script.txt. Geef
dat nieuwe script een andere naam, bijvoorbeeld Oef1script.txt, om het later
gemakkelijk terug te vinden. Gebruik een gelijkaardige eerste lijn dan de eerste lijn
van Joos_script.txt om de gegevens in te lezen maar geef een andere willekeurige naam
aan het bestand. Gebruik de acf functie om de lag 1 autocorrelatiecoëfficiënt te
berekenen.
#Stap 1: Script Schrijven in notepad, opslaan als [Oef1script]
#Stap 2: Script openen in R console
> Oef1 <- read.csv(file.choose(new=FALSE),sep=";")
> acf(Oef1$Y,plot=FALSE)
(Gegevensbestand: Example slide 15.cvs gebruiken)
De lag 1 autocorrelatiecoëfficiënt is dus gelijk aan 0.749. Deze waarde wijkt (licht) af van de waarde .7632 die op dia
18 werd berekend omdat op dia 18 een gewone Pearson product-moment correlatiecoëfficiënt werd berekend voor
de verschoven tijdreeks. Deze gewone correlatiecoëfficiënt geeft slechts een ruwe benadering van de door R
gebruikte gecorrigeerde schatting van de populatie-autocorrelatie die, onder andere, rekening houdt met het feit dat
er minder gegevensparen kunnen worden gevormd (slechts 19 gegevensparen voor 20 observaties bij stapwaarde
1). Voor meer uitleg over de problematiek van de zuivere schatting van de populatie-autocorrelatie bij korte
tijdreeksen, zie Huitema, B. E., & McKean, J. W. (1991). Autocorrelation estimation and inference with small samples.
Psychological Bulletin, 110(2), 291–304. https://doi.org/10.1037/0033-2909.110.2.291
, 3
2. Schat de lag 2 partiële autocorrelatiecoëfficiënt voor de voorbeeldgegevens op dia 15 van het hoorcol lege over
tijdreeksanalyse. Welke waarde komt u uit? Waarom wijkt deze waarde af van de partiële correlatie die op dia 18 werd
berekend?
Tip: Gebruik de pacf functie.
Voortgaan op script uit oefening 1
# Stap 3: Schat de lag 2 partiële autocorrelatiecoëfficiënt
> pacf(Oef1$Y,plot=FALSE)
De lag 2 partiële autocorrelatiecoëfficiënt is dus gelijk aan −0.405. Deze waarde wijkt (licht) af van de waarde −.3593
die op dia 18 werd berekend omdat op dia 18 een gewone partiële correlatiecoëfficiënt werd berekend voor de met
twee stappen verschoven tijdreeks, gecorrigeerd voor de met één stap verschoven tijdreeks. Deze gewone partiële
correlatiecoëfficiënt geeft slechts een ruwe benadering van de correcte schatting van de partiële
autocorrelatiecoëfficiënt die rekening houdt met het feit dat er minder gegevensparen kunnen worden gevormd
(slechts 18 gegevensparen voor 20 observaties bij stapwaarde 2).
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur cathoschelkens. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €5,49. Vous n'êtes lié à rien après votre achat.