Samenvatting econometrie
1. Inleiding
Wat is econometrie?
-Econometrie is een discipline binnen de economische wetenschap die als doel heeft de
kwantitatieve beschrijving te geven van de relaties tusssen economische variabelen, en
overstijgt dus het descriptieve karakter van de samenvattende statistieken.
-Aan de hand van econometrie kunnen we theoretische hypotheses gaan toetsen, en
voorspellingen maken
-Het is een samenvoegsel van economische theorie, wiskunde en statistiek
-Taak econometrist is kwantificering aan de hand van data
Waarom econometrie?
Many decisions in economics, business and government hinge on understanding
relationships among variables in the world around us. These decisions require quantitative
answers to quantitative questions’
-Marketing: Wat is de impact van een reclamecampagne op de verkoop van
smartphones?
-Overheidsbeleid: Hoeveel mensen stoppen met roken als de accijnzen op sigaretten
toeneemt?
-Macro-economie: Wat is de impact van een toename van de investeringen in R&D
op economische groei?
-Monetair beleid: Wat is de impact van een renteverlaging door de ECB op inflatie?
-. . .
Causale effecten en ceteris paribus
De meeste relaties die een econometrist moet kwantificeren zijn causale of
oorzakelijk relaties
-Een actie veroorzaakt een resultaat als het resultaat een direct gevolg is van de actie
bemesting zorgt voor grotere oogst
-Correlatieanalyse meet de mate van lineaire associatie maar veronderstelt geen
causaal verband
correlatie tussen bemesting en oogst
correlatie tussen roken en longkanker
-Regressieanalyse veronderstelt een causaal verband
bemesting verhoogt de oogst
roken verhoogt de kans op longkanker
Hoe kunnen we causale effecten meten? Ideaal is het uitvoeren van een
gecontroleerd experiment
-Treatment group: wordt gevraagd te roken
-Control group: wordt gevraagd niet te roken
-Causaal effect wordt gemeten door de incidentie van longkanker in beide groepen
te vergelijken
In de praktijk zijn dergelijke experimenten vaak niet haalbaar
, -Niet ethisch
-Te duur, te tijdrovend, ...
-Omstandigheden kunnen niet gecontroleerd worden (treatment en control group
zijn verschillend)
-. . .
In de praktijk dient in plaats van experimentele data dus vaak/meestal
geobserveerde data te worden gebruikt
-Dit zorgt ervoor dat de richting van de causaliteit niet ontegensprekelijk vast staat
-Een statistisch verband betekent niet noodzakelijk ook een oorzakelijk verband!!!
-Een van de grote uitdaging is het inschatten van causale effecten op basis van niet-
experimentele data
-Rol ceteris paribus: controleren voor ‘derde variabelen’
-Stappenplan voor betrouwbare analyse
Stappen in het kwantificeringsproces
Economische theorie: kwalitatief verband
B.v. De Keynesiaanse consumptiefunctie
‘The fundamental psychological law is that men [women] are disposed to increase their
consumption as their income increases, but not as much as the increase in their income.’
[Keynes, J.M., 1936]
Mathematische specificatie van de theorie
b.v. y = β1 + β2x, 0 < β2 < 1 (1)
of lny = β1 + β2lnx, 0 < β2 < 1 (2)
met y consumptie en x inkomen.
→ Dus niet: data mining, machine learning, ...
,Econometrische specificatie van het model
y = β1 + β2 x + µ
met µ een stochastische storingsterm.
Deze storingsterm wordt aan het model toegevoegd omdat de relatie tussen consumptie en
inkomen niet exact is omwille van
-Andere factoren die inkomen be¨ınvloeden (b.v. vermogen, rente, ...)
-Meetfouten in de data
-. . .
Het verband tussen y en x is statistisch
↔ deterministische verbanden
b.v. wet van Newton
-Verzameling van data
b.v. data voor de V.S. aangaande geaggregeerde re¨ele consumptie en re¨eel BBP in USD
over de periode 1982-1996 (1992=1).
Schatting van de onbekende parameters in het model
regressieanalyse
Analyse van het model en eventueel remedi¨ering
is de specificatie van het model adequaat?
wat zijn de statistische eigenschappen van de schatter?
Testen van hypothesen
zijn de resultaten in lijn met wat de theorie voorspelt?
Gebruik resultaten
maatregelen beleid
maken van voorspellingen
Datatypes
-Cross-sectionele data
Gegevens m.b.t. een bepaalde variabele voor verschillende individuen, bedrijven, landen, . . .
op een vast tijdstip
Notatie yi met i = 1, . . . , N
, -Tijdreeks data
Gegevens m.b.t. een bepaalde variabele voor ´e´en individu, bedrijf, land,
. . . op verschillende tijdstippen Notatie yt met t = 1, . . . , T
Frequentie: dagelijks, wekelijks, maandelijks, jaarlijks, . . .
-Panel data
Gegevens m.b.t. een bepaalde variabele voor verschillende individuen, bedrijven, landen, op
verschillende tijdstippen
Notatie yit met i = 1, . . . , N en t = 1, . . . , T
-Het bieden van een referentiekader voor het empirisch analyseren van relaties tussen
economische grootheden.
Focus ligt op het Klassiek lineair regressiemodel en kleinste kwadratenmethode
(OLS)
Concrete doelstellingen zijn:
-Onderzoeksvraag kwantitatief kunnen neerschrijven, veelal via formulering van een model
met parameters en bijhorende hypotheses.
-De voorgestelde econometrische specificatie kunnen schatten
Empirische benadering zelf kunnen implementeren in R/Rstudtio en de output
interpreteren
-de Statistische eigenschappen (zuiverheid, consistentie en efficientie) van de gebruikte
schatter kunnnen nagaan op basis van een analyse van de onderliggende assumpties en
indien nodigg correcties kunnen voorstellen
-de economische implicaties van de bekomen resultaten kunnen beoordelen.
2.1 Regressieanalyse met twee variabelen: Basisconcepten
A. Doel regressieanalyse
Regression analysis is largely concerned with the study of the dependence of one variable,
the dependent variable, on one or more other variables, the explanatory variables, with a
view to estimating and/or predicting the population mean or average value of the dependent
variable in terms of known or fixed values of the explanatory variables.’
B. Een hypothetisch voordeel
Veronderstel een hypothetisch land met een totale populatie van 60 gezinnen
-We hebben data over consumptie-uitgaven (Y ) en netto beschikbaar inkomen (X )
voor elk van deze gezinnen [Tab. 2.1 & Fig. 2.1]
-We willen de verwachte consumptie-uitgaven (Y ) bepalen van een willekeurig gezin
met een bepaald netto beschikbaar inkomen (Xi )
Xi is het inkomensniveau van gezin i , met i = 1, . . . , n
Interpretatie Tab. 2.1 & Fig. 2.1: verdeling van consumptie-uitgaven Y
voor een gegeven netto beschikbaar inkomen X
-Conditionele) verdeling