Samenvatting slides OZM
OLS = Ordinary Least Squares // GKK = Gewone Kleinste Kwadraten techniek voor het
schatten van beste curve door de puntenwolk
Minimaliseer telkens SSR (sum of squared residuals)
Afhankelijk = y-variabele, onafhankelijk = x-variabelen
Werkelijke waarde van Y = Voorspelling + residu
Residu = fout = storingsterm = error term = werkelijke waarde – voorspelde waarde
Geen patroon in de residuen, anders is er iets mis met de schatting
OLS-schatters zijn …
Puntschatters
De regressielijn gaat door het gemiddelde van X en Y
Het gemiddelde van de geschatte Y = gemiddelde van de werkelijke Y
Gemiddelde van de residuen = 0
Residuen vertonen geen correlatie met de voorspelde Y of met X
Residuen moeten normaal verdeeld zijn beta’s normaal verdeeld testen betrouwbaar
Gemiddelde = 0 (mhu), variantie = constant (sigma²)
Efficiënt = minimum variantie = observaties liggen dicht bij elkaar
Onvertekend = gemiddelde is gelijk aan de werkelijke waarde = observaties liggen dicht bij
het midden
OLS = BLUE (Best Linear Unbiased Estimator) minimum variantie, lineaire schatters,
onvertekende schatters
Variantie = mate waarin de waarde van een variabele afwijkt van het gemiddelde. Het zegt
iets over de stabiliteit van de parameter. Gemiddelde gekwadrateerde afwijking van het
gemiddelde!
Variantie storingsterm of residuen zo klein mogelijk = preciezere geschatte beta
Variantie van X zo groot mogelijk = stabielere parameter geschat
Correlatie = een maat voor de sterkte van de relatie tussen twee variabelen. Hoeveel
verandert de ene variabele als de andere variabele verandert? Of hoe afhankelijk is de ene
van de andere? Ligt tussen -1 en +1. De covariantie wordt gedeeld door het product van de
standaard deviaties.
Covariantie = een maat voor de sterkte van de correlatie tussen twee variabelen. Het is de
verwachte waarde van het product van telkens het verschil tussen de werkelijke waarde van
X en het gemiddelde van X en het verschil tussen de werkelijke waarde van Y en het
gemiddelde van Y
R² = hoeveel % van de variantie van Y wordt verklaard door het model? Hoe groter hoe beter
Decompositie van de variantie
TSS = total sum of squares MSS + RSS
MSS = model sum of squares zo groot mogelijk
RSS (of SSR) = residual sum of squares zo klein mogelijk
R² = MSS/TSS = 1 – RSS/TSS
Root MSE = standaard deviatie = vierkantswortel van RSS/df zo klein mogelijk
Df = aantal observaties – aantal parameters zo groot mogelijk
Standaard error = geeft de precisie van de schatting weer, hoe zeker ben je van de geschatte
waarde (betrouwbaarheid)? De waarde geeft de spreiding van de schatting weer indien er
1
, meerdere samples zouden zijn, waarbij er bij elke sample opnieuw een schatting wordt
gemaakt. Hoe kleiner hoe preciezer je schat wordt kleiner als steekproef groter wordt
Vierkantswortel van de variantie van een coëfficiënt
Meervoudige regressie: correlatie coëfficiënt in noemer variantie formule
Liefst kleine correlatie, als dit groot is zal de noemer zeer klein worden (1-r) en de
variantie heel groot geen precieze schatting
Opblazen variantie door hoge correlatie: zie later VIF waarde multicollineariteit
Beta’s staan in termen van covarianties en varianties
Twee modellen vergelijken
Steekproefgroottes van de modellen moet gelijk zijn
De AFHANKELIJKE variabele moet hetzelfde zijn geen modellen vergelijken met
een andere functionele vorm
Aantal geschatte parameters moet gelijk zijn
Gebruik R²-adjusted in plaats van R²: gecorrigeerd voor het aantal vrijheidsgraden want R² zal
altijd stijgen bij het toevoegen van een variabele en de df’s zullen altijd dalen of deze nu
bijdrage levert of niet. Bij R²-adjusted kan je zien of de variabele bijdrage levert als deze stijgt
dus wanneer de stijging de daling van de vrijheidsgraden meer dan compenseert.
ALGEMEEN (zonder transformaties) Interpretatie beta’s: een coëfficiënt meet de impact
van een stijging van de X-variabele met 1 eenheid op de waarde van Y (afhankelijke
variabele) terwijl de andere X-variabelen constant blijven (=netto impact)
Dit is een marginaal effect omdat de beta de afgeleide van Y naar X is.
Constante term = snijpunt van de regressielijn met de Y-as autonome component:
verwachte waarde van Y als alle afhankelijke variabelen gelijk zijn aan 0 (en de storingsterm)
of de constante term is dan gelijk aan het gemiddelde van Y
Dummy variabele = waarde die aangeeft of een variabele een bepaalde eigenschap vertoont
of niet
Afwijking meten t.o.v. categorie die op 0 staat (= referentiecategorie)
Slope: dummy bij een X-variabele
Interactie-effect = product van de dummy met een X-variabele
Intercept: dummy bij een beta
Dummy variable trap = wanneer je evenveel dummies opneemt als dat er categorieën zijn
neem altijd 1 dummy minder op dan het aantal categorieën!
Dummies worden gebruikt voor structuurbreuken, extreme observaties en
seizonaliteitseffecten te analyseren.
Gestandaardizeerde variabelen = variabelen die op gelijke schaal gezet worden
(werkelijke waarde – gemiddelde waarde) / standaard deviatie
Zo kan je makkelijker variabelen vergelijken met elkaar als ze in verschillende
eenheden staan
In stata: commando ‘beta’: als X met 1 standaardafwijking stijgt, zal Y ook met 1
standaardafwijking stijgen
Logaritmische transformaties: variabelen transformeren van lineair naar niet-lineaire vorm of
andersom het zijn de variabelen, NIET de beta’s die getransformeerd worden!
Naam van transformatie: afhankelijk – onafhankelijk
Vb. Log-lin: afhankelijk = logaritmisch, onafhankelijk = lineair
Log-log model: coëfficiënten zijn elasticiteiten
Log-lin model: beta = procentuele verandering in Y ten gevolge van een absolute
wijziging in X
2
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur robinbakker3. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €5,49. Vous n'êtes lié à rien après votre achat.