MODELLO DI REGRESSIONE LINEARE MULTIPLA - PowerPoint PPT Presentation

1 / 69
About This Presentation
Title:

MODELLO DI REGRESSIONE LINEARE MULTIPLA

Description:

MODELLO DI REGRESSIONE LINEARE MULTIPLA Modello e assunzioni Stimatori OLS e propriet R2 , variabilit totale , spiegata , residua Previsione Test per la verifica ... – PowerPoint PPT presentation

Number of Views:187
Avg rating:3.0/5.0
Slides: 70
Provided by: Daniela237
Category:

less

Transcript and Presenter's Notes

Title: MODELLO DI REGRESSIONE LINEARE MULTIPLA


1
MODELLO DI REGRESSIONE LINEARE MULTIPLA
  1. Modello e assunzioni
  2. Stimatori OLS e proprietà
  3. R2 , variabilità totale , spiegata , residua
  4. Previsione
  5. Test per la verifica di ipotesi
  6. Vincoli lineari e variabili dummy
  7. Eteroschedasticità
  8. Multicollinearità
  9. Autocorrelazione dei residui

2
REGRESSIONE LINEARE MULTIPLA IL PROBLEMA
  • Ricerca di un modello matematico in grado di
    esprimere la relazione esistente tra una
    variabile di risposta y (quantitativa) e ( ad
    esempio) k variabili esplicative
  • Si tratta di una relazione asimmetrica del tipo
  • Nel caso del modello di regr.lineare multipla
  • abbiamo che
  • che geometricamente corrisponde ad un
    iperpiano a k dimensioni
  • Perché si studia tale modello
  • facilità con cui può essere interpretato un
    iperpiano a k dimensioni
  • ii) Facilità di stima dei parametri incogniti bj
  • ( j 1k)
  • Nella realtà studiamo un modello del tipo
  • Componente componente
  • sistematica casuale

3
IL MODELLO
  • In forma matriciale
  • dove
  • vettore (n x 1) di osservazioni sulla
    variabile dipendente
  • matrice (n x k) di osservazioni su
    k regressori
  • vettore (k x 1) di parametri incogniti
  • vettore (n x 1) di disturbi stocastici

4
N.B. La matrice X ha la prima
colonna unitaria nel caso in cui si consideri un
modello con intercetta b1 nel sistema di
riferimento multidimensionale
Le matrici e i vettori sono così definiti
5
ASSUNZIONI DEL MODELLO
  • Esiste legame lineare tra variabile dipendente e
    regressori
  • Le variabili sono tutte osservabili
  • I coefficienti bi non sono v.c.
  • I regressori X sono non stocastici
  • Il termine u non è osservabile
  • 7)
  • le ui sono omoschedastiche ed
    incorrelate
  • X ha rango pieno rank (X) k
  • condizione necessaria
  • hp aggiuntiva da
    utilizzare nellanalisi inferenziale

6
STIMATORE OLS
  • Y Xb u
  • Si cercherà quel vettore che minimizza
  • gli scarti al quadrato
  • dove Xi è la riga i-esima di X
  • In forma matriciale
  • perché scalare


  • (1)

7
è uno scalare dalla (1) si
ottiene pre-moltiplicando ambo i membri
perché rank (XX) rank (X) kXX è a
rango pieno ovvero invertibile
stimatore OLS di b

perché

8
CARATTERISTICHE STIMATORE OLS
  • Teorema di Gauss-Markov
  • è uno stimatore di tipo BLUE
  • Best Linear Unbiased Estimator
  • ovvero ha varianza minima nella classe degli
    stimatori Lineari e Corretti
  • La matrice è formata da
    elementi
  • costanti per cui è una trasformazione
    lineare
  • di y .
  • 2.
  • È uno stimatore corretto
  • Inoltre

9
Si consideri più in dettaglio
Pertanto la varianza
di ogni parametro si desume prendendo
il corrispondente valore sulla diagonale
principale della , moltiplicato
per

3.
10
Definiamo uno stimatore alternativo lineare e
corretto
  • dove C è una matrice (n x k)
  • ma
  • Pertanto la è la minima nella
    classe degli stimatori lineari e corretti, e
    risulta provato il teorema di Gauss-Markov
  • .

11
STIMA DI
  • MX è simmetrica e idempotente, cioè
  • 1.
  • 2.
  • Da queste proprietà di MX si ottiene

  • perché scalare

  • tr(ABC)

  • tr(BCA)

  • tr(BAC)



12
è uno stimatore
corretto ESEMPIO (Greene p.200)
i 1960
1986 , n 27 Gi consumo di benzina in
Pgi indice dei prezzi benzinaYi reddito
pro-capite in Pqi indice dei prezzi auto nuove
Se definiamo
13
Vettore y 121.01034 130.20306 136.62968 134.39852 150.34150 171.88391 175.44395 172.03874 198.65222 208.37573 214.38531 228.52113 237.37202 234.34193 222.32567 228.16247 242.33362 248.32557 240.93266 229.58893 227.13648 210.44373 236.85998 255.36365 243.75057 277.31965 x1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 x2 0.9250000 0.9140000 0.9190000 0.9180000 0.9140000 0.9490000 0.9700000 1.0000000 1.0470000 1.0560000 1.0630000 1.0760000 1.1810000 1.5990000 1.7080000 1.7790000 1.8820000 1.9630000 2.6560000 3.6910000 4.1090000 3.8940000 3.7640000 3.7070000 3.7380000 2.9210000 x3 6036.0000 6113.0000 6271.0000 6378.0000 6727.0000 7027.0000 7280.0000 7513.0000 7891.0000 8134.0000 8322.0000 8562.0000 9042.0000 8867.0000 8944.0000 9175.0000 9381.0000 9735.0000 9829.0000 9722.0000 9769.0000 9725.0000 9930.0000 10421.000 10563.000 10780.000 x4 1.0450000 1.0450000 1.0410000 1.0350000 1.0320000 1.0090000 0.9910000 1.0000000 1.0440000 1.0760000 1.1200000 1.1100000 1.1110000 1.1750000 1.2760000 1.3570000 1.4290000 1.5380000 1.6600000 1.7930000 1.9020000 1.9760000 2.0260000 2.0850000 2.1520000 2.2400000
Matrice XX 27.000000 51.357000 229865.00 37.296000 51.357000 133.15081 473127.10 83.319118 229865.00 473127.10 2.0120502e09 331319.22 37.296000 83.319118 331319.22 56.280428 Matrice inv (XX) 2.6605735 0.51586178 -0.00029970528 -0.76246362 0.51586178 0.30384762 -6.4047001e-07 -0.78790617 -0.00029970528 -6.4047001e-07 6.6199636e-08 -0.00019015563 -0.76246362 -0.78790617 -0.00019015563 2.8089108 Stime binv(XX) Xy -89.761482 -12.588147 0.039938109 -14.443884 Matrice XX 27.000000 51.357000 229865.00 37.296000 51.357000 133.15081 473127.10 83.319118 229865.00 473127.10 2.0120502e09 331319.22 37.296000 83.319118 331319.22 56.280428 Matrice inv (XX) 2.6605735 0.51586178 -0.00029970528 -0.76246362 0.51586178 0.30384762 -6.4047001e-07 -0.78790617 -0.00029970528 -6.4047001e-07 6.6199636e-08 -0.00019015563 -0.76246362 -0.78790617 -0.00019015563 2.8089108 Stime binv(XX) Xy -89.761482 -12.588147 0.039938109 -14.443884 Matrice XX 27.000000 51.357000 229865.00 37.296000 51.357000 133.15081 473127.10 83.319118 229865.00 473127.10 2.0120502e09 331319.22 37.296000 83.319118 331319.22 56.280428 Matrice inv (XX) 2.6605735 0.51586178 -0.00029970528 -0.76246362 0.51586178 0.30384762 -6.4047001e-07 -0.78790617 -0.00029970528 -6.4047001e-07 6.6199636e-08 -0.00019015563 -0.76246362 -0.78790617 -0.00019015563 2.8089108 Stime binv(XX) Xy -89.761482 -12.588147 0.039938109 -14.443884 Matrice XX 27.000000 51.357000 229865.00 37.296000 51.357000 133.15081 473127.10 83.319118 229865.00 473127.10 2.0120502e09 331319.22 37.296000 83.319118 331319.22 56.280428 Matrice inv (XX) 2.6605735 0.51586178 -0.00029970528 -0.76246362 0.51586178 0.30384762 -6.4047001e-07 -0.78790617 -0.00029970528 -6.4047001e-07 6.6199636e-08 -0.00019015563 -0.76246362 -0.78790617 -0.00019015563 2.8089108 Stime binv(XX) Xy -89.761482 -12.588147 0.039938109 -14.443884 Matrice XX 27.000000 51.357000 229865.00 37.296000 51.357000 133.15081 473127.10 83.319118 229865.00 473127.10 2.0120502e09 331319.22 37.296000 83.319118 331319.22 56.280428 Matrice inv (XX) 2.6605735 0.51586178 -0.00029970528 -0.76246362 0.51586178 0.30384762 -6.4047001e-07 -0.78790617 -0.00029970528 -6.4047001e-07 6.6199636e-08 -0.00019015563 -0.76246362 -0.78790617 -0.00019015563 2.8089108 Stime binv(XX) Xy -89.761482 -12.588147 0.039938109 -14.443884


14
Y 121.01034 130.20306 136.62968 134.39852 150.34150 171.88391 175.44395 172.03874 198.65222 208.37573 n10 n10 n10
Y 121.01034 130.20306 136.62968 134.39852 150.34150 171.88391 175.44395 172.03874 198.65222 208.37573
X1 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 (XX) 10.000000 9.6120000 69370.000 10.318000 Inv (XX) 197.12839 -30.407072 0.00072941000 -167.53347 Beta inv(XX)Xy -131.78025 -90.513381 0.045503884 61.076792 X2 0.92500000 0.91400000 0.91900000 0.91800000 0.91400000 0.94900000 0.97000000 1.00000000 1.04700000 1.05600000 9.6120000 9.2665480 67031.717 9.9199470 -30.407072 489.93203 -0.034015993 -198.24254 X3 6036.0000 6113.0000 6271.0000 6378.0000 6727.0000 7027.0000 7280.0000 7513.0000 7891.0000 8134.0000 69370.000 67031.717 4.8631105e08 71575.421 0.00072941000 -0.034015993 2.558142e-06 0.013782628 X4 1.0450000 1.0450000 1.0410000 1.0350000 1.0320000 1.0090000 0.9910000 1.0000000 1.0440000 1.0760000 10.318000 9.9199470 71575.421 10.651854 -167.53347 -198.24254 0.013782628 254.38467
15
ANOVA
  • Analisi della varianza
  • Se vogliamo testare simultaneamente ipotesi su
    tutti i parametri o coefficienti dei regressori
    andiamo a considerare la statistica F di
    Fisher-Snedecor.
  • Considerando il modello in forma di scarti

16
Si può dimostrare che
  • e ricordando che
  • Fp,q
  • Sotto

17
TABELLA ANOVA
Causa var. Devianza G.L. Stime var.
Modello x2..xk k-1
Residuo n-k
Totale n-1
Si costruisce la statistica F Si individua il 95 o il 99 quantile della distribuzione F(k-1),(n-k) Se si rifiuta H0 Si costruisce la statistica F Si individua il 95 o il 99 quantile della distribuzione F(k-1),(n-k) Se si rifiuta H0 Si costruisce la statistica F Si individua il 95 o il 99 quantile della distribuzione F(k-1),(n-k) Se si rifiuta H0 Si costruisce la statistica F Si individua il 95 o il 99 quantile della distribuzione F(k-1),(n-k) Se si rifiuta H0

18
SCOMPOSIZIONE DELLA DEVIANZA TOTALE
  • CASO. Modello senza intercetta
  • La colonna della matrice X relativa alla
    variabile X1 non è formata da tutte unità
  • Possiamo scrivere i valori stimati del modello
  • come
  • da cui
  • Notiamo che
  • M simmetrica e idempotente
  • P simmetrica e idempotente

  • 0 0

19
  • Ma
  • TSS ESS RSS
  • Somma quadr. Somma quadr. Somma quadr.
  • totale modello
    residui

20
2. CASO. Modello con intercetta
  • Perché
  • Se consideriamo
  • otteniamo che

21
Possiamo così scomporre la variabilità o
devianza della variabile dipendente Y

  • dove

  • Devianza totale
    TSS
  • Devianza dovuta al modello

  • ESS
  • Devianza residua o non spiegata

  • RSS
  • COEFFICIENTE DI CORRELAZIONE MULTIPLA


22
Il coefficiente di correlazione è un indicatore
del legame lineare tra Y e i regressori.
  • Ha però un difetto
  • Esso può aumentare anche se viene aggiunto un
    regressore che non spiega y.
  • Se dividiamo le devianze per i gradi di libertà
    andiamo a pesare il contributo a R2 di ogni
    regressore

23
Consideriamo ancora gli scarti

()
  • In forma matriciale
  • Gli elementi di Y e X sono scarti
  • Nella matrice X nx(k-1) non appare più la
    colonna delle unità
  • I vettori b e sono (k-1)x1 e non
    contengono più lintercetta

24
Sviluppando gli OLS
  • è sempre uno stimatore BLUE poiché

  • 0
  • Dalla () si ottiene

25
Lunico cambiamento si nota nella definizione di
R 2
26
APPLICAZIONE
  • n 12
  • k 3
  • Facendo riferimento ai valori
  • Determinare il vettore di stime OLS

27
Se consideriamo il modello in forma di scarti
dalle medie
  • Dove

28
da cui
29
RICAPITOLANDO
  • Fino ad ora nessuna ipotesi è stata posta per la
    distribuzione degli errori nel problema della
    stima.
  • Aggiungiamo

30
STIMATORE DI MAX VEROSIMIGLIANZA
  • Determiniamo il max lg L rispetto al vettore b
    e rispetto a s2
  • Equivale al

31
Otteniamo quindi
  • Lo stimatore M.L. di b equivale allo stimatore
    OLS di b
  • Stimatore M.L. di s2 , che sappiamo essere non
    corretto
  • Nota
  • Lo stimatore M.L. di b gode (ovviamente) di tutte
    le buone proprietà viste per lo stimatore OLS di
    b,
  • Quindi è BLUE

32
TEST PER LA VERIFICA DI IPOTESI
  • Dal teorema di GAUSS-MARKOV
  • Vogliamo testare
  • Ovvero vogliamo verificare se il regressore Xi
    spiega effettivamente la variabile dipendente Y
  • nel caso (improbabile) che sia nota s2
  • Sotto andiamo a
    considerare la statistica

33
Se il valore cade allesterno dellintervallo di
  • confidenza al 95 della
    ,
  • rifiutiamo H0 ed il parametro bi sarà
    significativamente diverso da zero.
  • In generale rifiuto H0 al livello 100e di
    significatività quando

34
QUANDO s2 NON E NOTA
  • Utilizziamo la sua stima
  • Abbiamo già visto che
  • MX e idempotente con tr(MX) n-k
  • da cui rank (MX) (n-k)
  • Per il teorema spettrale
  • esiste una matrice ortogonale P

  • PP In

35
dove
  • (n-k)
  • k
  • (n-k) k
  • E una matrice diagonale con (n-k) unità e k
    zeri sulla diagonale principale
  • Esempio
  • n 6
  • k 2
  • Sulla base di P u può essere trasformato

36
  • con P ortogonale
  • Inoltre dimostriamo che e sono
    indipendenti
  • Si dimostra verificando che e è incorrelato da

37
  • e e sono Normali e incorrelate
    quindi
  • indipendenti lo saranno anche e
  • N.B.
  • Quindi

38

  • ()

  • elemento
    generico di posto ii
  • nella
    diagonale della (XX)
  • Le ipotesi su bi possono essere verificate
    sostituendo i valori nella () e controllando
    poi che la statistica superi o meno i valori
    della regione critica della distribuzione tn-k .

39
price BDR FLR FP RMS ST LOT TAX BTH CON GaR CDN L1 L2
53 55 56 58 64 44 49 70 72 82 85 45 47 49 56 60 62 64 66 35 38 43 46 46 50 65 2 2 3 3 3 4 5 3 4 4 8 2 3 4 4 2 3 4 2 4 3 3 2 2 2 3 967 815 900 1007 1100 897 1400 2261 1290 2104 2240 641 862 1043 1325 782 1126 1226 929 1137 743 596 803 696 691 1023 0 1 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 5 5 5 6 7 7 8 6 8 9 12 5 6 7 8 5 7 8 5 7 6 5 5 4 6 7 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 39 33 35 24 50 25 30 29 33 40 50 25 25 30 50 25 30 37 30 25 25 50 27 30 30 30 652 1000 897 964 1099 960 678 2700 800 1038 1200 860 600 676 1287 834 734 551 1355 561 489 752 774 440 549 900 1.5 1.0 1.5 1.5 1.5 2.0 1.0 1.0 1.5 2.5 3.0 1.0 1.0 1.5 1.5 1.0 2.0 2.0 1.0 1.5 1.0 1.0 1.0 2.0 1.0 2.0 1 1 1 0 1 0 0 0 1 1 0 0 1 0 0 0 1 0 1 0 1 0 1 1 0 1 0.0 2.0 1.0 2.0 1.5 1.0 1.0 2.0 1.5 1.0 2.0 0.0 0.0 0.0 0.0 0.0 0.0 2.0 1.0 0.0 0.0 0.0 0.0 1.0 2.0 1.0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0
Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago. Priceselling price of house in thousands of dollars BDR Number of bedrooms FLR Floor space in sq.ft(computed bfrom dimension of each room and then augmented by 10) FPNumber of fireplaces RMSNumber of rooms STStorm windows (1 if present, 0 if absent) LOTFront footage of lot in feet TAXAnnual taxes BTHNumber of bathrooms GARGarage size (0no garage, 1one-car garage,) CDNCondition (1needs work, 0 otherwise) L1Location (L11 if property is in zone A , L10 otherw.) L2Location (L21 if property is in zone B , L20 otherw.) R14 , n26 SOURCE Ms.Terry Tasch of Long-Kogan Realty, Chicago.
40
MULTIPLE REGRESSIONdependent variable Price
  • Var-Covar matrix of Regression Coefficients (B)
  • Below diagonal Covariance . Above
    Correlation
  • FLR ST FP
    BDR RMS
  • FLR 1.116E-05 .06523 -.02657
    .01127 -.41096
  • ST 5.112E-04 5.50163 .06414
    -.03717 -.08660
  • FP -2.529E-04 .42872 8.11969
    .00430 -.06912
  • BDR 7.452E-05 -.17250 .02423
    3.91444 -.83394
  • RMS -.00230 -.33964 -.32930
    -2.75873 2.79561
  • ----------------------Variables in the
    Equation-----------------------------
  • Variable B SE B 95Conf.
    Intrvl B Beta
  • FLR .019124 .003341 .012155
    .026092 .696273
  • ST 11.253185 2.345555 6.360443
    16.145926 .404586
  • FP 10.295264 2.849507 4.351296
    16.239232 .301084
  • BDR -7.826966 1.978493 -11.954030
    -3.699901 -.812218
  • RMS 4.863990 1.672008 1.376242
    8.351738 .658351
  • Const. 24.172544 4.903762 13.943476
    34.401612
  • ----------------in-----------------
  • Variable T Sig T
  • FLR 5.724 .0000

41
RIPRENDIAMO LESERCIZIO (Applicazione lucidi
precedenti)
  • ( F0.01 , 2 , 9 8.02)


  • Ricordiamo

  • n 12

  • k 3 con

  • intercetta

  • 2 var. esplicative
  • in forma di scarti

  • valore

  • empirico di F
  • Si rifiuta H0 con un livello di significatività
    del 99 F empirico 51.75 gtF0.01,2,9
    8.02



42
Se avessimo voluto testare
  • Ovvero la significatività di X2

  • (t99.9 2.82)

  • valore

  • empirico

  • di t
  • Anche adesso rifiutiamo H0 il regressore
    X2 è significativo


43
PROBLEMI DI PREVISIONE
  • Si vuole prevedere il valore di Yn1 per un
    insieme di valori X osservati.
  • Supponiamo però per X i valori
  • E possibile fare una previsione puntuale o
    stimare un intervallo di previsioni.
  • Utilizzando le proprietà BLUE di avremo il
  • PREVISORE PUNTUALE
  • sarà BLUFF
  • Best Linear Unbiased Forecasting Function

44
Per ottenere un intervallo di previsione
  • è necessario individuare la distribuzione di
  • Quindi una stima intervallare con un livello
    fiduciario del 100(1-e)

45
APPLICAZIONE
  • Voglio prevedere Y da X0. Per calcolare
    lintervallo devo determinare
  • Infatti .

46
  • Lintervallo fiduciario sarà
  • A parità di dati osservati lintervallo sarà
    tanto più largo quanto più X0 è distante da

47
CENNI SULLE VARIABILI DUMMY(Variabili di comodo)
  • Fino ad ora abbiamo assunto che nella equazione
    generale Y Xb u
  • Le variabili X siano variabili cardinali date
    dalla teoria economica.
  • E possibile introdurre variabili cosiddette di
    comodo che riescano a rappresentare diversi
    fattori
  • EFFETTI TEMPORALI
  • EFFETTI SPAZIALI
  • VARIABILI QUALITATIVE

48
  • È possibile che un modello economico possa subire
    mutamenti strutturali
  • FUNZIONE DI CONSUMO
  • Tempo di guerra
  • Tempo di pace
  • Si ipotizza comunque che la propensione marginale
    al consumo rimanga
    invariata in entrambi i periodi

49
  • Invece di considerare i due modelli separatamente
    (stime meno precise) vengono uniti in una sola
    relazione
  • Dove X1 e X2 sono variabili dummy
  • La matrice b dei coefficienti sarà
  • e la matrice dei dati

50
La trappola delle variabili di comodo
  • Quando utilizziamo le variabili dummy è
    necessariob fare attenzione a come viene
    costruito il modello, per non rendere la matrice
    (XX) singolare .
  • Infatti se nel modello precedente lasciavamo una
  • intercetta
  • Abbiamo che le 4 colonne di X sono linearmente
  • dipendenti
  • (XX) non è invertibile

51
  • Volendo utilizzare una regressione con intercetta
    si utilizzerà così solo una dummy
  • PMC in entrambi i periodi
  • a1 g1 intercetta anni di guerra
  • a2 g1 g2 intercetta anni di pace
  • a1 a2 g2 differenza tra
    lintercetta del
  • periodo guerra e
    pace
  • Cambiamento di coefficiente angolare
  • b2 b1 differenza propensione marginale
    al
  • consumo nei due periodi

52
APPLICAZIONE (p.255 Maddala)
  • Y b1 b2 SVA u
  • Y km / litro
  • SVA Stima Vita Auto in anni
  • W peso in Kg

53
MULTICOLLINEARITA
  • Quando tra due o più variabili esplicative vi è
    perfetta collinearità o multicollinearità, la
    matrice (XX) non è più a rango pieno e le stime
    OLS non possono essere calcolate.
  • Si può però facilmente fare una sostituzione di
    variabile
  • Es

54
  • Il problema della multicollinearità esiste quindi
    quando due o più regressori sono
    quasi-collineari ovvero quando il coefficiente
    di correlazione tra i regressori è alto .
  • MODELLO A 3 VARIABILI

55
  • È facile vedere che valori molto alti di
    rendono le stime OLS molto imprecise.
  • Inoltre piccole variazioni nella matrice dei dati
    provocano o possono provocare grandi variazioni
    nella stima dei parametri.

56
ESEMPIO-APPLICAZIONEinstabilità delle stime
  • Dati

57
  • Togliendo solo una osservazione
  • Si modificano molto le stime

58
ETEROSCHEDASTICITAAvevamo ipotizzato che
tale assunzione è in molte situazioni non valida
dobbiamo quindi riformulare il
problema nella forma
59
  • Sono ancora corretti ma non efficienti

60
GOLDFELD QUANDT TEST- Si ordinano le
osservazioni secondo la variabile Xj che
si ipotizza sia la causa delleteroschedasti
cità- Si divide il campione in tre parti di
numerosità n1 n2 n3 .- Dopo la stima
OLS nei tre sottocampioni si calcola
e Sotto H0 omoschedasticità (il
valore di F è
piccolo)
61
RIMEDI
  • si i 1 , , n siano valori noti.
  • si applicano i MINIMI QUADRATI PESATI (WLS)
  • ovvero si applica OLS al modello trasformato
  • Ovvero
  • Dove
  • relazione tra la componente stocastica e uno dei
    regressori
  • Es.

62
  • Trasformiamo il modello
  • Dove
  • Applico OLS

63
ESERCIZIO
  • La stima di un modello lineare sulla base dei
    valori del Reddito e del Consumo di 30 famiglie
    americane fornisce i seguenti valori
  • La stima dello stesso modello sulle prime 12 e
    sulle ultime 12 osservazioni fornisce i seguenti
    valori
  • Verificare lipotesi di presenza di
  • eteroschedasticità ed in caso affermativo
  • indicare la procedura di correzione.
  • Cè presenza di eteroschedasticità

64
AUTOCORRELAZIONE DEI RESIDUI
  • Molto spesso la assunzione
  • cade perché gli errori sono autocorrelati,
    effetto molto usuale nelle serie storiche.
  • Per illustrare il problema consideriamo una
    semplice relazione a due variabili

65
  • 0 0
  • 0

66
(No Transcript)
67
CONSEGUENZE
  • Stime OLS di b corrette
  • Varianze di molto grandi ovvero
  • Sottostima di tali varianze
    inefficienti
  • Conseguente non validità dei test t ed F
  • Infatti si può dimostrare che
  • Solo se r2 0
  • Con N20 r 0.5

  • sottostima 4
  • Con N20 r 0.8

  • sottostima 19

68
TEST DI DURBIN - WATSON

  • residui nella
  • stima
    OLS

  • per n grande
  • 0 dL dH 2 4-dH
    4-dL 4
  • autocorr.() ? No autocorr. ?
    Autocorr.(-)
  • Il limite tra la zona di accettazione e quella di
    rifiuto è funzione della matrice X .
  • D W hanno costruito delle bande valide sempre.

69
METODI RISOLUTIVI
  • GLS se ho una stima di r
  • Riesco a trovare la matrice
  • e trasformo il modello in
  • stima OLS
  • Procedura iterativa per stimare r
  • Avendo
  • E

  • (1)

  • et (2)
  • Procedura
  • - Da (1) stimo a e b con OLS
  • (partendo da un valore iniziale per r )
  • - Sostituisco e in (2)
Write a Comment
User Comments (0)
About PowerShow.com