Curs 2. econometrie (2)

  • Published on
    03-Jul-2015

  • View
    895

  • Download
    3

Transcript

  • 1. ECONOMETRIE CURS 2IAI - 2013-

2. Structurarea pe cursuri a tematicii Regresia liniar simpl (C2) 1. Scurt istoric al regresiei. Tipuri de modele de regresie 2. Prezentarea modelului de regresie liniar simpl 3. Estimarea parametrilor modelului liniar 4. Estimarea indicatorilor de corelaie (C3) 5. Testarea parametrilor modelului liniar 6. Testarea indicatorilor de corelaie 7. Testarea modelului liniar2 3. 1.Scurt istoric al regresiei (I) 1805 - A.M. Legendre, Nouvelles mthodes pour la dtermination des orbites des comtes. "Sur la Mthode des moindres quarrs" apare ca anex. 1809 - C.F. Gauss, Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum. 1821/1823 - C.F. Gauss. Theoria combinationis observationum erroribus minimis obnoxiae 1869 - Charles Darwin, The Variation of Animals and Plants under Domestication. (Capitolul XIII descrie ceea ce era cunoscut ca reversie in perioada lui Galton. Darwin utilizeaz termenul de "reversie".) 1877 - Francis Galton, "Typical laws of heredity", Nature 15, pp. 492 495, 512-514, 532-533. (Galton utilizeaz termenul de "reversie" n articolele sale, n care trateaz mrimea boabelor de mazre.) 3 4. 1.Scurt istoric al regresiei (II) 1885 - Francis Galton, Presidential address, Section H, Anthropology. (Galton utilizeaz termenul de "regresie" n lucrrile sale, n care abordeaz problema nlimii oamenilor) 1886 - Francis Galton,. "Regression Towards Mediocrity in Hereditary Stature," Journal of the Anthropological Institute, nr. 15, pp. 246-263. (Facsimile at: [2]) 1897 - G. U. Yule, "On the Theory of Correlation", Journal of the Royal Statistical Society , pp. 812-54. 1903 - Karl Pearson, G. U. Yule, Norman Blanchard, and Alice Lee. "The Law of Ancestral Heredity", Biometrika 1922 - R.A. Fisher, "The goodness of fit of regression formulae, and the distribution of regression coefficients", Journal of the Royal Statistical Society, pp. 85, 597-612 1925 - R.A. Fisher, Statistical Methods for Research Workers 4 5. 2. Prezentarea modelului de regresie liniar simpl (1) Analiza de regresie studiaz legtura statistic ntre dou sau mai multe variabile statistice sub aspectul formei acesteia. n legturile statistice utilizm variabile aleatoare (stohastice), ceea ce nseamn c variabilelor le corespund distribuii de probabilitate. n legturile de tip funcional sau deterministic unei valori i se asociaz o alt valoare i nu o distribuie de probabilitate.Analiza de corelaie studiaz legtura statistic ntre dou sau mai multe variabile statistice sub aspectul intensitii acesteia. 5 6. Interpretarea geometric i statistic a regresiei (1) Interpretarea geometric Exemplu Se consider repartiia a 50 de firme dup profitul realizat (Y, variabil dependent, sute mil. lei) i cheltuielile cu publicitatea (X, variabil independent, mil. lei).Pe baza datelor de mai sus, putem construi 5 repartiii condiionate 6 7. Interpretarea geometric i statistic a regresiei (2)7 8. Interpretarea geometric i statistic a regresiei (3) Mediile condiionate corespunztoare celor 5 repartiii:8 9. Interpretarea geometric i statistic a regresiei (4) Interpretarea statisticRegresia este o medie condiionat, definit prin relaia: M(Y/X=xi) = f(xi) sau M(Y/X)=f(x) Pentru cazul liniar, regresia este o funcie liniar:M(YX) = 0+1X Prin urmare, regresia liniar este: yi = M(Y/X=xi) = 0+1xi9 10. 2. Prezentarea modelului de regresie liniar simpl (2) Forma general a unui model de regresie este: M(YX)=f(x). Pentru modelul de regresie liniar simpl forma modelului devine: M(YX) = 0+1X ,unde M(YX) media condiionat corespunztoare variabilei stohastice Y iar 0 i 1 sunt parametrii modelului. n cele mai multe cazuri, valorile reale yi difer de valorile ateptate sau teoretice M(YX=xi). Abaterea valorilor reale fa de valorile teoretice reprezint valorile variabilei stohastice, , denumit eroare de modelare. i = yi - M(YX=xi) => yi = M(YX=xi) + i = 0+ 1xi + i sau Y= 0+ 1X + 10 11. 2. Prezentarea modelului de regresie liniar simpl (3) Componentele modelului de regresie liniar sunt: 1. Componenta determinist este reprezentat de media condiionat M(YX=xi) = 0+ 1xi 2. Componenta aleatoare depinde de: natura fenomenului, specificarea modelului i erorile de msurare. a. Natura imprevizibil a fenomenului d natere la erori de modelare. b. Specificarea incomplet a modelului determin apariia erorilor de modelare. c. Erorile de msurare sunt i ele surprinse prin eroarea de modelare.11 12. 2. Prezentarea modelului de regresie liniar simpl (4) Parametrii modelului de regresie liniar sunt:. 1. 0 - reprezint constanta sau termenul liber al modelului i reprezint valoarea medie a variabilei Y atunci cnd X=0. Grafic parametrul 0 reprezint intersecia dreptei de regresie liniar cu axa OY (engl. intercept). 2. 1- reprezint variaia medie a variabilei dependente, Y, la o cretere cu o unitate a variabilei independente, X. 1 mai poart denumirea i de tangent a pantei dreptei sau simplu pant a dreptei (engl. slope) i arat cu ct variaz Y dac X crete cu o unitate. dY Y 1 = = dX X Dac 1>0 => exist o legtur direct ntre variabila Y i variabila X, dac 1 exist o legtur invers ntre variabila Y i variabila X iar dac 1=0 nu exist legtur ntre Y i X. 12 13. 2. Prezentarea modelului de regresie liniar simpl (5) Ipoteze clasice ale modelului de regresie 1. Ipoteze cu privire la eroarea de modelare i ~ N ( 0 , 2 ) , adic variabila - normalitatea erorilor: rezidual urmeaz o lege de repartiie normal de medie zero i varian 2; 2 2 - homoscedasticitate: V ( i ) = M ( i ) = ,adic variana erorii este constant la nivelul distribuiilor condiionate de tipul Yi X = xi ; - necorelarea erorilor: cov( i , j ) = 0, i j; i, j = 1, n ,adic erorile nu se influeneaz reciproc; - lipsa corelaiei dintre variabila independent i variabila eroare: cov( i , xi ) = 0 .13 14. 2. Prezentarea modelului de regresie liniar simpl (6) 2. Ipotezele cu privire la variabila independent: - variabila independent X este observabil (nestochastic); - variabila independent are o variaie finit i posibil de calculat; - variabilele independente (pentru cazul regresiei multiple) nu trebuie s fie coliniare. Modelul yi = estimatorilor 0 + 1 xi + i la nivelul unui eantion poate fi scris pe baza yi = 0 + 1 xi + i sau y i = y i + i .unde: - y i = 0 + 1 xi este estimatorul mediei condiionate M(YX=xi);- 1 este estimatorul parametrului 1 - 0 este estimatorul parametrului 0 -) ieste estimatorul erorii stohastice iParticular, pentru un eantion observat, modelul de regresie liniar yi = b0 + b1 xi + ei simpl poate fi scris: 14 15. 3. Estimarea parametrilor modelului liniar (1) 1. Estimarea punctual a parametrilor modelului liniar Estimarea parametrilor modelului de regresie poate fi fcut utiliznd metoda celor mai mici ptrate (MCMMP). Criteriul care st la baza metodei celor mai mici ptrate const n minimizarea n ptratelor erorii de modelare: 2 n n n 2 2 S = i2 = ( yi yi ) = yi ( 0 + 1 xi ) = yi 0 1 xi = min . i =1i =1i =1()i =1()Rezolvarea acestei probleme de minim presupune ndeplinirea a dou condiii: 1. Anularea derivatelor pariale de ordinul I ale lui S n raport cu 0 S S 1 : = 0 i =0 i 0 1 2. Matricea derivatelor pariale de ordinul doi s fie pozitiv definit: 2S 2 0 det 2 S 0 12S 0 1 2 >0 S 2 1 15 16. 3. Estimarea parametrilor modelului liniar (2) 1. Anularea derivatelor pariale de ordinul I ale lui S n raport cu 0 i 1: n n n()()S = 2 yi 0 1 xi ( 1) = 0 0 i =1n S = 2 yi 0 1 xi ( xi ) = 0 1 i =1 0 y x x x y = n x ( x ) i2 i2 iii2ii, n0 + 1 xi = yi i =1i =1nni =1i =1n 0 xi + 1 x = yi xi 2 ii =1 = n xi yi xi yi 1 2 n xi2 ( xi ) 0 = y 1 x 2. Matricea derivatelor pariale de ordinul doi s fie pozitiv definit: n xi 2 x x i i Este pozitiv definit deoarece n x i2 ( x i ) = n 2 2 > 0 216 17. 3. Estimarea parametrilor modelului liniar (3) Estimatorii parametrilor modelului de regresie sunt variabile de selecie care: -urmeaz()2 o distribuie normal: 0~ N 0 , 0 ,-sunt nedeplasai:-convergeni:( )( )( )(2 1 ~ N 1 , 1) M 0 = 0 , M 1 = 10 nN 0 ,( )1 nN 1 eficieni: dintre toi estimatorii posibili pentru 1 , 1 are variana cea mai mic -17 18. 3. Estimarea parametrilor modelului liniar (4) 2. Estimarea prin interval de ncredere a parametrilor modelului liniar Att pentru 0 , ct i pentru 1 , intervalele de ncredere se vor construi pentru un nivel de ncredere de (1-): 0 [ 0 t / 2,n k ] 0 1 [ 1 t / 2,n k ] 1Pe baza datelor de la nivelul unui eantion se vor utiliza estimaiile parametrilor:[ 0 b0 t / 2,n k s0][1 b1 t / 2,n k s1]unde k = numrul parametrilor estimai n model (pentru modelul liniar k=2), n = volumul eantionului pe baza cruia se fac estimrile.18 19. 3. Estimarea parametrilor modelului liniar (5) Abaterile standard ale estimatorilor i estimaiile acestora se determin dup relaiile: 2 1 x 2 2 1 x2 2 , respectiv s0 = s0 = s + = = 2 + 2 n ( xi x ) 2 n ( xi x ) i i 00 2 1 = = 1 2n( xi x) 2 2 s = s = , respectiv 1 1s2 n ( x x) i =1i =12,i2 unde este estimatorul varianei erorii de modelare, iar s 2 este estimaia acestuia: 2 =2 in2= ( yi 0 1 xi ) 2 n2s2 = , respectivei2 n2=( yi b0 b1 xi ) 2 n219 20. 4. Estimarea indicatorilor de corelaie (1) 1. Coeficientul de corelaie (se folosete doar pentru modelul N liniar): ( xi x )( yi y ) cov( X , Y ) i =1 ( X ,Y ) = = , -1+1 x y N x y n ( X ,Y ) r = ( xi x )( yi y )i =1ns x s yn=nni =1i =1i =1n xi yi xi yi nnnn[ n x ( xi ) ][ n y ( yi )2 ] i =12 ii =12i =12 ii =12. Raportul de determinaie: ( y i y ) 2 VE V 2= i = = 1 R , cu 0