Wprowadzenie do analizy regresji

  • Published on
    04-Feb-2016

  • View
    64

  • Download
    0

Embed Size (px)

DESCRIPTION

Wprowadzenie do analizy regresji. Wykad 10. Model kategoryczny ( categorical model ). W 1993 r. inwestor zastanawia si jak sklasyfikowa Amazon : Cz ekonomii informacji Dostawca ksiek W zalenoci od sklasyfikowania, podejmie rne decyzje Std sposb klasyfikacji jest istotny. - PowerPoint PPT Presentation

Transcript

Slajd 1

Wprowadzenie do analizy regresjiWykad 10Model kategoryczny (categorical model)W 1993 r. inwestor zastanawia si jak sklasyfikowa Amazon:Cz ekonomii informacjiDostawca ksiekW zalenoci od sklasyfikowania, podejmie rne decyzjeStd sposb klasyfikacji jest istotny

Kategorie

NIEZIELONEZIELONEZmiennoKalorieOdchylenieZmiennoGruszka100100-1806400Ciasto250250-1804900Jabko9090-1808100Banan110110-1804900Tort350350-18028900rednia: 900/5=180Suma: 0Caa zmienno : 53200OwoceKalorieGruszka100Jabko90Banan110rednia100Zmienno200DeseryKalorieCiasto250Tort350rednia300Zmienno5000R2 = (53200-5200)/53200 = 90,2%Poprzez sklasyfikowanie na deser i owoce wyjanilimy ponad 90% zmiennoci liczby kalorii obiektw

RegresjaKorelacja vs przyczynowoObecno sekcji golfa i presti szkoy W modelu regresji zakadamy, e Y zaley od X Y = F(X)W modelu regresji liniowej zakadamy, e zaleno jest liniowa Y = mX +b

Na przykad X dugo przektnej odbiornika, Y cena telewizora: Cena = 15X + $10030 calowy: Cena = 15(30)+100 = 550?100 calowy: Cena = 15(100)+100 = 1600?IntuicjaXY112549Regresja liniowaXYZmienno jeli Y = E(Y)Zmienno jeli Y = 2XZmienno jeli Y = mX + b11(5-1)2 = 16(2*1-1) 2 = 1(m+b-1) 2 = m2 + 2m(b-1) + (b-1) 225(5-5) 2 = 0(2*2-5) 2 = 1(2m+b-5) 2 = 4m2 + 4m(b-5) + (b-5) 249(5-9) 2 = 16(2*4-9) 2 = 1(4m+b-9) 2 = 16m2 + 8m(b-9) + (b-9) 2=(1+5+9)/3=5SUMA = 32SUMA = 3SUMA = 21m2 + 14mb + 3b2 94m 30b + 107Minimalizujemy:Warunki pierwszego rzdu: 42m + 14b -94 = 014m + 6b -30 = 0 |*3 (42m + 14b -94 = 0)+(42m + 18b -90 = 0)---------------------------- 4b + 4 = 0b = -1m = 18/7 SUMA = 21m2 + 14mb + 3b2 94m 30b + 107 = 8/7

R2 = (32-8/7)/32 = 96,4%IlustracjaXYY = E(Y)Y = 2XY = 18/7*X - 111521,625544,149589,3Y = 18/7*X-1Y = 2XY = E(Y)Liczba obserwacji112549310Dopasowanie vs przeuczenieR2=0,794211254935,11,52,53,58Przykad wzrost i wagaWzrostWaga116257217969318074419285517970616769717065817668917664101797811158531215662131837714175711516766161907117164571816761191877920180762118577221807823162622417880251535326172712717162rednia68,7037-6,7+6,1+8,1+11,3HWE(W)Y=0,73H-57,58W-E(W)W-Y[W-E(W)]2[W-Y]211625768,760,24-11,70-3,24136,8910,5321796968,772,610,30-3,610,0913,0231807468,773,345,300,6628,090,4441928568,782,0616,302,94265,698,6251797068,772,611,30-2,611,696,8161676968,763,880,305,120,0926,2071706568,766,06-3,70-1,0613,691,1381766868,770,43-0,70-2,430,495,8991766468,770,43-4,70-6,4322,0941,30101797868,772,619,305,3986,4929,07111585368,757,34-15,70-4,34246,4918,80121566268,755,88-6,706,1244,8937,44131837768,775,528,301,4868,892,20141757168,769,702,301,305,291,69151676668,763,88-2,702,127,294,49161907168,780,612,30-9,615,2992,33171645768,761,70-11,70-4,70136,8922,08181676168,763,88-7,70-2,8859,298,30191877968,778,4310,300,57106,090,33201807668,773,347,302,6653,297,10211857768,776,978,300,0368,890,00221807868,773,349,304,6686,4921,75231626268,760,24-6,701,7644,893,08241788068,771,8811,308,12127,6965,91251535368,753,70-15,70-0,70246,490,49261727168,767,522,303,485,2912,13271716268,766,79-6,70-4,7944,8922,95rednia68,7037Zmienno1913,63464,08R20,76Studium przypadku orso FlajFirmy lotnicza, ktra obsuguje tras Warszawa-KrakwNa razie interesuje nas tylko klasa ekonomicznaSprzedajemy miejsca w klasie biznes, ale maoFunkcja popytu wynosi Q = f (P, Pk, Y)Liczba sprzedanych biletw na jeden przelot w zaley od ceny biletu (P), ceny biletu konkurenta (Pk), oraz poziomu dochodu w danym regionieDzia prognoz udostpni nam rwnanie: Q = 25 + 3Y + Pk 2P

orso FLAJorso FlajZamy, e P = Pk = 240 PLN. Obecny wskanik zagregowanego dochodu* jest rwny 105. Zatem Q = 25 + 3(105) + 1(240) 2(240) = 100 miejscI rzeczywicie w cigu ostatnich 3 miesicy przecitna liczba sprzedanych biletw bya w przedziale (90,105)Cakowita liczba miejsc wynosi 180, czyli oboenie wynosio 55,5%

orso FLAJ* zyskw z dziaalnoci gospodarczej oraz dochodw osobistych w Warszawie oraz Krakowie w ujciu realnym, rok bazowy 2010 = 100orso Flaj krzywa popytuZamy, e w najbliszej przyszoci Y i Pk pozostan niezmienione. Wwczas Q = 25 + 3(105) + 1(240) 2P = 580 - 2P, czyli P = 290 Q/2 Gdy Y lub Pk si zmieni, ta krzywa popytu si przesunie, np. zamy, e Y=105 Y=119Wtedy Q = 622 2P, czyli P = 311 Q/2

orso FLAJorso Flaj (max zysku)Jeli pominiemy dodatkowy koszt dodatkowego pasaera (bardzo may), to firma bdzie chciaa zmaksymalizowa utargP = 290 Q/2R = P*Q = 290Q Q2/2MR = 290 Q Czyli nawet przy penym oboeniu utarg kracowy jest dodatni MR = 290 180 = 110Czyli firma powinna zmniejszy cen z 240 na 200, co spowoduje wzrost utargu za jeden rejs z 24000 (240*100) na 36000 (200*180)

orso FLAJZrnicowanie cenoweZamy, e s dwie grupy pasaerwBiznesmeniTuryciPopyt dla nich si rniBiznesmeni QB = 330 PB Turyci QT = 250 PTZatem Q = QB + QT = 580 2PAby utarg by zmaksymalizowany, kracowy utarg z miejsc biznesowych i kracowy utarg z miejsc ekonomicznych musi si rwna330 2QB = 250 2QTPo uproszczeniu: QB = 40 + QT. Dodatkowo jestemy ograniczeni rwnaniem QB + QT = 180Zatem optymalne wielkoci to: QB = 110, QT = 70, PB = 220 z, PT = 180 zUtarg z jednego lotu wynosi 220*110 + 180*70 = 36800 z, czyli wicej o 800 z ni bez zrnicowania cen.

orso FLAJOcena popytuAby dokonywa analiz takich, jak na poprzednich slajdach, trzeba wyznaczy krzyw popyturda informacji:Wywiady i badania ankietoweKontrolowane badania rynkuWytypowanie kilku podobnych rynkw i sprzedawanie na nich danego wyrobu przy rnych wartociach kluczowych zmiennychBadania porwnawcze rnych rynkw dostarczaj danych przekrojowychBadania w czasie jednego rynku dostarczaj szeregu czasowegoPoczenie obu rodzajw danych daje dane paneloweNie kontrolowane dane rynkoweTechniki drenia danychorso flajRokKwartaPrzecitna liczba sprzedanych biletw na jeden lotPrzecitna cena (w PLN)Rok 1Kw. I64,8250Kw. II33,6265Kw. III37,8265Kw. IV83,3240Rok 2Kw. I111,7230Kw. II137,5225Kw. III109,5225Kw. IV96,8220Rok 3Kw. I59,5230Kw. II83,2235Kw. III90,5245Kw. IV105,5240Rok 4Kw. I75,7250Kw. II91,6240Kw. III112,7240Kw. IV102,2235rednia87,2239,7Odchylenie standardowe27,012,7

orso FLAJ

Zmienno sprzedayRokKwartarednia sprzeda (Qs)Sprzeda rzeczywista (Q)Qs-Q(Qs-Q)2Rok 1Kw. I87,264,822,44375503,7219Kw. II87,233,653,643752877,652Kw. III87,237,849,443752444,684Kw. IV87,283,33,9437515,55316Rok 2Kw. I87,2111,7-24,4563598,1082Kw. II87,2137,5-50,25632525,691Kw. III87,2109,5-22,2563495,3407Kw. IV87,296,8-9,5562591,32191Rok 3Kw. I87,259,527,74375769,7157Kw. II87,283,24,0437516,35191Kw. III87,290,5-3,2562510,60316Kw. IV87,2105,5-18,2563333,2907Rok 4Kw. I87,275,711,54375133,2582Kw. II87,291,6-4,3562518,97691Kw. III87,2112,7-25,4563648,0207Kw. IV87,2102,2-14,9563223,6894rednia87,2731,6Suma kwadratw odchyle11706,0WykresyKrzywa popytu Q = 330 - P RokKwartaSprzeda prognozowana (Q*)Sprzeda rzeczywista (Q)Q*-Q(Q*-Q)2Rok 1Kw. I8064,815,2231,04Kw. II6533,631,4985,96Kw. III6537,827,2739,84Kw. IV9083,36,744,89Rok 2Kw. I100111,7-11,7136,89Kw. II105137,5-32,51056,25Kw. III105109,5-4,520,25Kw. IV11096,813,2174,24Rok 3Kw. I10059,540,51640,25Kw. II9583,211,8139,24Kw. III8590,5-5,530,25Kw. IV90105,5-15,5240,25Rok 4Kw. I8075,74,318,49Kw. II9091,6-1,62,56Kw. III90112,7-22,7515,29Kw. IV95102,2-7,251,84rednia90,387,23,1376,7Suma kwadratw odchyle6027,5Metoda najmniejszych kwadratwTworzymy macierz X zoonej z:Wektora jedynekWektora przecitnych cenWektor y to wektor przecitnej liczby sprzedanych biletwLiczymy wspczynniki rwnania Y = a + bX

Krzywa popytu Q = 478,6 - 1,63 PRokKwartaSprzeda prognozowana (Q*)Sprzeda rzeczywista (Q)Q*-Q(Q*-Q)2Rok 1Kw. I70,464,85,631,4Kw. II45,933,612,3151,8Kw. III45,937,88,165,9Kw. IV86,783,33,411,8Rok 2Kw. I103,1111,7-8,674,7Kw. II111,2137,5-26,3690,5Kw. III111,2109,51,73,0Kw. IV119,496,822,6510,1Rok 3Kw. I103,159,543,61897,4Kw. II94,983,211,7136,8Kw. III78,690,5-11,9142,3Kw. IV86,7105,5-18,8352,2Rok 4Kw. I70,475,7-5,328,0Kw. II86,791,6-4,923,7Kw. III86,7112,7-26,0674,3Kw. IV94,9102,2-7,353,3rednia87,20,0302,9Suma kwadratw odchyle4847,2Krzywe popytu porwnanieSuma kwadratw odchyle dla Q = 330 P rwna si 6027,5Suma kwadratw odchyle dla Q = 478,6 1,63P rwna si 4847,2

Krzywa popytu Q = 330 PR2=0,485

Krzywa popytu Q = 478,6 1,63PR2=0,586Regresja wielorakaCena nie jest jedynym czynnikiem okrelajcym wielko sprzedayPrzypumy, e mamy rwnie dane o przecitnej cenie biletw linii konkurencyjnej oraz o wysokoci dochodu w danym regionieNaley wykorzysta te dane do oszacowania rwnania regresji wielorakiej o postaciQ = a + bP +cPk + dYDaneRokKwartaPrzecitna liczba sprzedanych biletw na jeden lotPrzecitna cena (w PLN)Przecitna cena konkurentaPrzecitny dochd (wskanik)Rok 1Kw. I64,8250250104,0Kw. II33,6265250101,5Kw. III37,8265240103,0Kw. IV83,3240240105,0Rok 2Kw. I111,7230240100,0Kw. II137,522526096,5Kw. III109,522525093,3Kw. IV96,822024095,0Rok 3Kw. I59,523024097,0Kw. II83,223525099,0Kw. III90,5245250102,5Kw. IV105,5240240105,0Rok 4Kw. I75,7250220108,5Kw. II91,6240230108,5Kw. III112,7240250108,0Kw. IV102,2235240109,0Obliczanie wspczynnikwTworzymy macierz X oraz wektor y1250250104,01265250101,51265240103,01240240105,01230240100,0122526096,5122525093,3122024095,0123024097,0123525099,01245250102,51240240105,01250220108,51240230108,51240250108,01235240109,064,833,637,883,3111,7137,5109,596,859,583,290,5105,575,791,6112,7102,2

I otrzymujemy wektor wspczynnikw regresji28,843,0891,035-2,12Q = 28,84 - 2,12P + 1,03Pk + 3,09Y RokKwartaSprzeda prognozowana (Q*)Sprzeda rzcezywista (Q)Q*-Q(Q*-Q)2Rok 1Kw. I77,964,813,1171,6Kw. II38,333,64,722,3Kw. III32,637,8-5,226,9Kw. IV91,983,38,673,6Rok 2Kw. I97,7111,7-14,0196,8Kw. II118,2137,5-19,3373,9Kw. III97,9109,5-11,6133,7Kw. IV103,596,86,744,4Rok 3Kw. I88,459,528,9835,6Kw. II94,383,211,1123,4Kw. III83,990,5-6,643,8Kw. IV91,9105,5-13,6185,5Rok 4Kw. I60,875,7-14,9222,8Kw. II92,391,60,70,6Kw. III111,5112,7-1,21,5Kw. IV114,9102,212,7160,1Suma kwadratw odchyle2616,4R2 = (11706-2616,4)/11706 = 0,7764