Koreliacinė regresinė analizė 1. Tyrimo tikslai • Atlikti koreliacinę analizę - nustatyti, ar egzistuoja ryšys tarp to, kiek namų ūkių turi kompiuterius ir žmonių skaičiaus šalyje, bendro vidaus produkto, žmonių, turinčių aukštajį išsilavinimą, infliacijos ir vidutinio darbo užmokesčio. • Įvertinti to ryšio stiprumą; • Nustatyti ryšio priklausomybės formą, analitinę išraišką ir įvertinti jos adekvatumą realiai padėčiai; • Atlikti kitų priklausomų kintamųjų prognozavimą; • Aprašyti ir pateikti išvadas apie gautus rezultatus. 2. Koreliacinė analizė y su x1, x2, x3, x4, x5 Norint nustatyti, ar egzistuoja stohastinis ryšys tarp veiksnių y ir x1, x2, x3, x4, x5, x6, reikia apskaičiuoti koreliacijos koeficientą, nes būtent jis nusako ryšio stiprumą. Stohastinė priklausomybė – tai tokia priklausomybė, kai nėra vienareikšmiškos atitikties tarp nepriklausomojo ir priklausomojo kintamojo reikšmių, tačiau galime teigti, jog, kintant nepriklausomam kintamajam X, kinta priklausomojo kintamojo Y tikimybinis pasiskirstymas. Tačiau pirmiausiai apskaičiuoju: dispersiją, kuri parodo kintamųjų išsibarstymą apie vidurkį. , (MS funkcija VAR) vidurkį – parodo vidutinę kintamųjų reikšmę. , (MS funkcija AVERAGE) Standartinį kvadratinį nuokrypį – parodo kiek vidutiniškai kintamojo reikšmės yra nutolusios nuo vidurkio. (MS funkcija STDEV) Koreliacijos koeficientą. Jis nusako tiesinio ryšio stiprumą tarp kintamųjų ir gali įgyti reikšmes nuo -1 iki 1 (kuo rezultato modulis arčiau 1, tuo ryšys stipresnis). , (MS funkcijaCORREL) Pagrindinių duomenų lentelė Eil.Nr Metai Y Turi kompiuteri (is 1000) X1 Gyv.skaicius) X2 Pajamos X3 BVP X4 Gyventojai su aukstoju issilavinimu(%) X5 Infliacija 1 1996 12 3482822 618,2 25399,3 12,6 13,1 2 1997 17 3475587 778,1 24533,4 14,5 8,4 3 1998 20 3469547 929,8 27536,6 17,3 2,4 4 1999 30 3462553 987,4 26809,1 19,8 0,3 5 2000 53 3455413 970,8 30150,3 20,3 1,4 6 2001 85 3445857 982,3 29002,7 20,6 2 7 2002 120 3437806 1013,9 33695,1 22,1 -1 8 2003 193 3425324 1072,6 32793,7 23,2 -1,3 9 2004 250 3414842 1149,3 39266,7 25,2 2,9 10 2005 290 3403284 1276,2 37586 26,3 3 11 2006 360 3394442 1495,7 45206,8 26,8 4,5 12 2007 420 3384879 1802,4 44607,7 28,9 8,1 13 2008 480 3375690 1949,8 53531 29,2 10 suma 2330 44628046 15026,5 450118,4 286,8 53,8 vidurkis 179,2307692 6375435 2146,643 64302,6286 40,97143 7,685714 nuokrypis 165,5315448 36002,41 385,2584 8914,02328 5,236178 4,446823 dispersija 27400,69231 1,3E+09 148424 79459811 27,41756 19,77423 koreliacija -0,982617 0,951388 0,97470672 0,92489 0,226952 Kaip matome, koreliacija tarp duomenų yra pakankamai didelė,tik su paskutiniu duomeniu, infliacija maža. 3. x1, x2, …xm atrinkimas regresinei analizei atlikti Vien iš koreliacijos koeficiento negalima daryti išvados apie ryšio egzistavimą. . Reikia įvertinti šio koreliacijos koeficiento reikšmingumą. O jį galima įvertinti apskaičiavus imties statistiką ir palyginus ją su kritine reikšme tlent, kurią galima rasti Stjudento pasiskirstymo lentelėje, o taip pat naudojant MS Excelio programos funkciją tlent = TINV (α0,05, n-2) = TINV (0.05;30-2), (čia n-2 laisvės laipsnių skaičius) t 17,55506 10,24494 14,4649315 8,067445 0,772883 t statist. 2,200985 netinka Matome, kad visi duomenys tinkami, nes didesni už kritinę reikšmę, tik infliacija netinka, ką ir galėjome nuspėti iš mažos koreliacijos. Taigi tolesniai analizei imame tik keturis kintamuosius, nes penktasis nereikšmingas. 4. Porinė regresinė analizė y su x1, x2, x3, x4 Porinės regresinės analizės tikslas – nustatyti stohastinio ryšio tarp dydžių Y ir X formą ir analitinę išraišką. Tai atliekama parenkant kreivę, geriausiai aprašančią statistinių taškų visumą, ir įvertinant šios kreivės adekvatumą realiai padėčiai. Porinę regresinę analizę atliksiu su atrinktais reišmingais veiksniais: Gyventojų skaičiumi, vidutinėmis pajamomis, BVP ir gyventojais, su aukštuoju išsilavinimu (X1 X2, X3, X4). Bendrasis lygties pavidalas: Visų pirma reikia apskaičiuoti lygties koeficientus a0 ir a1. Juos galima apskaičiuoti pagal formules: (MS Excel programa funkcija INTERCEPT) ir (MS Excel programa funkcija SLOPE) Gauti rezultatai: a0 15688,74 -293,268 -447,47599 -465,8178 a1 -0,004518 0,408777 0,0181001 29,2386 Y= 15688,74 - 0,004518 X1 Y = -293,268 + 0,408777 X2 Y = -447,47599 + 0,0181001 Y= -465,8178 + 29,2386 Koeficientas prieš X lygtyje rodo, kiek padidės Y, padidėjus X vienu vienetu. Koeficientai a0 ir a1 rodo lygčių padėtį koordinačių sistemoje. Koeficientas a1 parodo lygties pasvirimo laipsnį, t.y. kuo koeficientas a1 yra didesnis, tuo lygtis su x ašimi sudarys didesnį kampą ir atvirkščiai. Jei dviejų lygčių koeficientai yra vienodi, tai reiškia, kad jos yra lygiagrečios, tačiau gali nesutapti, nes skirsis koeficientas a0. Jei koeficientas a0 yra teigiamas – tiesė didėjanti, t.y. kiekvieną didesnę y reikšmę atitinka didesnė x reikšmė, o jei neigiamas – atvirkščias proporcingumas, t.y. didėjant y reikšmėms, x reikšmės mažėja ir atvirkščiai. Kadangi jau nustatėme lygtis, reikia įvertinti kreivių adekvatumą realiai padėčiai. Norint tai padaryti reikia palyginti Fišerio dispersijų santykio koeficientą su Fišerio kritine reikšme. Regresijos dispersija: Likutinė dispersija: Skaičiavimai: y^X1 y^X2 y^X3 y^X4 -46,19 -40,56221 12,25387 -97,4114 -13,5032 24,80119 -3,419005 -41,85805 13,78468 86,81263 50,93921 40,01003 45,38265 110,3582 37,77139 113,1065 77,64023 103,5725 98,24744 127,7258 120,813 108,2734 77,47577 136,4974 157,1863 121,1908 162,4087 180,3553 213,5784 145,186 146,0932 212,5178 260,9347 176,5391 263,2552 270,995 313,1522 228,4129 232,8344 303,1575 353,0992 318,1394 370,7716 317,7768 396,3036 443,5112 359,9278 379,1778 437,8183 503,7649 521,4404 387,9494 suma 2330 2330 2330 2330 y^X1-yvidurkis y^X2-yvid y^X3-yvid y^X4-yvid 50814,53672 48308,95 27881,28 76530,89 37146,40199 23848,49 33360,94 48880,27 27372,40919 8541,112 16458,72 19382,41 17915,31853 4743,435 20010,76 4372,413 10320,6367 5724,177 6558,299 2652,757 3412,637097 5034,947 10354,08 1826,139 485,9564223 3368,643 282,9828 1,264639 1179,758897 1159,05 1098,095 1108,026 6675,530349 7,244914 7060,103 8420,674 17934,95367 2418,882 2873,344 15357,83 30230,23492 19295,61 36687,89 19194,99 47120,60933 69844,17 32651,42 39978,83 66867,50361 105322,4 117107,5 43563,47 suma 317476,4874 297617,1 312385,4 281270 regresijos dispersija 317476,4874 297617,1 312385,4 281270 y^2-y y^4-y y^5-y y^6-y 3386,08 2762,786 0,06445 11970,85 930,4482 60,85863 416,9358 3464,271 38,63023 4463,928 957,2349 400,4015 236,626 6457,436 60,39452 6906,698 607,1412 2557,576 2047,331 5583,952 1282,57 541,6516 56,61405 2651,985 1382,825 1,417901 1798,496 3642,766 423,47 2286,183 2200,244 380,9443 119,5674 5396,499 175,7001 440,7901 536,0251 3792,97 3267,911 173,1189 47,62089 1752,309 116,0272 1782,801 561,5199 552,7784 3608,667 1666,449 1779,297 564,7722 1717,31 8473,31 suma 11331,82 31191,17 16422,93 47538,34 likutine dispersija 1030,165 2835,561 1492,994 4321,667 F statistika 1 2 3 4 308,1801 104,9588 209,2342 65,08367 F lenteline 4,844336 (visi didesni, todel tinka) Šiuo atveju visos Fišerio reikšmės yra didesnės už lentelinę. O tai reiškia, ka visos mano tiriamų veiksnių kreivės yra adekvačios realiai padėčiai, taigi galima jomis remtis ir taikyti prognozavimą. Grafikai: Pirmąjame grafike matome atvirkštinę teisinę priklausomybę – mažėjant gyventojų skaičiui , daugėja kompiuterių namų ūkiuose. Likusiuose trijuose grafikuose matome tiesioginę priklausomybę : daugėjant žmonių su aukštuoju, augant BVP ir vidutiniam atlyginimui , taip pat daugėja ir namų ūkių su kompiuteriu. Na, o paskutinis grafikas – infliacija, kaip matome su mano tiriamai situacijai nedaro žymios įtakos. 5. Daugianarė koreliacinė regresinė analizė y su x1, x2, x3, x4 naudojant LINEST, LOGEST Tiesinė daugianarės regresinės lygties analizė Daugianarės koreliacinės regresinės analizės atveju yra ieškoma statistinio ryšio forma vieno iš veiksnių (Y) su visais kitais (X1, X2....Xn) kaip visuma. Tai svarbu įvertinti, nes vieną kintamąjį dažniausiai veikia ne vienas, o daug veiksnių vienu metu. Bendras daugianarės tiesinės regresijos modelis: Ŷ = a0 + a1x1 + a2x2 +....+anxn Daugianariai koreliacinę regresinę analizę atliksiu su jau atrinktais didžiausią ryšį turinčiais veiksniais: gyventojų skaičiumi, vid. Atlyginimu, BVP ir gyventojais, turinčiaus aukštąjį išsilavinimą. Eil. Nr Y (Turi kompiuteri (is 1000)) X1 (Gyv.skaicius) X2 (Pajamos) X3 (BVP) X4 (Gyventojai su aukstoju issilavinimu) 1 12 3482822 618,2 25399,3 12,6 2 17 3475587 778,1 24533,4 14,5 3 20 3469547 929,8 27536,6 17,3 4 30 3462553 987,4 26809,1 19,8 5 53 3455413 970,8 30150,3 20,3 6 85 3445857 982,3 29002,7 20,6 7 120 3437806 1013,9 33695,1 22,1 8 193 3425324 1072,6 32793,7 23,2 9 250 3414842 1149,3 39266,7 25,2 10 290 3403284 1276,2 37586 26,3 11 360 3394442 1495,7 45206,8 26,8 12 420 3384879 1802,4 44607,7 28,9 13 480 3375690 1949,8 53531 29,2 vidurkis 179,2308 Vidurkis 2302,669 315097,3 1780,961 a4 a3 a2 a1 a0 -17,9979 0,003436 0,054675 -0,00562 19692,81 S 4,15676 0,00242 0,06284 0,000793 2843,9 D=R2 0,992875 13,51111 #N/A #N/A #N/A F 209,012 6 #N/A #N/A #N/A Qregr , Qlikut 152620,7 1095,301 #N/A #N/A #N/A Su MS Excel funkcija „LINEST“ radau lygties koeficientus a1, a2, a3 ir a4. Ši funkcija skaičiuoja koeficientus, reikalingus nagrinėjant tiesinę lygtį. Y = a0 + a1x1 + a2x2 + a3x3+ a4x4 Y = 19692,81 -0,00562 X1 + 0,054675 X2 + 0,003436 X3 -17,9979 X4 S - vidutinis standartinis nuokrypis; D=R2 – determinacijos koeficientas; F – dispersijos santykis; Qregr , Qlikut – kvadratų sumos, kurių reikia skaičiuojant regresijos bei likutinę dispersijas. Eksponentinės daugianarės regresinės lygties analizė Eksponentinės daugianarės regresinės lygties bendroji išraiška yra: Y=b0 * b1x1 * b2x2 * b3x3 * ... * bnxn Eksponentinės daugianarės regresinės lygties koeficientus b0, b1, b3, b4 rasiu naudojant programos MS Excel funkciją LOGEST. b4 b3 b2 b1 b0 1,156213 0,999997 0,997856 0,999965 1,01E+54 S 0,054021 3,15E-05 0,000817 1,03E-05 36,95885 D=R2 0,987776 0,175588 #N/A #N/A #N/A F 121,2048 6 #N/A #N/A #N/A Qregr , Qlikut 14,94756 0,184987 #N/A #N/A #N/A y~ (y~-yvid)^2 (y-y~)^2 13,30036 27532,9 1,690938 16,07203 26620,78 0,861135 21,31999 24935,81 1,742375 34,69796 20889,73 22,07087 49,11129 16931,08 15,12209 70,24804 11877,23 217,6203 106,5417 5283,703 181,1262 171,2459 63,75783 473,24 274,4179 9060,595 596,2351 369,8307 36328,32 6372,936 329,9586 22718,89 902,4844 324,7185 21166,67 9078,571 331,0896 23061,09 22174,32 vidurkis 2112,553 246470,6 40038,02 Įstačius koeficientus gaunu lygtį: Y=1,01E+54* 0,999965x1 * 0,997856x2 * 0,999997x3 * 1,156213x4 *** Regresijos dispersija ; Likutinė dispersija ; Dispersijų santykis ; Tiesine daugianare Eksponentine daugianare S^2 regresijos dispersija 78774,33 61617,64 S^2 likutine 161,9056 3639,82 F 486,5449 16,92876 F= 3,35669 Kadangi F>=Fkr vadinasi, regresijos lygtys yra adekvačios realiai padėčiai ir jas galima taikyti planavimui. 6. Gautų rezultatų aprašymas Šiame darbe tikrinau priklausomojo y (namų ūkių, turinčių kompiuterį) priklausomybę nuo nepriklausomųjų kintamųjų x: gyventojų skaičiaus, vidutinio mėnesinio atlyginimo, BVP, žmonių, turinčių aukštajį išsilavinimą (procentais) ir metinės infliacijos. Apkaičiavus veiksnių įvertinimui reikalingus rodiklius, tokius kaip vidurkis, dispersija, standartinis kvadratinis nuokrypis, koreliacijos koeficientas atrinkau didžiausią ryšį su nešiojamo kompiuterio kaina turinčius veiksnius: gyventojų skaičius (r = -0.98), atlyginimas (r = 0.95), BVP (r = 0.97) aukštajį išsilavinimą tirintieji (r = 0.92). Kad įsitikinti šių gautų duomenų tikslumu, įvertinau koreliacijos koeficientų reikšmingumą ir paaiškėjo, kad visi veiksniai yra reikšmingi (t1,t2, t3,t4 >tlen). Atlikta daugianarė regresinė analizė parodė, kad mano parinkti veiksniai tikrai gerai nusako, kad nuo jų priklauso namų ūkių su kompiuteriais skaičius. Atlikus daugianarę regresinę analizę suradau lygtis: Tiesinės daugianarės regresijos lygtis Y = 19692,81 -0,00562 X1 + 0,054675 X2 + 0,003436 X3 -17,9979 X4 Eksponentinės daugianarės regresijos lygtis Y=1,01E+54* 0,999965x1 * 0,997856x2 * 0,999997x3 * 1,156213x4 Atlikusi šį darbą išsiaiškinau, kad šeimų, turinčių kompiuterius skaičius beveik tiesiogiai priklauso nuo bendro gyventojų skaičiaus, vidutinio atlyginimo kilimo, augančio BVP, daugėjančio išsilavonusių žmonių skaičiaus, ir beveik nepriklauso nuo per šiuos metus tipriai svyruojančios infliacijos. 7. Tyrimo rezultatų taikymo pavyzdžiai Atliktas tyrimas gali būti naudingas įvairioms informacinės visuomenės plėtros programoms, nes parodo įvarių veiksnių ir informacinių technologijų naudojimo sąryšį. Norint, kad kuo daugiau žmonių naudotusi naujausiom technologijom, reikėtų kelti bendrą pragyvenimo lygį, didinti BVP, skatinti išsilavinimą.. Atliktų tyrimų taikymas gali būti naudojamas ir įvairioms prognozėms sudaryti. Statistinių ryšių formų, stiprumų tyrimas praktikoje leidžia suvokti nagrinėjamų elementų sąveiką, galimus pokyčius ateityje. Kadangi vieno dydžio pokytis veikia kito dydžio pasiskirstymą, pakitus, pavyzdžiui, vidutinėms pajamoms per mėnesį, galima nustatyti kiek apytiksliai pakis ir namų ūkių, turinčių kompiuterius skaičius. Šiomis prognozėmis galima numatyti kainos svyravimus, tendencijas. Prognozė slenkančio vidurkio ir eksponentinio išlyginimo metodais. Vidutinės kvadratinės paklaidos Prognozavimas slenkančio vidurkio metodu Slenkančiojo vidurkio metodas taikomas laiko eilutėms, neturinčioms nei ryškaus trendo, nei ciklinės ar sezoninės komponentės. Slenkančio vidurkio metodo esmė yra laiko eilutės paskutiniųjų n reikšmių vidurkio skaičiavimas. Šis vidurkis ir naudojamas kaip prognozė naujam eiliniam laikotarpiui. Slenkantysis vidurkis skaičiuojamas: Slenkantis vidurkis = n paskutiniųjų reikšmių suma / n Šis metodas pagrįstas tuo, kad sužinojus naują laiko eilutės reikšmę, ji pakeičia seniausiąją reikšmę formulėje ir skaičiuojamas naujas vidurkis. N=2 metai komp. sk prognoze paklaida 1997 17 1998 20 ET reali-prognoze/reali 1999 30 18,5 11,5 0,383333 2000 53 25 28 0,528302 2001 85 41,5 43,5 0,511765 2002 120 69 51 0,425 2003 193 102,5 90,5 0,468912 2004 250 156,5 93,5 0,374 2005 290 221,5 68,5 0,236207 2006 360 270 90 0,25 2007 420 325 95 0,22619 2008 390 Suma 571,5 3,403709 vidutine procentine absoliutine paklaida MAPE= 37,81899 Mape parodo su kokiu procentu paklaidos daroma prognozė N=4 metai komp. sk prognoze paklaida 1997 17 1998 20 1999 30 2000 53 ET reali-prognoze/reali 2001 85 30 55 0,647059 2002 120 47 73 0,608333 2003 193 72 121 0,626943 2004 250 112,75 137,25 0,549 2005 290 162 128 0,441379 2006 360 213,25 146,75 0,407639 2007 420 273,25 146,75 0,349405 2008 330 Suma 807,75 3,629758 vidutine procentine absoliutine paklaida MAPE= 51,85369 Nubraižome grafikus, apatinė jų linija yra prognozuojamas skaičius. Išvada: geriau naudoti dviejų laikotarpių, nes paklaida mažesnė. Prognozavimas eksponentinio išlyginimo metodu Eksponentinis išlyginimas – tai toks prognozavimo metodas, kai prognozei naudojamas svertinis visų laiko eilutės reikšmių vidurkis. Eksponentinio išlyginimo modelis yra toks: Ft+1 = Ft + α (Yt - Ft) = α Yt + (1 - L)Ft Ft+1 - laiko eilutės prognozė laiko tarpui t+1; Yt - aktuali laiko eilutės reikšmė laikotarpyje Ft - laiko eilutės prognozė laikotarpiui t; α - išlyginimo konstanta 0
Šį darbą sudaro 2280 žodžiai, tikrai rasi tai, ko ieškai!
★ Klientai rekomenduoja
Šį rašto darbą rekomenduoja mūsų klientai. Ką tai reiškia?
Mūsų svetainėje pateikiama dešimtys tūkstančių skirtingų rašto darbų, kuriuos įkėlė daugybė moksleivių ir studentų su skirtingais gabumais. Būtent šis rašto darbas yra patikrintas specialistų ir rekomenduojamas kitų klientų, kurie po atsisiuntimo įvertino šį mokslo darbą teigiamai. Todėl galite būti tikri, kad šis pasirinkimas geriausias!
Norint atsisiųsti šį darbą spausk ☞ Peržiūrėti darbą mygtuką!
Mūsų mokslo darbų bazėje yra daugybė įvairių mokslo darbų, todėl tikrai atrasi sau tinkamą!
Panašūs darbai
Atsisiuntei rašto darbą ir neradai jame reikalingos informacijos? Pakeisime jį kitu nemokamai.
Pirkdamas daugiau nei vieną darbą, nuo sekančių darbų gausi 25% nuolaidą.
Išsirink norimus rašto darbus ir gauk juos akimirksniu po sėkmingo apmokėjimo!