1. KORELIACINĖ REGRESINĖ ANALIZĖ Koreliacija - tai yra statistinio ryšio tarp kintamųjų stiprumo matas. Koreliacinė analizė – tai statistinis metodas, kuriuo tiriami atsitiktinių dydžių, turinčių normąlųjį skirstinį, tarpusavio ryšiaii generalinėje aibėje. Pats koreliacinės analizės metodas neatskleidžia ryšių tarp reikšmių atsiradimo priežasčių. Jis tik kiekybiškai išmatuoja tų ryšių stiprumą. Regresinė analizė – tai statistinis metodas priklausomybių tarp atsitiktinių dydžių matematiniai išraiškai (regresijos lygčiai) nustatyti ir jos parametrams analizuoti. Tiesinės regresinės analizės lygtis – tiesė Y=a+bx. Regresinės ir koreliacinės analizės etapai: • Atliekama tiriamo reiškinio teorinė ir empirinė analizė ir nustatomi jį apibūdinantys požymiai. • Nustatomas koreliacinio ryšio stiprumas tarp rezultatinio požymio ir jį įtakojančių veiksnių. • Atliekama daugialypė regresinė analizė • Randamas regresijos lygties pavidalas ir įvertinami jos parametrai. • Atliekama regresijos lygtis ir jos parametrų interpretacija. Pagrindiniai šio darbo tyrimo tikslai: • nustatyti, ar egzistuoja ir jei egzistuoja, tai tarp kurių veiksnių, funkcinė priklausomybė; • nubraižyti tiesę, kuri atvaizduotų statistinių taškų visumą ir nustatyti jos adekvatumą realiai padėčiai; • aprašyti gautus rezultatus ir pateikti išvadas. Nagrinėjami veiksniai: Y – Mėsos gamybos apimtis X1 – Supirkimo įmonių superkamų ir paskerdžiamų gyvulių iš visų ūkių skaičius. X2 – Iš viso auginamų gyvulių skaičius. X3 – Realizuota skersti gyvulių ir paukščių gyvuoju svoriu. X4 – Maisto produktų suvartojimas, tenkantis vienam gyventojui. X5 – Vidutinis metinis gyventojų skaičius. X6 – Vidutinis mėnesinis darbo užmokestis Tikslas: išsiaiškinti nuo kokių veiksnių labiausiai priklauso mėsos gamybos kiekis. Pradiniai duomenys pateikti lentelėje (mėsos gamyba ir jai įtakos turintys veiksniai): Y, Mėsos gamyba, tūkst. Tonų X1, Supirko ir paskerdė gyvulių supirkimo įmonės iš visų ūkių, tūkst. X2, Gyvulių skaičius, tūkst. X3, Realizuota skersti gyvulių ir paukščių gyvuoju svoriu, tūkst. tonų X4, Maisto produktų suvartojimas, tenkantis vienam gyventojui X5, Vidutinis metinis gyventojų skaičius, tūkst. X6, Vidutinis mėnesinis darbo užmokestis 821,0 754,3 6221 421,585 92 3684,2 678,75 761,0 709,4 6211,5 419,857 90 3697,8 678,75 651,4 615,4 5797,5 413,658 67 3704,1 810,33 611,4 485 5413,4 412,584 66 3700,1 810,33 413,0 243,4 3990,5 409,717 57 3682,6 857,62 330,9 213,4 3440,3 329,844 50 3657,2 857,62 302,0 193,4 3197,7 301,996 53 3629,1 835,08 286,0 219,1 3077,9 285,983 53 3601,6 835,08 291,4 206,8 2926,3 291,435 51 3575,2 846,68 293,6 186,6 2944,2 293,658 53 3549,3 846,68 273,7 190,5 2749,1 273,656 54 3524,2 879,85 263,6 165,5 2455,4 263,647 50 3499,5 879,85 208,3 133,4 2168,7 208,273 44 3481,3 940,52 235,2 145,1 2317,1 235,186 52 3469,1 940,52 264,9 191,2 2393,2 264,87 59 3454,2 1003,97 302,6 199,5 2442,2 302,589 70 3435,6 1003,97 335,7 234,7 2433,9 335,635 73 3414,3 1111,52 335,3 253,5 2474,5 335,272 72 3394,1 1311,10 348,8 271,3 2519,8 321,458 77 3375,6 1311,10 1.1 PORINĖ KORELIACINĖ ANALIZĖ Porinėje koreliacinėje analizėje nagrinėjami du veiksniai, arba statistinio objekto požymiai. Nustatyti stochastinio ryšio tarp veiksnių X ir Y egzistavimą. Tai daroma pagal turimus statistinius duomenis skaičiuojat koreliacijos koeficientą ir įvedant jo reikšmingumą. Jei koreliacijos koeficiento dydis yra reikšmingas, tai daroma išvada apie stochastinio ryšio egzistavimą. Prielaidos koreliacinei analizei atlikti yra tokios: • Abu veiksniai X ir Y yra atsitiktiniai dydžiai; • Abu atsitiktiniai dydžiai X, Y pasiskirstę pagal normalųjį dėsnį. Koreliacijos koeficientas apskaičiuojamas pagal formulę: Taigi pagal turimus duomenis apskaičiuojame bendrą sumą, vidurkį, dispersiją bei kvadratinį nuokrypį: Vidurkis - tai vidutinė požymio reikšmė, nustatyta tiriant skirtingus objektus. (Excel’io funkcija - AVERAGE) Dispersija - statistinė imties charakteristika, atspindinti labiausiai tikėtiną eilinio matavimo vertės nukrypimą nuo aritmetinio vidurkio. (Excel’io funkcija – STDEV) Dispersija charakterizuoja sklaidą kvadratiniais vienetais. Norint, kad sklaida būtų charakterizuojama tokiais pat vienetais kaip ir matuojamas atsitiktinis dydis, naudojama kita charakteristika – vidutinis kvadratinis nuokrypis. Y, Mėsos gamyba, tūkst. Tonų X1, Supirko ir paskerdė gyvulių supirkimo įmonės iš visų ūkių, tūkst. X2, Gyvulių skaičius, tūkst. X3, Realizuota skersti gyvulių ir paukščių gyvuoju svoriu, tūkst. tonų X4, Maisto produktų suvartojimas, tenkantis vienam gyventojui X5, Vidutinis metinis gyventojų skaičius, tūkst. X6, Vidutinis mėnesinis darbo užmokestis 821,0 754,3 6221 421,585 92 3684,2 678,75 761,0 709,4 6211,5 419,857 90 3697,8 678,75 651,4 615,4 5797,5 413,658 67 3704,1 810,33 611,4 485 5413,4 412,584 66 3700,1 810,33 413,0 243,4 3990,5 409,717 57 3682,6 857,62 330,9 213,4 3440,3 329,844 50 3657,2 857,62 302,0 193,4 3197,7 301,996 53 3629,1 835,08 286,0 219,1 3077,9 285,983 53 3601,6 835,08 291,4 206,8 2926,3 291,435 51 3575,2 846,68 293,6 186,6 2944,2 293,658 53 3549,3 846,68 273,7 190,5 2749,1 273,656 54 3524,2 879,85 263,6 165,5 2455,4 263,647 50 3499,5 879,85 208,3 133,4 2168,7 208,273 44 3481,3 940,52 235,2 145,1 2317,1 235,186 52 3469,1 940,52 264,9 191,2 2393,2 264,87 59 3454,2 1003,97 302,6 199,5 2442,2 302,589 70 3435,6 1003,97 335,7 234,7 2433,9 335,635 73 3414,3 1111,52 335,3 253,5 2474,5 335,272 72 3394,1 1311,10 348,8 271,3 2519,8 321,458 77 3375,6 1311,10 Suma 7329,8 5611,5 65174,2 6120,903 1183 67529,1 17439,32 Vidurkis 385,8 295,34 3430,22 322,15 62,26 3554,16 917,86 Dispersija 33300,86064 37136,77035 1948585,008 4305,874274 189,3157895 13017,30801 29671,72841 Kv. Nuokrypis 182,485234 192,7090303 1395,917264 65,61916087 13,75920744 114,0934179 172,2548357 Toliau galime skaičiuoti koreliacijos koeficientą, kuris yra apskaičiuojamas pagal anksčiau paminėtą formulę: Koreliacijos koeficientą galima apskaičiuoti pagal pateiktą formulę arba naudojant Excel funkciją CORREL. X1, Supirko ir paskerdė gyvulių supirkimo įmonės iš visų ūkių, tūkst. X2, Gyvulių skaičius, tūkst. X3, Realizuota skersti gyvulių ir paukščių gyvuoju svoriu, tūkst. tonų X4, Maisto produktų suvartojimas, tenkantis vienam gyventojui X5, Vidutinis metinis gyventojų skaičius, tūkst. X6, Vidutinis mėnesinis darbo užmokestis Korel. Koef. 0,989111247 0,964497159 0,88409715 0,774099845 0,661601504 -0,488957659 Koreliacijos koeficiento reikšmingumui patikrinti naudojama statistika t kritinę: Čia: r – apskaičiuota koreliacijos koeficiento reikšmė, n – išmatuotų reikšmių kiekis. Gauname: X1, Supirko ir paskerdė gyvulių supirkimo įmonės iš visų ūkių, tūkst. X2, Gyvulių skaičius, tūkst. X3, Realizuota skersti gyvulių ir paukščių gyvuoju svoriu, tūkst. tonų X4, Maisto produktų suvartojimas, tenkantis vienam gyventojui X5, Vidutinis metinis gyventojų skaičius, tūkst. X6, Vidutinis mėnesinis darbo užmokestis tlent 27,71092349 15,05802995 7,800559391 5,041666895 3,637837488 2,311139169 Excel pagalba t lentelinę reikšmė randame naudodami funkciją TVIN su reikšmingumo lygmeniu 0,05 ir laisvės laipsniu n-2. Taigi t lentelinę reikšmę gauname: tkr α,k = 2,109815559 Stochastinės priklausomybės būtinoji sąlyga: tlent > tkr α,k Jei: tlent > tkr α,k , tai r yra statistiškai reikšmingas ir egzistuoja stochastinė priklausomybė tarp X ir Y. tkr α,k 2,109815559 2,109815559 2,109815559 2,109815559 2,109815559 2,109815559 tlent 27,71092349 15,05802995 7,800559391 5,041666895 3,637837488 2,311139169 Iš pateiktų duomenų matome, kad vios t lentelinės reikšmės yra didesnė už t kritinę reikšmę, tai galime daryti išvadą, kad šie koreliacijos koeficientai yra reikšmingi. 1.2 PORINĖ REGRESINĖ ANALIZĖ Porinės regresinės analizės tikslas – nustatyti stochastinio ryšio tarp dydžių X ir Y formą ir analitinę išraišką. Tai daroma parenkant kreivę, geriausiai aprašančią statistinių taškų visumą, ir įvertinant šios kreivės advekatumą realiai padėčiai. Iš pradžių atkreipiame dėmesį į funkcijinės ir stochastinės priklausomybės sąvokų skirtumus. Funkcinė priklausomybė – tai toks ryšys tarp dydžių, kai kiekvienai X reikšmei galima nurodyti vienintelę priklausomojo Y reikšmę. Stochastinė priklausomybė – tai tokia priklausomybė kai nėra vinareikšmiškos atitikties tarp nepriklausomojo ir priklausomojo kintamojo reikšmių, tačiau galima teigti, kad kintant nepriklausomajam kintamajam x, kinta priklausojo kintamojo y tikimybinis pasiskirstymas. Bendrasis regresijos tiesės lygties pavidalas yra toks: yˆ = a0 + a1 · x. Koeficientai apskaičiuojami naudojant šias Excel’io finkcijas: a0 - INTERCEPT a1 - SLOPE Atliekame porinę regresiją su kiekvienu x1, x2, x3, x4, x5, x6. Lentelėje pateikiu gautis koeficientus: X1 X2 X3 X4 X5 X6 a0 109,1509266 -46,72603136 -406,2826245 -253,458833 -3375,200696 861,2273826 a1 0,936635908 0,12608662 2,458651912 10,26670991 1,058189924 -0,517997376 Įsistatome gautus koeficientus į tiesės išraišką yˆ = a0 + a1 · x: X1: y1^ = 109,1509266 + 0,936635908*x1; X2: y2^ = -46,72603136 + 0,12608662*x2; X3: y3^ = -406,2826245 + 2,458651912*x3; X4: y4^ = -253,458833 + 10,26670991*x4; X5: y5^ = -3375,200696 + 1,058189924*x5. X6: y6^ = 861,2273826 + -0,517997376*x6. X1, Supirko ir paskerdė gyvulių supirkimo įmonės iš visų ūkių, tūkst. y^=a0+a1x X2, Gyvulių skaičius y^ nuo x2 X3, Realizuota skersti gyvulių ir paukščių gyvuoju svoriu, tūkst. tonų y^ nuo x3 754,3 815,655392 6221 737,6588 421,585 630,2481 709,4 773,600439 6211,5 736,461 419,857 625,9996 615,4 685,556664 5797,5 684,2611 413,658 610,7584 485 563,419342 5413,4 635,8313 412,584 608,1178 243,4 337,128106 3990,5 456,4226 409,717 601,0689 213,4 309,029029 3440,3 387,0498 329,844 404,689 193,4 290,296311 3197,7 356,4612 301,996 336,2204 219,1 314,367854 3077,9 341,356 285,983 296,85 206,8 302,847232 2926,3 322,2412 291,435 310,2546 186,6 283,927187 2944,2 324,4982 293,658 315,7202 190,5 287,580067 2749,1 299,8987 273,656 266,5422 165,5 264,164169 2455,4 262,8671 263,647 241,9336 133,4 234,098157 2168,7 226,718 208,273 105,7882 145,1 245,056797 2317,1 245,4293 235,186 171,9579 191,2 288,235712 2393,2 255,0245 264,87 244,9405 199,5 296,00979 2442,2 261,2027 302,589 337,6784 234,7 328,979374 2433,9 260,1562 335,635 418,927 253,5 346,588129 2474,5 265,2753 335,272 418,0345 271,3 363,260248 2519,8 270,987 321,458 384,0707 Suma 7329,80 7329,80 7329,80 X4, Maisto produktų suvartojimas, tenkantis vienam gyventojui y^ nuo x4 X5, Gyventojų skaičius metų pradžioje ir vidutinis metinis gyventojų skaičius, tūkst. y^ nuo x5 X6, Vidutinis mėnesinis darbo užmokestis y^ nuo x6 92 691,0785 3684,2 523,3826 678,75 509,6367 90 670,5451 3697,8 537,774 678,75 509,6367 67 434,4107 3704,1 544,4406 810,33 441,4768 66 424,144 3700,1 540,2078 810,33 441,4786 57 331,7436 3682,6 521,6895 857,62 416,9842 50 259,8767 3657,2 494,8115 857,62 416,9825 53 290,6768 3629,1 465,0764 835,08 428,6564 53 290,6768 3601,6 435,9761 835,08 428,6581 51 270,1434 3575,2 408,0399 846,68 422,6476 53 290,6768 3549,3 380,6328 846,68 422,6494 54 300,9435 3524,2 354,0722 879,85 405,4674 50 259,8767 3499,5 327,9349 879,85 405,4674 44 198,2764 3481,3 308,6759 940,52 374,0422 52 280,4101 3469,1 295,766 940,52 374,0405 59 352,2771 3454,2 279,9989 1003,97 341,1753 70 465,2109 3435,6 260,3166 1003,97 341,1736 73 496,011 3414,3 237,7772 1111,52 285,4647 72 485,7443 3394,1 216,4017 1311,10 182,081 77 537,0778 3375,6 196,8252 1311,10 182,081 Suma 7329,80 7329,80 7329,80 Regresijos tiesėms nubrėžti naudojame funkciją Add Trendline: Taigi regresijos kreivės adekvatumui įvertinti turime apskaičiuoti regresijos dispersiją: čia m – veiksnių skaičius, ir likutinę dispersiją: Rezultatus pateikiu lentelėje: Regresinė dispersija nuo X1 nuo X2 nuo X3 nuo X4 nuo X5 nuo X6 135807,766 34049804,73 1282,0734 86306,07 10879581,44 85832,038 104730,586 33939025,78 1161,3137 87485,186 10969483,45 85832,038 52725,8278 29286724,75 777,24158 101620,02 11011254,61 180246,43 9844,81729 25276973,45 718,51085 102258,58 10984724,04 180243,6 20271,7647 12994013,87 573,03036 108095,6 10869029,05 222630,83 29714,5015 9330098,861 3128,7183 112747,5 10702195,7 222633,98 37009,6594 7906900,006 7019,5823 110741,83 10519131,45 201874,43 27781,8715 7247515,762 9959,2311 110741,83 10341505,04 201871,44 32033,4636 6454247,219 8900,7804 112076,94 10172406,65 212432,85 39672,2531 6545518,283 8486,2689 110741,83 10007865,45 212429,78 38133,8673 5585286,398 12571,555 110077,27 9849686,704 244106,21 48522,8147 4283331,301 14916,213 112747,5 9695258,794 244106,21 63695,1331 3178807,48 31508,361 116812,85 9582250,587 307733,94 57926,3557 3730001,008 22678,236 111408,39 9506868,714 307737,64 37860,9668 4029739,283 14618,974 106784,48 9415207,756 382156,06 34699,8462 4228867,546 6920,5673 99716,344 9301408,453 382160,18 22824,8483 4194799,846 2514,4155 97830,67 9171939,766 526695,24 17497,7199 4362755,636 2550,9517 98457,228 9049995,556 856219,05 13105,4294 4554045,853 4137,1843 95344,438 8939029,927 856219,05 Suma 823859,49 211178457,07 154423,21 1991994,54 190968823,15 5913160,97 Y^1 - Y Y^2 - Y Y^3 - Y Y^4 - Y Y^5 - Y Y^6 - Y 28,56484 6945,7502 36386,271 16879,602 88576,103 96947,127 158,7711 602,16206 18225,11 8182,0963 49829,844 63183,527 1166,678 1079,8551 1651,739 47084,343 11440,313 44067,732 2302,144 596,88734 10,772731 35064,802 5068,3232 28873,293 5756,544 1885,5245 35369,896 6602,5973 11813,412 15,873848 478,3394 3152,7964 5444,8102 5044,3144 26866,978 7410,1922 136,9763 2966,0173 1171,037 128,21503 26593,899 16041,846 804,7351 3064,2842 117,72305 21,872387 22492,841 20351,343 131,0391 951,1824 355,49577 451,84421 13604,871 17225,942 93,56331 954,69849 489,30231 8,5451427 7574,7087 16653,738 192,6563 686,37167 51,233769 742,20842 6459,6963 17362,645 0,318287 0,5372074 469,43392 13,863241 4138,9851 20126,357 665,5449 339,22352 10508,672 100,47249 10075,319 27470,483 97,15644 104,63809 3999,5652 2043,9516 3668,2368 19276,682 544,5555 97,526135 398,38134 7634,7492 227,97802 5817,9189 43,43087 1713,7354 1230,4941 26442,292 1787,8852 1487,9193 45,16681 5706,8667 6926,7352 25699,614 9588,882 2523,5888 127,4219 4903,4572 6845,0007 22633,482 14136,799 23476,055 209,0988 6054,8577 1244,0224 35448,541 23096,336 27795,217 Suma 12982,70 41806,37 130895,70 240227,40 337041,41 456107,48 nuo X1 nuo X2 nuo X3 nuo X4 nuo X5 nuo X6 S^2lik= 763,6885 2459,1983 7699,7469 14131,024 19825,965 26829,852 Tada reikia apskaičiuoti dispersijų santykį, arba statistiką F: F= 1078,79 85872,886 20,055621 140,96605 9632,2585 220,39484 Apskaičiuotą dispresijų santykį reikia lyginti su kritine (lenteline) reikšme. Statistika F pasiskirsčiusi pagal Fišerio pasiskirstymo fėsnį su laisvės laipsniais ν1 = m ir ν2 = n-2. Gauname: Fkr=4,451322 Būtina sąlyga: F > Fkr Iš duomenų matyti, kad apskaičiuoti dispersijų santykiai yra didesni už lentelinę reikšmę, taigi galima daryti išvadas, kad regresijos lygtis yra adekvati realiai padėčiai ir ją galima taikyti planavimui, praktiniams skaičiavimams. 1.3 DAUGIANARĖ KORELIACINĖ REGRESINĖ ANALIZĖ Remiantis daugianare regresine analize, ieškoma statistinio ryšio forma tarp priklausomojo veiksnio Y ir nepriklausomai kintančiųjų veiksniu X1, X2, ..., Xn. Sąvoka „nepriklausomi kintamieji“ yra gana sąlygiška. Tai gali būti veiksniai kuriems, mes negalime daryti įtakos bei valdyti. Nagrinėsime tiesinį regresijos modelį: yˆ=a0+a1x1+a2x2+...+anxn Pateikiu duomenis, kurie reikalingi skaičiavimui: Y, Mėsos gamyba, tūkst. Tonų X1, Supirko ir paskerdė gyvulių supirkimo įmonės iš visų ūkių, tūkst. X2, Gyvulių skaičius X3, Realizuota skersti gyvulių ir paukščių gyvuoju svoriu, tūkst. tonų X4, Maisto produktų suvartojimas, tenkantis vienam gyventojui X5, Gyventojų skaičius metų pradžioje ir vidutinis metinis gyventojų skaičius, tūkst. X6, Vidutinis mėnesinis darbo užmokestis 821,0 754,3 6221 421,585 92 3684,2 678,75 761,0 709,4 6211,5 419,857 90 3697,8 678,75 651,4 615,4 5797,5 413,658 67 3704,1 810,33 611,4 485 5413,4 412,584 66 3700,1 810,33 413,0 243,4 3990,5 409,717 57 3682,6 857,62 330,9 213,4 3440,3 329,844 50 3657,2 857,62 302,0 193,4 3197,7 301,996 53 3629,1 835,08 286,0 219,1 3077,9 285,983 53 3601,6 835,08 291,4 206,8 2926,3 291,435 51 3575,2 846,68 293,6 186,6 2944,2 293,658 53 3549,3 846,68 273,7 190,5 2749,1 273,656 54 3524,2 879,85 263,6 165,5 2455,4 263,647 50 3499,5 879,85 208,3 133,4 2168,7 208,273 44 3481,3 940,52 235,2 145,1 2317,1 235,186 52 3469,1 940,52 264,9 191,2 2393,2 264,87 59 3454,2 1003,97 302,6 199,5 2442,2 302,589 70 3435,6 1003,97 335,7 234,7 2433,9 335,635 73 3414,3 1111,52 335,3 253,5 2474,5 335,272 72 3394,1 1311,10 348,8 271,3 2519,8 321,458 77 3375,6 1311,10 Vidurkis 385,8 Bendras daugianarės tiesinės regresijos modelis yra toks: yˆ=a0+a1x1+a2x2+a3x3+a4x4+a5x5+a6x6 Regresijos koeficientai a0, a1, a2, a3, a4, a5, a6 randami naudojant statistinę EXCEL funkciją LINEST (tiesinė). -0,07997629 -0,319765884 1,255323557 0,371004959 0,081715719 0,284749701 1033,604 0,059399406 0,187188519 0,982715846 0,228873391 0,034369324 0,184498577 657,0693 0,996176433 13,81998854 #N/A #N/A #N/A #N/A #N/A 521,0718482 12 #N/A #N/A #N/A #N/A #N/A 597123,5866 2291,904998 #N/A #N/A #N/A #N/A #N/A Regresijos lygties koeficientai yra pateikti pirmoje eilutėje, pradedant iš dešinės: a0, a1, a2, a3, a4, a5, a6. Antroje eilutėje yra šių koeficientų vidutiniai kvadratiniai nuokrypiai. Trečiosios eilutės pirmajame stulpelyje pateikiamas determinanacijos koeficientas, kuris šiuo atveju yra D = 0,996176433, o tai reiškia, kad regresijos lygties patikimumas yra rodomas ~ 99,6%. Pagal lentelėje gautus duomenys galime sudaryti regresijos lygtį: yˆ=1033,60+0,28x1+0,082x2+0,371x3+1,255x4-0,32x5-0,08x6 Pateikiu lentelę: Y^ (Y^-Yvid)^2 (Y-Y^)^2 796,2785 168509,856 611,15417 775,2163 151661,4882 202,10452 670,9092 81299,25749 380,60865 602,0164 46758,62399 88,052467 406,4001 425,2301001 43,559268 322,5988 3991,728665 68,909612 301,3016 7136,416128 0,4877122 301,6831 7072,113866 245,95919 292,8185 8641,65192 2,0120332 300,1468 7332,860705 42,860893 284,5224 10252,88785 117,1244 252,5673 17745,34622 121,72074 192,8908 37205,83737 237,44344 232,2773 23562,75378 8,5421379 271,1133 13148,21237 38,605005 311,2307 5557,447233 74,488282 334,8116 2597,666524 0,7891853 332,5899 2829,07161 7,3444815 348,4274 1395,13656 0,1388155 Suma 7329,8 597123,5866 2291,905 Analogiškai kaip ir porinėje regresijoje, pagal lentelės duomenis apskaičiuoju regresijos disersiją bei likutinę dispersiją: S^2 regresinė dispersija 99520,5978 S^2 likutinė dispersija 190,992083 Turėdami abi dispersijas, galima rasti dispersijų santykį F: F stat 521,071848 Randame Fkr iš Fišerio pasiskirstymo lentelės, Kai reikšmingumo lygmuo α=0,05, o laisvės laipsnių skaičius v1=m, v2=n-m-1. Naudojame Excel formulę FINV ir gauname: Fkr0,05,6,12 = 2,99612038 Būtina sąlyga: Fstat >= Fkr, šiuo atveju taip ir gauname, kad 521,07>2,996, todėl galima daryti išvadą, kad regresijos lygtis yra adekvati realiai padėčiai. Galima ieškoti regresijos kreivės kita analitine forma, pvz., eksponentinės kreivės pavidalu: ỹ = b0 * b1x1* b2x2*…*bnxn Tokiu atveju regresijos lygties koeficientus gauname taikydami statistinę funkciją LOGEST. Gautus duomenis pateikiu lentelėje: 0,999973031 0,9995059 1,002046937 1,00224835 1,000148714 1,000395768 480,4348 0,000100462 0,000316592 0,001662069 0,000387094 5,81289E-05 0,000312043 1,111302 0,997701227 0,023373772 #N/A #N/A #N/A #N/A #N/A 868,0293054 12 #N/A #N/A #N/A #N/A #N/A 2,845399399 0,006555998 #N/A #N/A #N/A #N/A #N/A Determinacijos koeficientas D šiuo atveju yra: D = 0,997701227 Gauname lygtį: ỹ = 480,4348 * 1,00034x1 *1,0002x2 * 1,00224x3* 1,00205x4 * 0,9995x5 * 0,99997x6 Pateikiu lentelę su rezultatais: Y~ (Y~-Yvid)^2 (Y-Y~)^2 807,592424 177926,609 179,763091 780,69648 155959,857 387,95131 661,039052 75768,1251 92,9113197 591,474272 42310,5665 397,034642 427,502895 1740,88777 210,33395 324,77488 3721,49622 37,5170934 298,041067 7697,93571 15,673153 289,227816 9322,12106 10,4187932 287,347813 9688,68823 16,4202201 292,143411 8767,61366 2,1216513 275,451142 12172,2246 3,06649832 256,31146 16761,8302 53,122809 213,105593 29816,0875 23,0937196 237,772657 21905,862 6,61856312 267,068305 14092,2167 4,70154578 303,223811 6815,3506 0,38913972 335,338963 2544,19202 0,13034766 340,480824 2051,91996 26,84094 341,204439 1986,88681 57,6925493 Suma 7329,7973 601050,471 1525,80134 Kaip ir anksčiau skaičiuojame regresinę bei likutinę dispersijas pagal prieš tai naudotas formules. Rezultatai: S^2 regresinė dispersija 100175,079 S^2 likutinė dispersija 127,150111 Toliau randame dispersijų santykį F: F stat 787,848924 F kritinė lieka tokia pat kaip ir prieš tai buv oapskaičiuota: Fkr0,05,6,12 = 2,99612038 Taigi matome, kad Fstat >= Fkr, šiuo atveju gauname, kad 787,85>2,996, todėl galima daryti tokią pat išvadą, kad regresijos lygtis yra adekvati realiai padėčiai. Patikrinti, kuri funkcija LINEST ar LOGEST geriau aprašo tyriamus duomenis, galime pagal D (determinacijos koeficientą). Pagal LINEST fukciją D = 0,996176433, o pagal LOGEST funkciją determinacijos koeficientas yra lygus 0,997701227.Galima teigti, kad determinacijos koeficientai yra beveik lygus, bet vis dėlto LOGEST funkcija geriau aprašo regresijos lygtį, todėl prognozavimui ji geriau tinka. 1.4 GAUTŲ REZULTATŲ APRAŠYMAS Atrenkant veiksnius regresinei analizei paaiškėjo, kad koreliacinis ryšys yra didžiausias tarp Y ir X1, nes r1 yra arčiausiai 1 (0,989). Atlikus porinę regresinę analizę ir radus tiesės lygtis Y1, Y2, Y3, Y4, Y5, Y6 paaiškėjo, kad visos regresinės lygtys yra adekvačios realiai situacijai, nes F1, F2, F3, F4, F5, F6 > Fkr Gavome regresinę lygtį (tiesiniu būdu (LINEST)): yˆ=1033,60+0,28x1+0,082x2+0,371x3+1,255x4-0,32x5-0,08x6 Gavome regresinę lygtį (eksponentiniu būdu (LOGEST)): ỹ = 480,4348 * 1,00034x1 *1,0002x2 * 1,00224x3* 1,00205x4 * 0,9995x5 * 0,99997x6 Taip pat išsiaiškinome, kad visi šeši reikšmingi veiksniai kartu (daugianarė koreliacija) įtakoja vartojimo išlaidas ~99,6% (skaičiuojant LINEST funkcijos pagalba), ir taip pat gavome 99,8~% (skaičiuojant LOGEST funkcijos pagalba). 1.5 TYRIMO TAIKYMO PAVYZDŽAI Toks tyrimas yra rekomenduojamas tiek mėsos gamyba užsiimančiai įmonei tiek individualiam asmeniui, kadangi šio tyrimo rezultatai suteikia naudingos informacijos apie mėsos gamybą lemiančius veiksnius. Įmonės ar individo veiklos tikslas yra pirkti santykinai pigiau (tam, kad galėtų gauti kuo didesnį pelną pardavus), todėl įmonė, norėdama šį tikslą pasiekti (pagaminti ir parduoti tiek, kad būtų gautas max pelnas), turėtų žinoti kokie veiksniai labiausiai veikia gamybos kiekį (Y). Tam įmonei reikėtų įvertinti paklausą ir išsiaiškinti, ar egzistuoja priklausomybė tarp tam tikrų veiksnių ir paklausos. Būtent šis tyrimas padeda nustatyti, kurie konkretūs veiksniai (X) daugiau ar mažiau lemia mėsos gamybą. 2. PROGNOZAVIMAS 2.1. SLENKANČIO VIDURKIO METODAS Slenkančio vidurkio metodas taikomas laiko eilutėms, neturinčioms nei ryškaus trendo, nei ciklinės ar sezoninės komponentės. Esant tokiai situacijai, reikėtų taikyti tokį prognozavimo metodą - išlyginti nereguliariąją laiko eilutės komponentę, naudojant kurio nors vidurkio skaičiavimo procesą. Slenkantysis vidurkis apskaičiuojamas taip: Slenkantysis vidurkis = Slenkančio vidurkio metodo esmė - prognozė skaičiuojama pagal paskutiniąsias reikšmes. Taigi norint prognozuoti slenkančio vidurkio pagalba pirmiausia reikia pasirinkti duomenų kiekį, kuriuos imsime vidurkio skaičiavimui. Prognozę atliksiu pagal dviejų ir keturių paskutinių reikšmių sumą. Šiame kursiniame darbe prognozuosiu mėsos gamybos apimtį per metus. 1 PROGNOZAVIMAS Metai Mėsos gamyba, tūkst. Tonų prognozė paklaida ET (reali-prognoze) /realios Paklaidos kvadratas 1989 821,0 1990 761,0 1991 651,4 791,0 -139,6 0,214307645 19488,2 1992 611,4 706,2 -94,8 0,155053974 8987,0 1993 413,0 631,4 -218,4 0,528813559 47698,6 1994 330,9 512,2 -181,3 0,547899668 32869,7 1995 302,0 372,0 -70,0 0,231622517 4893,0 1996 286,0 316,5 -30,5 0,106468531 927,2 1997 291,4 294,0 -2,6 0,008922443 6,8 1998 293,6 288,7 4,9 0,016689373 24,0 1999 273,7 292,5 -18,8 0,068688345 353,4 2000 263,6 283,7 -20,1 0,076062215 402,0 2001 208,3 268,7 -60,4 0,289726356 3642,1 2002 235,2 236,0 -0,8 0,003188776 0,6 2003 264,9 221,8 43,2 0,162891657 1861,9 2004 302,6 250,1 52,6 0,173661599 2761,5 2005 335,7 283,8 52,0 0,154751266 2698,8 2006 335,3 319,2 16,2 0,048165822 260,8 2007 348,8 335,5 13,3 0,038130734 176,9 2008 342,1 Suma -655,1 2,8 Vidutinė kvadratinė paklaida (MSE) 7473,7 Prognozė 3-tiems metams kaip matome yra 791,0 tūkst. tonų pagamintos mėsos produktų, o pagaminta buvo 651,4 tūkst. tonų, prognozė apskaičiuojama taip: slenk.vid.(1-2) = . Vadinasi prognozės paklaida yra 651,4-791 = -139,6 (tūkst. tonų), o paklaidos kvadratas (-139,6)^2 = 19488,2. Visos kitos prognozės, paklaidos ir jų vidurkiai yra apskaičiuojami analogiškai. Viskas pateikta aukščiau esančioje lentelėje. Apskaičiavus vidutinę kvadratinę paklaida gaunam, kad MSE = 7473,7. Toliau galime apskaičiuoti vidutinę procentinę absoliutinė paklaidą MAPE. MAPE = 100/17*2,8 = 16,61790872 2 PROGNOZAVIMAS Metai Mėsos gamyba, tūkst. Tonų prognozė paklaida ET (reali-prognoze) /realios Paklaidos kvadratas 1989 821,0 1990 761,0 1991 651,4 1992 611,4 1993 413,0 711,2 -298,2 0,722034 88923,2 1994 330,9 609,2 -278,3 0,84104 77450,9 1995 302,0 501,675 -199,7 0,661175 39870,1 1996 286,0 414,325 -128,3 16467,3 1997 291,4 332,975 -41,6 0,142673 1728,5 1998 293,6 302,575 -9,0 0,030569 80,6 1999 273,7 293,25 -19,6 0,071429 382,2 2000 263,6 286,175 -22,6 0,085641 509,6 2001 208,3 280,575 -72,3 5223,7 2002 235,2 259,8 -24,6 0,104592 605,2 2003 264,9 245,2 19,7 0,074368 388,1 2004 302,6 243 59,6 0,19696 3552,2 2005 335,7 252,75 83,0 6880,7 2006 335,3 284,6 50,7 0,151208 2570,5 2007 348,8 309,625 39,2 0,112314 1534,7 2008 330,6 Suma -841,9 4,2 Vidutinė kvadratinė paklaida (MSE) 16411,2 Prognozė 5-tiems metams. 5-ojo tyrimo nario reikšmė yra lygi 413,0 (t.y. 5 metais buvo pagaminta 413 tūkst. tonų mėsos gamonių), o prognozė skaičiuojama taip: slenk.vid.(1-4) = . Vadinasi prognozės paklaida yra 413,0-711,2 = -298,2 (tūks. tonų), o kvadratinė paklaida lygi 88923,2. MSE = 16411,2. Visos kitos prognozės, paklaidos ir jų vidurkiai yra apskaičiuojami analogiškai. Skaičiuojame MAPE: MAPE = 100/17*4,2 = 24,92213 Prognozavimo duomenys pateikiami diagrama: IŠVADOS: Matome, kad vidutinė kvadratinė paklaida, apskaičiuota slenkančio vidurkio metodu MSE1 = 7473,7, o MSE2 = 16411,2. Vidutinė kvadratinė paklaida, apskaičiuota kai n = 4, yra didesnė už MSE1. Vadinasi MSE1 mano tyrime yra tikslesnė prognozė nei MSE2. 2.2 EKSPONENTINIO IŠLYGINIMO METODAS Eksponentinis išlyginimas – tai toks prognozavimo metodas, kai prognozei naudojamas svertinis visų laiko eilutės reikšmių vidurkis. Eksponentinio išlyginimo modelis: , kur: - laiko eilutės prognozė t+1; aktuali laiko eilutės reikšmė laikotarpiui t; laiko eilutės prognozė laikotarpiui t; išlyginimo konstanta 0
Šį darbą sudaro 3897 žodžiai, tikrai rasi tai, ko ieškai!
★ Klientai rekomenduoja
Šį rašto darbą rekomenduoja mūsų klientai. Ką tai reiškia?
Mūsų svetainėje pateikiama dešimtys tūkstančių skirtingų rašto darbų, kuriuos įkėlė daugybė moksleivių ir studentų su skirtingais gabumais. Būtent šis rašto darbas yra patikrintas specialistų ir rekomenduojamas kitų klientų, kurie po atsisiuntimo įvertino šį mokslo darbą teigiamai. Todėl galite būti tikri, kad šis pasirinkimas geriausias!
Norint atsisiųsti šį darbą spausk ☞ Peržiūrėti darbą mygtuką!
Mūsų mokslo darbų bazėje yra daugybė įvairių mokslo darbų, todėl tikrai atrasi sau tinkamą!
Panašūs darbai
Atsisiuntei rašto darbą ir neradai jame reikalingos informacijos? Pakeisime jį kitu nemokamai.
Pirkdamas daugiau nei vieną darbą, nuo sekančių darbų gausi 25% nuolaidą.
Išsirink norimus rašto darbus ir gauk juos akimirksniu po sėkmingo apmokėjimo!