Referatai

Koreliacinės ir regresinės analizės darbas

9.8   (2 atsiliepimai)
Koreliacinės ir regresinės analizės darbas  1 puslapis
Koreliacinės ir regresinės analizės darbas  2 puslapis
Koreliacinės ir regresinės analizės darbas  3 puslapis
Koreliacinės ir regresinės analizės darbas  4 puslapis
Koreliacinės ir regresinės analizės darbas  5 puslapis
Koreliacinės ir regresinės analizės darbas  6 puslapis
Koreliacinės ir regresinės analizės darbas  7 puslapis
Koreliacinės ir regresinės analizės darbas  8 puslapis
Koreliacinės ir regresinės analizės darbas  9 puslapis
Koreliacinės ir regresinės analizės darbas  10 puslapis
Koreliacinės ir regresinės analizės darbas  11 puslapis
Koreliacinės ir regresinės analizės darbas  12 puslapis
www.nemoku.lt
www.nemoku.lt
Aukščiau pateiktos peržiūros nuotraukos yra sumažintos kokybės. Norėdami matyti visą darbą, spustelkite peržiūrėti darbą.
Ištrauka

Koreliacinės ir regresinės analizės darbas METODOLOGIJA Regresinė analizė- statistinis metodas priklausomybių tarp atsitiktinių ir neatsitiktinių dydžių matematinei išraiškai (regresijos lygčiai) nustatyti ir jos parametrams analizuoti. Regresinės analizės atlikimo etapai: 1. Atliekama tiriamųjų reiškinių ar procesų teorinė ir empirinė analizė ir išaiškinami juos apibūdinantys požymiai (rezultatiniai ir faktoriniai). 2. Nustatomos koreliacinio ryšio tarp rezultatinio požymio ir atrinktų veiksnių galimos kombinacijos ir jų regresijos lygties pavidalas. 3. Įvertinami (apskaičiuojami) pasirinktų regresijos lygčių parametrai. 4. Patikrinamas regresijos lygties ir jos parametrų statistinis teisingumas. 5. Atliekama regresijos lygties ir jos parametrų ekonominė analizė (interpretacija). 6. Išaiškinama galimybė, kaip šios regresijos lygties pagrindu galimas šio reiškinio prognozavimas. Pradinių duomenų teorinė analizė Šiame darbe tiriama, kokios priežastys lemia valstybinių išmokų išlaidų skaičių (tūkst.Lt) vienam žmogui įvairiose Lietuvos savivaldybėse. Šiems duomenims įtakos turi daug veiksnių: • Demografiniai veiksniai: • vidutinis metinis gyventojų skaičius; • gyventojų vidutinis amžius. • Socialiniai: • darbingo amžiaus žmonių skaičius. • Ekonominiai: • gyventojui tenkantis pinigų kiekis; • savivaldybės išlaidos; • pinigų suma, tekusi vienam darbingam gyventojui; • mokesčiai, tenkantys vienam gyventojui. Šiame darbe nagrinėsime 3 veiksnių (gyventojui tenkančio pinigų kiekio, vidutinio metinio gyventojų skaičiaus ir savivaldybių išlaidų vienam gyventojui) įtaką valstybinių išmokų išlaidų skaičiui vienam gyventojui. Šiuos tris veiksnius galima išskirti kaip esminius todėl, nes į gyventojui tenkantį pinigų kiekį įeina ir valstybės išmokų skaičius gyventojui. O žinant savivaldybių išlaidas ir vidutinį metinį gyventojų skaičių, galima rasti, kiek tų išlaidų tenka vienam žmogui. Pradiniai duomenys ir jų statistinės charakteristikos 1 lentelė. Lietuvos Respublikos valstybinių išmokų išlaidos (tūkst. Lt), tenkančios vienam gyventojui 2010m. (administracinis teritorinis suskirstymas)* Savivaldybės Valstybinės išmokos išlaidos, tenkančios vienam gyventojui (Lt) Savivaldybės išlaidos vienam gyventojui (Lt) Vidutinis metinis gyventojų skaičius Lietuvos savivaldybių gyventojui tenkantis pinigų kiekis (Lt) Alytaus m. sav. 69.46 173.37 65242 96,24 Alytaus r. sav. 96.72 311.44 30290 210,46 Druskininkų sav. 63.33 304.25 23676 101,00 Lazdijų r. sav. 88.92 258.14 23973 117,39 Varėnos r. sav. 98.94 253.91 27163 65,05 Birštono sav. 64.37 569.63 5136 320,85 Jonavos r. sav. 100.50 163.72 50759 150,46 Kaišiadorių r. sav. 79.43 180.02 34918 74,00 Kauno m. sav. 63.91 370.65 342768 102,34 Kauno r. sav. 80.57 215.69 89729 82,66 Kėdainių r. sav. 101.30 176.51 61034 51,78 Prienų r. sav. 88.43 245.43 32548 32,60 Raseinių r. sav. 99.10 299.09 40067 64,54 Klaipėdos m. sav. 59.92 131.80 180282 33,76 Klaipėdos r. sav. 77.61 186.37 51884 83,79 Kretingos r. sav. 83.42 198.18 44563 102,68 Neringos sav. 47.93 1889.03 3766 882,58 Palangos m. sav. 54.53 638.41 17439 484,21 Skuodo r. sav. 93.63 244.61 22793 65,60 Šilutės r. sav. 101.29 248.00 50998 168,75 Kalvarijos sav. 137.44 240.04 13035 37,35 Kazlų Rūdos sav. 95.82 195.22 14005 138,91 Marijampolės sav. 77.87 202.71 67378 18,75 Šakių r. sav. 114.92 213.35 35078 64,55 Vilkaviškio r. sav. 113.19 168.14 46534 82,24 Biržų r. sav. 89.58 200.87 31582 53,06 Kupiškio r. sav. 95.81 273.90 22028 77,30 Panevėžio m. sav. 63.48 312.46 110493 41,36 Panevėžio r. sav. 99.96 251.77 41869 62,22 Pasvalio r. sav. 111.67 246.28 31287 77,22 Rokiškio r. sav. 76.87 167.37 37346 95,07 Akmenės r. sav. 98.46 271.04 26234 62,03 Joniškio r. sav. 105.68 308.86 28785 61,86 Kelmės r. sav. 106.70 269.51 36191 96,58 Pakruojo r. sav. 116.58 395.34 26151 89,48 Radviliškio r. sav. 98.24 198.68 46703 67,71 Šiaulių m. sav. 68.25 215.93 123211 20,86 Šiaulių r. sav. 96.13 197.53 48128 83,73 Jurbarko r. sav. 88.71 175.97 33646 103,60 Pagėgių sav. 128.70 403.17 10937 143,60 Šilalės r. sav. 117.38 300.88 29097 81,53 Tauragės r. sav. 81.94 162.58 49049 158,66 Mažeikių r. sav. 90.06 243.18 63471 76,39 Plungės r. sav. 84.92 248.22 42421 32,43 Rietavo sav. 99.59 317.73 9710 54,04 Telšių r. sav. 95.81 264.26 53126 73,97 Anykščių r. sav. 92.37 181.54 30681 147,78 Ignalinos r. sav. 91.82 285.15 19133 112,76 Molėtų r. sav. 87.38 229.37 22237 50,15 Utenos r. sav. 75.10 248.31 46343 83,48 Visagino sav. 59.19 142.99 27724 116,63 Zarasų r. sav. 106.34 456.12 19591 66,73 Elektrėnų sav. 79.32 315.85 27273 95,32 Šalčininkų r. sav. 102.15 241.81 36661 28,71 Širvintų r. sav. 83.59 349.55 18385 50,39 Švenčionių r. sav. 69.15 254.70 29570 69,09 Trakų r. sav. 81.04 291.47 35438 68,13 Ukmergės r. sav. 83.69 224.70 43926 72,22 Vilniaus m. sav. 61.76 250.13 557126 39,65 Vilniaus r. sav. 84.03 292.77 96209 97,85 * 2010 metų visuotinio gyventojų surašymo duomenys. 2 lentelė. Pradinių duomenų pagrindiniai statistiniai rodikliai Stebėjimų skaičius 60 Vidurkis 88.7333 Mediana 89.25 Moda 95.81 Geometrinis vidurkis 86.7915 5% Trimmed mean 88.4969 5% Winsorized mean 88.4722 Dispersija 336.531 Standartinis nuokrypis 18.3448 Variacijos koeficientas 20.67% Standartinė paklaida 2.3683 5% sigma 17.4671 Paklaida 10.98 Sbi 18.4656 Minimumas 47.93 Maksimumas 137.44 Variacijos užmojis 89.51 Žemutinė kvartilija 77.74 Viršutinė kvartilija 99.775 Tarpkvartilinis užmojis 22.035 1/6 Žemutinė sekstilija 68.7 5/6 Aukštutinė sextilija 103.915 Tarpsekstilinis užmojis 35.215 Asimetrija 0.082122 Standartizuota asimetrija 0.259693 Ekscesas 0.035046 Standartizuotas ekscesas 0.055413 Matome, kad variacijos koeficientas yra 20,67%, todėl analizuosime visus duomenis, nieko nešalinsime. REGRESINĖ ANALIZĖ Atlikus daugiamatę regresiją, programa Statgraphics pateikia tokius rezultatus (3 lentelė). Matome, kad ryšys tarp rezultatinio požymio ir veiksnių yra 31,13%. Bet dar turime patikrinti, ar šioje analizėje nėra anomalių reišmių. Taikome Mahalanobio testą. Jei Distance stulpelyje yra reikšmingų anomalijų, tada tokias reikšmes (savivaldybes) šaliname iš modelio (4 lentelė). 3 lentelė. Daugiamatė regresinė analizė Multiple Regression - ismoku islaidos 1 gyv Dependent variable: ismoku islaidos 1 gyv Independent variables: islaidos gyv skaicius pinigu kiekis gyv Standard T Parameter Estimate Error Statistic P-Value CONSTANT 98.4267 3.74924 26.2524 0.0000 islaidos 0.0198217 0.0193309 1.02539 0.3096 gyv skaicius -0.0000955289 0.00002525 -3.78332 0.0004 pinigu kiekis gyv -0.000961345 0.000360222 -2.66876 0.0099 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 6182.75 3 2060.92 8.44 0.0001 Residual 13672.6 56 244.153 Total (Corr.) 19855.3 59 R-squared = 31.139 percent R-squared (adjusted for d.f.) = 27.4501 percent Standard Error of Est. = 15.6254 Mean absolute error = 11.9207 Durbin-Watson statistic = 1.75682 (P=0.1619) Lag 1 residual autocorrelation = 0.111029 4 lentelė. Anomalūs reiškiniai. Influential Points Mahalanobis Row Leverage Distance DFITS 9 0.235004 16.8344 0.0289011 17 0.842983 310.403 -1.01588 18 0.286264 22.2795 -0.397745 21 0.0356734 1.16254 0.516455 59 0.6561 109.671 2.36226 Average leverage of single data point = 0.0666667 Reikia pašalinti 9, 17, 18 ir 59 eilučių duomenis. Pašaliname Kauno m., Neringos rajono, Palangos m. ir Vilniaus m. savivaldybes ir vėl tikriname, ar nebeliko anomalių reikšmių. 5 lentelė. Anomalūs reiškiniai (2 etapas) Influential Points Mahalanobis Row Leverage Distance DFITS 6 0.560491 67.8826 -2.65825 13 0.40871 36.3439 0.216764 18 0.0685084 2.98972 0.685389 37 0.0912309 4.43922 0.727618 48 0.0917187 4.47113 -0.730253 Average leverage of single data point = 0.0714286 Reikia pašalinti 6 ir 13 eilučių duomenis, kaip reikšmingas anomalijas. Pašaliname Birštono rajono ir Klaipėdos m. savivaldybes ir vėl tikriname, ar nebeliko anomalių reikšmių. 6 lentelė. Anomalūs reiškiniai (3 etapas) Influential Points Mahalanobis Row Leverage Distance DFITS 2 0.255895 16.9015 -0.0360483 3 0.040765 1.22874 -0.547503 16 0.0906243 4.20095 0.943991 23 0.258293 17.1274 -0.658594 32 0.279649 19.2059 -0.0523794 35 0.183353 10.6938 0.778752 46 0.0942861 4.43214 -0.740982 Average leverage of single data point = 0.0740741 Reikia pašalinti 2, 23, 32 ir 35 eilučių duomenis. Pašaliname Alytaus rajono, Panevėžio m., Šiaulių m. ir Pagėgių savivaldybes ir vėl tikrinam, ar nebeliko anomalių reikšmių. 7 lentelė. Anomalūs reiškiniai (4 etapas) Influential Points Mahalanobis Row Leverage Distance DFITS 2 0.0602196 2.09617 -0.622042 15 0.107725 4.81548 1.09061 42 0.112752 5.12026 -0.778201 43 0.264177 16.2535 0.0670372 50 0.333961 23.0882 -0.044968 Average leverage of single data point = 0.08 Reikia pašalinti 43 ir 50 duomenis. Pašaliname Zarasų rajono ir Vilniaus rajono savivaldybes ir dar kartą tikrinam, ar nebeliko anomalių reiškinių. 8 lentelė. Anomalūs reiškiniai (5 etapas) Influential Points Mahalanobis Row Leverage Distance DFITS 2 0.0731788 2.65329 -0.676634 7 0.284693 17.3294 -0.139635 14 0.21989 11.9873 0.600033 15 0.129602 5.87064 1.20628 28 0.232294 12.94 0.706523 42 0.139138 6.45612 -0.875383 Average leverage of single data point = 0.0833333 Reikia pašalinti 7, 14 ir 28 eilučių duomenis. Pašaliname Kauno rajono, Šilutės rajono ir Pakruojo rajono savivaldybes ir vėl tikrinam, ar nebeliko reikšmingų anomalių reikšmių. 9 lentelė. Anomalūs reiškiniai (6 etapas) Influential Points Mahalanobis Row Leverage Distance DFITS 2 0.100265 3.81458 -0.699426 5 0.163782 7.44469 0.639361 13 0.173121 8.02551 1.33695 39 0.159909 7.20764 -1.05712 Average leverage of single data point = 0.0888889 Taigi anomalių reiškinių (kurių atstumas būtų reikšmingas) nebeliko, vėl kartojame daugiamatę regresinę analizę. Šįkart Statgraphics pateikia tokius rezultatus (10 lentelė): 10 lentelė. Daugiamatė regresinė analizė. Multiple Regression - Col_1 Dependent variable: Ismoku islaidos 1gyv Independent variables: Islaidos Gyv skaicius Pinigu kiekis gyv Standard T Parameter Estimate Error Statistic P-Value CONSTANT 110.187 20.5878 5.35205 0.0000 Islaidos -0.00783018 0.0547433 -0.543034 0.8870 Gyv skaicius -0.000225664 0.000186407 -1.2106 0.2330 Pinigu kiekis gyv -0.00107856 0.000767507 -1.40528 0.1675 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 850.111 3 283.37 13,05 0.0885 Residual 8961.75 41 218.579 Total (Corr.) 9811.86 44 R-squared = 28.66411 percent R-squared (adjusted for d.f.) = 21.981 percent Standard Error of Est. = 14.7844 Mean absolute error = 11.2318 Durbin-Watson statistic = 1.57334 (P=0.0729) Lag 1 residual autocorrelation = 0.199215 Determinacijos koeficientas dabar jau lygus 28,66%, o tai reiškia, kad Lietuvos Valstybinių išmokų išlaidų skaičių vienam gyventojui paaiškina vienam gyventojui tenkantis pinigų kiekis, vidutinis metinis gyventojų skaičius bei savivaldybių išlaidos. Pastarųjų triejų veiksnių variacijos pokyčiai lemia 28,66% valstybinių išmokų išlaidų vienam žmogui variacijos. PORINIAI KORELIACIJOS KOEFICIENTAI, KORELIACIJOS REIKŠMINGUMO TIKRINIMAS Koreliacijos koeficientai Funkcija Relate randame porinės koreliacijos koeficientą tarp rezultatinio požymio ir atskirų veiksnių. 11 lentelėje parodytas koreliacijos koeficientas tarp valstybinių išmokų išlaidų vienam gyventojui ir savivaldybės išlaidų vienam gyventojui. 12 lentelėje- atitinkamai tarp pirmo rezultatinio požymio ir metinio gyventojų skaičiaus. 13 lentelėje- tarp pirmo rezultatinio požymio ir gyventojui tenkančio pinigų kiekio. 11 lentelė. Koreliacijos koeficientas tarp y ir x1 Simple Regression - Col_1 vs. Col_2 Dependent variable: ismoku islaidos 1 gyv Independent variable: islaidos Linear model: Y = a + b*X Coefficients Least Squares Standard T Parameter Estimate Error Statistic P-Value Intercept 80.9886 10.6416 7.61054 0.0000 Slope 0.0455313 0.0443159 1.02742 0.3100 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 235.098 1 235.098 1.06 0.0001 Residual 9576.77 43 222.715 Total (Corr.) 9811.86 44 Correlation Coefficient = 0.154792 R-squared = 2.39606 percent R-squared (adjusted for d.f.) = 0.126205 percent Standard Error of Est. = 14.9237 Pastebime, kad koreliacijos koeficientas r (y, x1) lygus 0,15, kas reiškia, jog ryšys tarp valstybinių išmokų išlaidų vienam gyventojui ir savivaldybės išlaidų vienam gyventojui yra labai silpnas. 12 lentelė. Koreliacijos koeficientas tarp y ir x2 Simple Regression - Col_1 vs. Col_3 Dependent variable: ismoku islaidos 1 gyv Independent variable: gyv skaicius Linear model: Y = a + b*X Coefficients Least Squares Standard T Parameter Estimate Error Statistic P-Value Intercept 99.1614 6.1818 16.0409 0.0000 Slope -0.000207459 0.000160112 -1.29572 0.2020 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 368.697 1 368.697 1.68 0.2020 Residual 9443.17 43 219.609 Total (Corr.) 9811.86 44 Correlation Coefficient = -0.193847 R-squared = 3.75766 percent R-squared (adjusted for d.f.) = 1.51947 percent Standard Error of Est. = 14.8192 Pastebime, kad koreliacijos koeficientas r (y, x2) lygus -0,19, kas reiškia, jog ryšys tarp valstybinių išmokų išlaidų vienam gyventojui ir metinio gyventojų skaičiaus yra silpnas. 13 lentelė. Koreliacijos koeficientas tarp y ir x3 Simple Regression - Col_1 vs. Col_4 Dependent variable: ismoku islaidos 1 gyv Independent variable: pinigu kiekis gyv Linear model: Y = a + b*X Coefficients Least Squares Standard T Parameter Estimate Error Statistic P-Value Intercept 99.7146 5.9396 16.7881 0.0000 Slope -0.00101584 0.000697676 -1.45604 0.1526 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 461.027 1 461.027 2.12 0.1526 Residual 9350.84 43 217.461 Total (Corr.) 9811.86 44 Correlation Coefficient = -0.216764 R-squared = 4.69867 percent R-squared (adjusted for d.f.) = 2.48236 percent Standard Error of Est. = 14.7466 Pastebime, jog koreliacijos koeficientas r (y, x3) lygus -0,22, kas reiškia, kad ryšys tarp valstybinių išmokų išlaidų vienam gyventojui ir gyventojui tenkančio pinigų kiekio yra silpnas. Išvada: stipriausias ryšys yra tarp valstybinių išmokų išlaidų, tenkančių vienam gyventojui 2010m. ir savivaldybės išlaidų vienam gyventojui 2010m, kadangi šio ryšio koreliacijos koeficientas yra didžiausias. 14 lentelė. Statistinių parametrų reikšmingumas Multiple Regression Analysis Dependent variable: Ismoku islaidos 1gyv Standard T Parameter Estimate Error Statistic P-Value CONSTANT 110.187 20.5878 5.35205 0.0000 Islaidos -0.00783018 0.0547433 -0.543034 0.8870 Gyv skaicius -0.000225664 0.000186407 -1.2106 0.2330 Pinigu kiekis gyv -0.00107856 0.000767507 -1.40528 0.1675 F statistika yra lygi 13,05, taigi pasirinktų veiksnių variacija lemia valstybines išmokų išlaidas vienam gyventojui ir ši priklausomybė yra tikrai ryški. Tai dar kartą patvirtina p reikšmė, kuri yra mažesnė už 0,1 (0,0885

Daugiau informacijos...

Šį darbą sudaro 2155 žodžiai, tikrai rasi tai, ko ieškai!

★ Klientai rekomenduoja


Šį rašto darbą rekomenduoja mūsų klientai. Ką tai reiškia?

Mūsų svetainėje pateikiama dešimtys tūkstančių skirtingų rašto darbų, kuriuos įkėlė daugybė moksleivių ir studentų su skirtingais gabumais. Būtent šis rašto darbas yra patikrintas specialistų ir rekomenduojamas kitų klientų, kurie po atsisiuntimo įvertino šį mokslo darbą teigiamai. Todėl galite būti tikri, kad šis pasirinkimas geriausias!

Detali informacija
Darbo tipas
Lygis
Universitetinis
Failo tipas
Word failas (.doc)
Apimtis
12 psl., (2155 ž.)
Darbo duomenys
  • Statistikos referatas
  • 12 psl., (2155 ž.)
  • Word failas 234 KB
  • Lygis: Universitetinis
www.nemoku.lt Atsisiųsti šį referatą
Privalumai
Pakeitimo garantija Darbo pakeitimo garantija

Atsisiuntei rašto darbą ir neradai jame reikalingos informacijos? Pakeisime jį kitu nemokamai.

Sutaupyk 25% pirkdamas daugiau Gauk 25% nuolaidą

Pirkdamas daugiau nei vieną darbą, nuo sekančių darbų gausi 25% nuolaidą.

Greitas aptarnavimas Greitas aptarnavimas

Išsirink norimus rašto darbus ir gauk juos akimirksniu po sėkmingo apmokėjimo!

Atsiliepimai
www.nemoku.lt
Dainius Studentas
Naudojuosi nuo pirmo kurso ir visad randu tai, ko reikia. O ypač smagu, kad įdėjęs darbą gaunu bet kurį nemokamai. Geras puslapis.
www.nemoku.lt
Aurimas Studentas
Puiki svetainė, refleksija pilnai pateisino visus lūkesčius.
www.nemoku.lt
Greta Moksleivė
Pirkau rašto darbą, viskas gerai.
www.nemoku.lt
Skaistė Studentė
Užmačiau šią svetainę kursiokės kompiuteryje. :D Ką galiu pasakyti, iš kitur ir nebesisiunčiu, kai čia yra viskas ko reikia.
Palaukite! Šį darbą galite atsisiųsti visiškai NEMOKAMAI! Įkelkite bet kokį savo turimą mokslo darbą ir už kiekvieną įkeltą darbą būsite apdovanoti - gausite dovanų kodus, skirtus nemokamai parsisiųsti jums reikalingus rašto darbus.
Vilkti dokumentus čia:

.doc, .docx, .pdf, .ppt, .pptx, .odt