Statistika, jos reikšmė, medicininės statistikos rūšys. Tikimybių teorija – tai matematikos mokslo šaka , tirianti masinių atsitiktinių reiškinių dėsningumus. Kitaip galima pasakyti – tikimybių teorija matematiniais metodais tiria atsitiktinius reiškinius. Statistika – tai mokslas tiriantis statistinių duomenų rinkimo, sisteminimo, analizės metodus ir jų praktinį panaudojimą. Statistikos uždavinys yra informacijos (žinių) rinkimas, analizė ir loginis įvertinimas. Statistika yra glaudžiai susijusi su tikimybių teorija, nes statistika naudoja tikimybių teorijos sąvokas ir metodus. Statistikos teorija moko suderinti empirinį ir teorinį statistinių dydžių nagrinėjimą, matyti tikimybinių sąvokų (tikimybės, atsitiktinio dydžio, tikimybių funkcijų) ryšį su tikrove, empiriniais jų analogais, įžvelgti masinių reiškinių dėsningumus, kurie tikimybių teorijoje nusakomi labai abstrakčiai. Tikimybių teorija yra fundamentalus mokslas, o statistika – taikomasis mokslas, kuriuo nagrinėjami įvairūs reiškiniai remiantis tikimybių teorija. Be tikimybių teorijos visi statistiniai skaičiavimai yra neišsamūs, dažnai tik iš dalies pagrįsti. Reikšmė: be statistikos metodologijos negalima statistinių duomenų pasaulio susieti su tikimybiniais modeliais, fundamentaliuoju mokslu – tikimybių teorija. Visa statistika pagal savo tyrimo objektą skirstoma į: • pramonės • ekonomikos • žemės ūkio • medicinos • kt. Medicinos statistika skirstoma į tokias rūšis: 1. Gyventojų sveikatos būklės statistika. Gyventojų sveikatos būklę apibūdina demografiniai rodikliai (gimstamumas, mirtingumas, natūralus gyventojų prieaugis), gyventojų fizinis subrendimas ir sergamumas. Medicinos statistika nagrinėja ne tik šiuos rodiklius, bet ir tuos veiksnius, kurie veikia gyventojų sveikatą (socialinės, ekonominės, darbo ir buities sąlygos, fizinė aplinka ir t.t.). 2. Sveikatos apsaugos statistika – tai medicinos darbuotojų ir įstaigų bei įvairių priemonių, gerinančių gyventojų sveikatą, statistinė analizė. 3. Statistinio metodo taikymas klinikinėje ir teorinėje medicinoje (įvairių sanitarinių ir higienos normų nustatymas, naujų profilaktikos ir gydymo metodų efektyvumo įvertinimas...) Statistika medicinoje yra labai svarbi ir jos reikšmė nuolatos auga: • kiekvienas gydytojas turi išmanyti teorinius statistikos pagrindus ir mokėti juos pritaikyti savo mokslinėje bei praktinėje veikloje • tobulėjant medicinos technikoms, atsirandant vis naujiems gydymo ir diagnostikos metodams reikia mokėti atsirinkti, kas geriau, naudingiau • plečiasi masiniai gyventojų tyrimai dėl pirminės lėtinių neinfekcinių ligų profilaktikos ir t.t. Pagrindinės sąvokos: 1. Aibė (tyrimo objektas statistikoje) – elementų visuma, susidedanti iš kokybiškai vienodų stebėjimo vienetų, pasižyminčių įvairiais požymiais. 2. Generalinė aibė – artėjanti prie begalybės visuma (visi gyventojai) 3. Kohorta – aibė (žmonių grupė) sudaryta iš palyginti vienodų stebėjimo elementų (žmonių), kuriuos jungia kokie nors bendri požymiai ir įvykiai laiko atžvilgiu (pvz.: atmosferos teršalų įtaka gyventojų sveikatai) 4. Imtis – aibės dalis, kuri reprezentuoja generalinę visumą 5. Tyrimo vienetas – tai kiekvienas atvejis, kuris atliekant tyrimą, turi būti registruojamas, aprašomas, kad vėliau gautus duomenis būtų galima apibendrinti. (Trumpiau, tyrimo vienetas – tai objektas, apie kurį renkami duomenys arba imties stebėjimo vienetas) 6. Įskaitinis statistinis apskaitos požymis – konkreti savybė, kokybė, skiriamasis tyrimo vieneto bruožas. Tai žinios, kurios renkamos apie kiekvieną stebėjimo vienetą Statistinio tyrimo planavimas. Norint išnagrinėti reiškinį reikia tinkamai pasirinkti patį tyrimo objektą (sveikatos apsaugos tyrimo objektas gali būti ligoninės, gyventojų grupės ir pan.). Tyrimo objektas statistikoje suprantamas kaip elementų visuma. Ji vadinama aibe, o jį sudarantys elementai – tyrimo vienetais. Sudarant tyrimo planą reikia žinoti tyrimo objektą ir numatyti: 1. tyrimo vietą (teritoriją) 2. tyrimo laiką 3. tyrimo objekto formavimo (statistinio tyrimo) metodus 4. kadrus, kurie atliks tyrimą 5. organizacinį metodinį vadovavimą 6. darbo finansavimą Tyrimo objektas turi būti aiškiai apibrėžtas vietos, laiko ir apimties atžvilgiu. Tyrimo vietos pasirinkimas priklauso nuo darbo tikslo, teritorinio pasiskirstymo, geografinių rajonų ir kt. Pavyzdžiui nagrinėjant gimstamumo problemą respublikoje, šalia kitų požymių, paprastai tiriamas gimstamumas mieste ir kaime. Gyventojai į miestiečius ir kaimiečius skirtimi pagal jų gyvenamąją vietą. Tiriantys asmenys šiuo atveju turi gerai išmanyti administracinį ir teritorinį respublikos gyventojų pasiskirstymą. Planuojant tyrimą reikia tiksliai nustatyti tyrimo vietą (teritoriją). Pavyzdžiui tiriant gyventojų sergamumą ūminėmis infekcinėmis ligomis, reikia nustatyti, kokioje teritorijoje šis tyrimas bus atliekamas (visoje respublikoje, mieste, rajone, atskiroje teritorinėje apylinkėje ir kt.) ir gerai žinoti šios teritorijos ribas. Tyrimo laiko nustatymas- tai klausimas, nuo kurio dažniausiai priklauso gautų rezultatų pilnumas ir patikimumas. Laiko nustatymas susijęs su tiriamų reiškinių sezoniškumu, paros ciklu ir kt. Pavyzdžiui, priimta antropometrinius tyrimus atlikti ryta, nes kūno masė, dienai baigiantis, padidėja, o ūgis sumažėja. Tyrimo laikas, jeigu jis gali turėti įtakos tyrimo rezultatams, turi būti tiksliai nustatytas. Pavyzdžiui, norint ištirti sergamumą, reikia nustatyti ne tik tyrimo vietą bet ir laikotarpį, kuriuo bus renkami duomenys. Tyrimo laiko pasirinkimas taip pat priklauso nuo darbo tikslo. Statistinio tyrimo etapai. 1. Hipotezės iškėlimas 2. Tyrimo programos ir plano sudarymas Programoje numatomos darbo kryptys (tiriant tą patį objektą tikslas gali būti skirtingas, todėl reikia tiksliai suformuluoti temos pavadinimą, darbo tikslą, svarbiausius uždavinius; Statistinio tyrimo programa susideda iš: • medžiagos rinkimo planas (reikia nuspręsti, kaip bus renkami duomenys: iš operatyvinių dokumentų (t.y. dokumentų vartojamų medicinos praktikoje) ar iš specialiai sudarytų anketų) • medžiagos įvertinimo planas (tai tiriamų požymių grupavimas ir lentelių maketų sudarymas; medžiagos grupavimo tikslas – sudaryti kokybiškai vienodas grupes, kad būtų galima tirti reiškinio dėsningumus) • analizės planas Plane taip pat numatomas tyrimo organizavimas (kur, kas, kada ir ką atliks) 3. Medžiagos rinkimas. Šio etapo metu atskiri tyrimo vienetai registruojami specialiame statistiniame dokumente; pagal medžiagos rinkimą tyrimai skirstomi į retrospektyvinius prospektyvinius) 4. Medžiagos įvertinimas. Medžiaga patikrinama, sugrupuojama šifruojama (jei reikia) ir suskaičiuojama, apskaičiuojami statistiniai kriterijai, grafiškai pavaizduojami duomenys. 5. Rezultatų įvertinimas, išvados ir pasiūlymai. Statistinio tyrimo metodai. Pagal trukmę: 1. nuolatinis (ištisinis, longitudinal) tyrimas. Vykdomas nuolatos be pertraukos, pvz. metrikacijos skyriuje registruojami gimimai, mirtys, santuokos. Šis metodas tinka greitai kintantiems reiškiniams tirti ir jų dinamikai stebėti. 2. vienkartinis (skersinis, cross sectional) tyrimas. Atliekamas aiškiai ribotu laikotarpiu, pvz. tiksliai nustatytu laikotarpiu trunkančiu valandą ar dieną surašomi gyventojai, gydytojai. Jeigu laikotarpis trunka ilgiau, jis vadinamas kritiškuoju intervalu, pvz. tiriant vaikų fizinį brendimą, tyrimo laikotarpis gali trukti 1-2mėn. Vienkartinio tyrimo rezultatai atspindi reiškinio statiką, t.y. kokia situacija yra tiriamuoju momentu. Tinka lėtai kintantiems reiškiniams tirti. Pagal duomenų rinkimą laiko atžvilgiu: 1. retrospektyviniai (t.y. susiję su praeitimi, nagrinėjantys praeitį) 2. prospektyviniai (t.y. stebėsime į priekį, kas įvyks po\per 10-20metų) Pagal medžiagos rinkimo būdą: 1. tiesioginis metodas. Tiesiogiai gali būti tiriamas ligonis, koks noras sanitarinis ar higieninis objektas ir t.t. 2. kopijavimo metodas. Tai informacijos rinkimas iš įvairių medicininių dokumentų (ligos istorijų, žurnalų), kuriuos pildo gydytojai praktikai. Šis metodas yra plačiai taikoma socialiniuose – higieniniuose tyrimuose 3. anamnezės metodas. Duomenys renkami apklausa ir anketomis. Šiuo metodu atliekami socialinio higieninio bei psichologinio pobūdžio tyrimai (jei reikia gauti duomenų intymiais gyvenimo klausimais geriausia naudoti anonimines anketas) Pagal duomenų analizės pobūdį: 1. deskriptyviniai (aprašomieji) – aprašomos konkrečios situacijos; a) indvidualūs – atvejo pranešimas, pagrindinis trūkumas – neatspindi populiacijos b) populiaciniai (koreliaciniai arba ekologiniai) – pvz. norime įvertinti ar mėsos valgymas turi įtakos storosios žarnos vėžiui. Paprastai tada lygina kiek mėsos suvalgoma ir kiek žmonių serga vėžiu vienoje valstybėje ir kokioje kitoje valstybėje. Šio tyrimo trūkumai: neturime informacijos apie konkretų asmenį, negalime įvertinti kitų faktorių (o gal toje šalyje, kur daugiau valgo mėsos valgo ir dar ką nors, kas gali turėti įtakos storosios žarnos vėžiui? O tai nėra įvertinama); 2. analitiniai – ieškoma asociacijų, koreliacijų. a) stebimieji – tyrėjas stebi ir nesikiša į procesą • atvejis – kontrolė (norima nustatyti kokio nors faktoriaus įtaką ligos atsiradimui, tyrėjas pasirenka grupes: ligonių (“atvejai“) ir sveikų žmonių (“kontrolė“) ir tiria kiek tam tikro faktoriaus paveiktų žmonių buvo “atvejų“ ir “kontrolės“ grupėse • kohortiniai (parenkama tam tikras faktorius ir žiūrima kiek žmonių paveiktų to faktoriaus susirgo/susirgs ir kiek nesusirgo/nesusirgs) b) eksperimentiniai (intervenciniai) – tyrėjas įsikiša Pagal apimtį: 1. ištisinis tyrimas. Tiriami visi tiriamojo reiškinio (aibės) tyrimo atvejai (tyrimo vienetai). Šis tyrimas taikomas tada kai reikia būtinai sužinoti absoliutų reiškinio dydį pvz. gyventojų skaičių, lovų skaičių ligoninėse ir pan. Organizuoti ištisinį tyrimą yra sudėtinga, duomenų apdorojimui sugaištama daug laiko. Be to, statistikoje kartais naudingiau žinoti ne absoliutų reiškinio dydį, o santykį, struktūrą. Kai kurių reiškinių net neįmanoma ištirti ištisiniu būdu (pvz. mitybos ypatumų) 2. atrankinis tyrimo metodas. Tiriami ne visi reiškinio atvejai, bet ta tikra jų dalis, reprezentuojanti reiškinį. Rinktiniai tyrimai atliekami remiantis Bernulio didžiųjų skaičių dėsniu. Didžiųjų skaičių dėsnis gali būti apibūdintas šitaip: kokybiškai vienarūšių visumų, susidedančių iš masinių reiškinių, dėsningumas pasireiškia (ir gali būti tiriamas), kai yra pakankamai daug objektų (tiriamų reiškinių). Esmė: didinant tyrimų skaičių, didėja rezultatų tikslumas, t.y. imties tyrimo rezultatai pakankamai priartėja prie generalinės aibės tyrimo rezultatų. Remdamasi šiuo dėsniu statistika daro atrankinius stebėjimus, kurie apima ne visus tiriamosios visumos vienetus, o tik jų dalį. Metodologiniu požiūriu didžiųjų skaičių dėsnis reiškia būtinumo ir atsitiktinumo ryšį, įrodo įverčių pagrįstumą ir kartu empirinius faktus pagrindžia teoriškai. Norint atlikti rinktinį tyrimą reikia nustatyti: a) tyrimo vienetų atrankos iš generalinės aibės būdą b) imties tūrį (t.y. pakankamą tyrimo atvejų skaičių) Atrankos būdai: Netikimybinės imtys – atsitiktinumas subjektyvus, neįmanoma išmatuoti jo įtakos imties sudarymui: 1. Ekspertinė – subjektyvi, elementai įtraukiami pagal ekspertų nuomonę, nereprezentatyvi. 2. Kvotinė – atsižvelgus į populiacijos sandarą, numatomos kvotos, pvz. tiriant Lietuvos gyventojų nuomonę tautybių proporcijos. Jei elementai parenkami atsitiktinai – atsitiktinė sluoksninė imtis. 3. Proginė – įtraukiami pirmi pasitaikę populiacijos elementai. Daug lemia atsitiktinumas, sunku vertinti, nereprezentatyvi, bet dažna. Pvz. apklausus vienos grupės studentus, daromos išvados apie visus Lietuvos studentus. Tikimybinės imtys – atsitiktinumas griežtai apibrėžtas, kiekvieno elemento galimybę priklausyti imčiai nusako tam tikra tikimybė: 1. paprastoji atsitiktinė– kiekvienas generalinės visumos elementas turi vienodą galimybę tapti stebėjimo vienetu – ji geriausiai atspindi generalinę visumą. 2. sistemingoji – išrikiavus elementus į eilę, atsitiktinai parinkus vieną, pasirenkamas žingsnis ir juo atrenkami visi elementai. 3. sluoksninė – visa populiacija suskirstoma į sluoksnius ir juose taikomas papsrastoji atsitiktinė grąžintinė atranka. Populiacija turi būti heterogeniška sluoksnių atžvilgiu ir homogeniška sluoksnių viduje. Pvz. visus gyventojus suskirstome į amžines grupes ir kiekvienoje jų parenkamas tam tikras skaičius tiriamųjų. 4. Lizdinė - iš generalinės visumos atrenkami grupės (“lizdai“), pvz. tyrimui atsitiktinai pasirenkame dalis poliklinikų ir jose atsirenkame tam tikrą skaičių asmens sveikatos istorijų, kurias analizuojame. Populiacija lizdų atžvilgiu turi būti homogeniška, o lizdų viduje heterogeniška. Daugiapakopės imtys – derinami keli būdai. Atrankinio stebėjimo apimtis: Pakankamo tyrimų skaičiaus nustatymas. Planuojant tyrimus, labai svarbu nustatyti pakankamą tyrimų skaičių, kad galima būtų padaryti statistiškai patikimas išvadas. 1. Pakankamas tyrimų skaičius, kai rezultatas išreiškiamas vidutine požymio reikšme Šis tyrimų skaičius nustatomas pagal formulę: =tp SD n Čia: - nagrinėjamo vidurkio pasikliautinio intervalo dydis. Iš šios formulės skaičiuojama n reikšmė: n= t2p SD2 2 Čia: n- stebėjimų skaičius tp - pasikliovimo koeficientas, lygus 1,96 (jeigu tenkina 95 tikimybė) - maksimali vidurkio paskliautinojo intervalo paklaida, numatyta tyrinėtojo SD- vidutinis kvadratinis nuokrypis Vidutinį kvadratinį nuokrypį SD galima nustatyti: 1) remiantis literatūros duomenimis, jeigu anksčiau buvo atlikti panašūs tyrimai 2) atlikus bandomąjį tyrimą, jeigu literatūroje tam tikrų duomenų nėra Pavyzdys: Reikia su 0,95 tikimybe(t = 1,96 ~ 2) ir maksimalia paklaida (2 kartai per minutę) nustatyti naujagimių pulso dažnumą. Bandomojo tyrimo metu nustatyta, kad SD = 10. Tad: n= 22102 =100 22 t.y. statistiškai patikimą rezultatą gausime patikrinę 100 naujagimių pulso dažnumą. 2. Pakankamas tyrimų skaičius, kai rezultatas išreiškiamas proporcija (, promilėmis ir kt.). Pakankamas tyrimų skaičius nustatomas pagal formulę: n= t2p p(1-p) 2 Čia: n –tyrimų skaičius tp - paskliovimo koeficientas, lygus 2 (jeigu tenkina 0,95 tikimybė) - maksimali paklaida, numatyta tyrinėtojo p - proporcija Santykinį dydį galima pasirinkti remiantis literatūros duomenimis. Jeigu jis nežinomas, tai rekomenduotina prilyginti 0,5 (p= 50 ) Pavyzdys: Reikia su 0,95 tikimybe (tp = 1,96) nustatyti reumato paplitimą tarp studentų. Iš ankstesnių tyrimų žinoma, kad reumatu serga apie 3 proc. gyventojų (p=3), maksimali paklaida – 1 proc. Pakankamas tyrimo atvejų skaičius bus: n= 1,962 *0,03*0,97 =1118 0,012 t.y. reikės reumato atžvilgiu patikrinti 1118 studentus. Jeigu reumato paplitimas būtų nežinomas, tai reikėtų patikrinti 9604 studentus: n= 1,962*0,5*0,5 =9604 0,012 Padidinus maksimalios paklaidos ribas iki 2 proc., tyrimams pakaktų 2401 studento: n= 1,962*0,5*0,5 =2401 0,022 Duomenų tipai 1. Kiekybiniai (skaitmeniniai): ◦ Tolydieji (ūgis, svoris...) ◦ Diskretūs (sveikieji skaičiai – vaikų skaičius šeimoje, kambarių skaičius bute ir kt.) 2. Kokybiniai (kategoriniai): ◦ Binariniai (dichotominiai) – požymis yra / požymio nėra ◦ Multichotominiai – pvz.: atsakymo variantai: „taip“, „ne“, „nežinau“ ◦ Ordinalūs (eilės) – pvz.: ligos eiga: lengva, vidutinė, sunki Medžiagos įvertinimas. Medžiagos įvertinimas – tai tiriamų požymių grupavimas (jei tai nebuvo padaryta sudarant medžiagos rinkimo programą) ir lentelių maketų sudarymas. Požymių grupavimo tikslas – sudaryti kokybiškai vienodas grupes, kad būtų galima tirti reiškinio dėsningumus. Nuo grupavimo priklauso tyrimo rezultatai. Norint tinkamai sugrupuoti medžiagą, reikia gerai išmanyti ne tik statistikos teoriją bei grupavimo principus, bet ir tiriamą medicinos sritį. Medicinos darbuotojai neretai padaro metodinių grupavimo klaidų, pavyzdžiui, tirdami sergamumą ir jo ryšį su darbo sąlygomis, formaliai grupuoja darbuotojus pagal oficialų profesijos pavadinimą. Taip sugrupavus darbuotojus, dažniausiai neatsiskleidžia darbo sąlygų įtaka sergamumui tam tikromis ligomis, nes tos pačios profesijos žmonės gali dirbti skirtingomis darbo sąlygomis. Grupavimas nėra siauras techniškas bei specialus klausimas, kaip atrodo iš pirmo žvilgsnio. Grupavimo rūšys priklauso nuo apskaitos požymių pobūdžio. Yra skiriamas tipologinis ir variacinis grupavimas. 1. Tipologinis grupavimas atliekamas pagal kokybinius požymius: lytį, gyvenamąją vietą, visuomenines grupes ir kt. Grupuojant pagal kokybinius požymius, dažnai tenka vadovautis racionaliomis moksliškai pagrįstomis klasifikacijomis ir nomenklatūromis, pavyzdžiui, Tarptautine ligų traumų bei mirties priežasčių nomenklatūra ir klasifikacija (tiriant sergamumą, mirties priežastis), profesijų, visuomeninių grupių klasifikacija ir kt. 2. Variacinis grupavimas atliekamas pagal kiekybinius požymius: amžių, ūgį, kūno masę ir kt. Grupuojant pagal kiekybinius požymius dažnai būna neaišku, kokiais intervalais tam tikrą požymį reikia sugrupuoti. Pavyzdžiui grupuojant mokinius pagal jų kūno masę intervalas turėtų būti ne didesnis kaip 200-250g. Suaugusiųjų gyventojų amžių galima skirtyti penkmečiais arba dešimtmečiais (20-24m., 30-34m. ir t.t. arba 20-29m., 30-39m., 40-49m. ir t.t.) o kūdikių amžių priimta skirstyti mėnesiais. Intervalo dydis priklauso nuo požymio, darbo tikslo ir medžiagos, kurią planuojama surinkti gausumo. Kiekybinio požymio skaitinės reikšmės atskiruose intervaluose neturi kartotis. Sugrupavus tiriamus požymius, sudaromi lentelių maketai, kurie užpildomi trečiame statistinio tyrimo etape. Lentelių maketų pobūdis priklauso nuo tiriamų požymių, jų kiekio bei atskirų požymių ryšių, dominančių tyrinėtoją. Kiekvienoje lentelėje, kaip ir sakinyje, turi būti veiksnys ir tarinys, t.y. statistinis veiksnys ir statistinis tarinys. Statistiniu veiksniu vadinamas esminis požymis, kuris paprastai rašomas lentelės kairėje pusėje. Statistiniu tariniu vadinami papildomi požymiai, apibūdinantys esminį požymį ir rašomi lentelės dešinėje pusėje. Lentelės gali būti 3rūšių: • Paprastosios (medžiaga grupuojama pagal vieną požymį. Pavyzdžiui, ligoniai, sergantys hipertonine liga, skirstomi pagal ligos stadijas) • Grupinės (medžiaga grupuojama pagal du tarpusavyje susijusius požymius, iš kurių vienas (hipertoninės ligos stadija) priklauso statistiniam veiksniui, o kitas (ligonio lytis) – tariniui). Grupinėje lentelėje gali būti ir daugiau statistinio tarinio požymių (lytis, amžius, laikinas nedarbingumas ir kt., bet jie turi koreliuoti tik poromis(ligos stadija ir amžius, ligos stadija ir laikinas nedarbingumas). • Kombinuotos (medžiaga grupuojama pagal 3 ir daugiau tarpusavyje susijusius požymius) Sudarant lentelės maketą ir jį pildant, reikia laikytis svarbiausių reikalavimų: • lentelės pavadinimas turi būti trumpas, atspindintis jos turinį • kiekviena lentelės grafa turi būti su pavadinimu • lentelės makete horizontaliosios bei vertikaliosios grafos turi būti susumuotos (iš viso) • nerekomenduojama vienoje lentelėje derinti daug požymių(5-6 ir daugiau) • užpildant lentelę negalima palikti tuščių langelių, jeigu nėra skaitinių duomenų, tai tame langelyje rašomas brūkšnelis(-). Gerai sudaryti lentelių maketai rodo esmines tyrimo kryptis, t.y. analizės programą. Lentelės, atsižvelgiant į jų rūšis, gali teikti įvairią informaciją, nuo kurios priklauso, kaip bus nustatyti tiriamo reiškinio dėsningumai. Grafinis statistinių duomenų vaizdavimas. Grafinis duomenų vaizdavimas priklauso nuo duomenų tipo. Skaitmeninių (kiekybinių) duomenų vaizdavimas: • Histograma (parodo vieno rodiklio reikšmių pasiskirstymą) Pavyzdys: moterų sergančių krūties vėžių amžiaus pasiskirstymas • Taškiniai grafikai (naudojami dviejų kiekybinių rodiklių tarpusavio ryšiams vaizduoti) Pavyzdys: naviko dydžio ryšys su moters amžiumi • Linijiniai grafikai (dažniausiai vaizduoja kiekybinio rodiklio priklausomybę nuo laiko) Pavyzdys: gimdymų skaičius Lietuvoje 1990-2001 metais • Dėžutės su ūsais grafikas Pavyzdys: moterų, sergančių krūties vėžiu, amžiaus pasiskirstymas. Vidurinė linija rodo medianą, ūsai – minimalią ir maksimalią vertes. Dėžutė apriboja dvi kvartiles. Kuo išsibarstymas didesnis, tuo dėžutė platesnė. Kategorinių duomenų vaizdavimas: • Skritulinė diagrama (naudojama kokybinių duomenų pasiskirstymo atvaizdavimui) Pavyzdys: krūties vėžio histologinių stadijų pasiskirstymas • Poligonai (apibūdina vieno rodiklio pasiskirstymą į grupes) Pavyzdys: krūties vėžio histologinių stadijų pasiskirstymas • Stulpelinė diagrama (priklausomai nuo tikslo gali būti naudojama kokybinių duomenų pasiskirstymo atvaizdavimui arba kiekybinių duomenų grupių apibūdinimui) Pavyzdys: moterų amžiaus vidurkis krūties vėžio histologinių stadijų grupėse • Kartogramos. Pvz.: šalies žemėlapyje juodžiausiai žymimi rajonai, kur didžiausias mirtingumas. Taip pat šis būdas gali būti naudojamas kategorinių duomenų vaizdavimui. Statistinio tyrimo medžiagos apdorojimas. Statistinio tyrimo metu apskaičiuojami: 1. Absoliutūs skaičiai 2. Santykiniai rodikliai • Ekstensyviniai rodikliai • Intensyviniai rodikliai • Vaizdumo rodikliai • Tarpusavio santykio rodikliai 3. Jei reikia – atliekama standartizacija: ◦ Tiesioginė ◦ Netiesioginė ◦ Atvirkštinė 4. Rezultatų patikimumo įvertinimas 5. Koreliacija Variacinė eilutė. Imtis, kurios elementai surašyti didėjimo arba mažėjimo tvarka vadinama variacine eilute. Variacinė eilutė rodo kokio nors reiškinio pasiskirstymą pagal kokį nors kiekybinį požymį, pvz. naujagimių pasiskirstymą pagal kūno masę. Variacinė eilutė gali būti paprastoji arba grupinė. Grupavimo tikslas – palengvinti vidutinių dydžių skaičiavimą. Grupuojant variacinę eilutę būtina laikytis tam tikrų reikalavimų: 1. nustatyti optimalų grupių skaičių. Per mažas grupių skaičius gali turėti įtakos vidutinių dydžių tikslumui, o per didelis grupių skaičius apsunkina skaičiavimą. Rekomenduojamas grupių skaičius 5-7, o maksimalus 15-17; 2. nustatyti grupavimo intervalus. Jie turi būti vienodi. Jų plotis nustatomas skirtumą tarp maksimalios ir minimalios reikšmės padalijus iš grupių skaičiaus. Be to vieno intervalo maksimali reikšmė turi nepersidengti su kito intervalo minimalia reikšme. Paprastoji variacinė eilutė Pulso dažnumas Studentų skaičius Pulso dažnumas Studentų skaičius Pulso dažnumas Studentų skaičius 60 2 84 8 103 15 64 3 86 10 105 14 65 3 88 11 106 10 70 4 90 13 108 9 72 5 92 15 110 7 74 6 94 14 114 5 75 7 95 15 115 4 78 5 96 13 119 1 80 8 98 14 82 9 100 17 Iš viso 261 Grupuotoji variacinė eilutė Pulso dažnumas Studentų skaičius 60-64 5 65-69 7 70-74 18 75-79 13 80-84 27 85-89 24 90-94 43 95-99 43 100-104 32 105-109 33 110-114 12 115-119 5 Iš viso: 261 Aprašomoji statistika. Imtį apibūdinantys rodikliai. Kiekvieną imtį galima apibūdinti vidutiniais ir išsibarstymo dydžiais. Vidutiniai dydžiai (vidurkiai) – pasiskirstymą apibūdinančios charakteristikos. Vidurkis – tai apibendrinanti statistinės visumos tipiškų dydžių arba jų grupių charakteristika. Vidurkio ypatybė yra ta, kad viena savo reikšme jis išreiškia tai, kas būdinga visai statistinei visumai. Ši vidurkio ypatybė pasireiškia veikiant didžiųjų skaičių dėsniui, kai esant pakankamai dideliam vienetų skaičiui atsitiktinės požymių reikšmės niveliuojasi ir išlieka tik tai, kas bendra visai visumai. Vidutiniais dydžiais išreiškiami kiekybiniai požymiai (vidutinis pulso dažnis, vidutinė kūno masė…). Vidutiniai dydžiai informatyvūs kai skaičiuojami kokybiškai vienodai tiriamųjų grupei. Apskaičiavus vidutinį dydį kokybiškai skirtingoms grupėms padaromos klaidingos išvados. Pvz.: apskaičiavę darželyje įvairaus amžiaus vaikų vidutinę kūno masę gausime kažkokį fiktyvų skaičių, kuris bus nebūdingas sudarytam kolektyvui. Medicinos statistikoje dažniausiai vartojami vidurkiai yra: • Aritmetinis vidurkis (m) – jis gaunamas visų duomenų reikšmių suma padalinus iš duomenų skaičiaus. • Mediana (Me) – tai varianto dalijančio variacinę eilutę pusiau reikšmė. • Moda (Mo) – tai dažniausiai pasitaikanti reikšmė variacinėje eilutėje. Aritmetinis vidurkis (x, arba M) rodo nagrinėjamos imties vidutinį tiriamo kiekybinio požymio lygį. Skaitinė jo reikšmė yra variacinės eilutės centre (simetrinėje eilutėje x=Mo=Me). Apskaičiuojamas pagal formulę: M= x1+x2+….+xn n Moda (Mo) – dažniausiai pasikartojanti reikšmė, “madingiausias“ dydis. Moda turi didelę praktinę reikšmę. Pvz.: vertinant kokios nors infekcinės ligos inkubacinį laikotarpį, domina ne tik vidutinė, bet ir dažniausiai pasikartojanti reikšmė. Lentelėje pateiktame pavyzdyje Mo=129 (“populiariausias“ ūgis). Mediana - tai reikšmė, dalijanti variacinę eilutę pusiau ,t.y. ta reikšmė, aukščiau ir žemiau kurios išsidėstęs vienodas reikšmių skaičius. Medicinos statistikoje mediana vartojama palyginti rečiau, tačiau pasitaiko reiškinių, kuriuos geriau apibūdina mediana negu aritmetinis vidurkis. Pavyzdžiui, norint nustatyti, kur steigti kaimo apylinkės ambulatoriją, reikia atsižvelgti ne tik į gyvenviečių nuotolį, bet ir į gyventojų skaičių. Šiuo atveju geriau skaičiuoti medianą, t.y. surasti ambulatorijai tokią vietą, kad gyventojų skaičius pagal nuotolį nuo jos pasiskirstytų į dvi lygias dalis. Mediana nustatoma suradus variacinės eilutės vidurinį narį: Me= n+1 2 Pavyzdys: 10metų mergaičių pasiskirstymas pagal ūgį(paprastoji variacinė eilutė) Ūgis cm Mergaičių skaičius 126 1 127 2 128 4 129 7 130 6 131 3 132 2 Iš viso 25(n) Variacinę eilutę pusiau dalija 13 reikšmė(lentelėje pateiktos variacinės eilutės Me=129 cm; čia n nelyginis. Kai n lyginis, imama dviejų variacinės eilutės viduryje esančių narių sumos pusė). Esminis modos ir medianos skirtumas nuo aritmetinio vidurkio tas, kad jų dydžiams neturi įtakos atskiros reikšmės. Tuo tarpu aritmetinis vidurkis jautrus kraštutinėms reikšmėms ir todėl geriau apibūdina variacinę eilutę. Pagal šiuos vidurkius galime spręsti apie pasiskirstymo asimetriškumo kryptį ir laipsnį. 1) Mo Me AV Teigiamos asimetrijos (esant nuokrypiui į dešinę; sprendžiame pagal uodegą) kreivėje: aritmetinis vidurkis >Me > Mo 2) AV Me Mo Neigiamos asimetrijos kreivėje (esant nuokrypiui į kairę) aritmetinis vidurkis Mo >Me> aritmetinis vidurkis 3) Esant normaliniam pasiskirstymui Me = Mo = aritmetinis vidurkis Praktinis patarimas: pranešimo metu vidurkį geriau pranešinėti tuomet, kai duomenys artimi normaliniam pasiskirstymui, o kai pasiskirstymas yra nenormalinis, geriau pranešinėti Me (nes Me nėra tokia jautri išsišokančioms reikšmėms). Normalus (Gauso) pasiskirstymas Gauso dėsnis nusako pasiskirstymą tokio atsitiktinio dydžio, kuris gaunamas sumuojant daug kitų nepriklausomų arba silpnai priklausomų dydžių, tarp kurių nėra dominuojančių. Tokį pasiskirstymą turi daugelis gamtoje stebimų reiškinių: žmogaus ūgis, medžių lapų ilgis, molekulių judėjimai dujose... Gauso dėsnis praktikoje labai plačiai vartojamas, kadangi remiantis juo paaiškinama labai daug gamtos reiškinių. Normalinio pasiskirstymo kreivė (grafikas) yra toks: f(x) 0 m x Čia: m – visų tirtų dydžių aritmetinis vidurkis Normalaus pasiskirstymo dėsnio pagrindinės savybės: 1. Normalaus pasiskirstymo grafikas yra simetriškas. 2. esant normaliam pasiskirstymui sutampa vidutiniai tirtos imties dydžiai (moda, mediana ir aritmetinis tirto dydžio vidurkis) 3. Iš normalinio pasiskirstymo yra gaunama 3 taisyklė: • m intervalas apima 68,3 imties • m 2 intervalas apima 95,4 imties • m 3 intervalas apima 99,99 imties Pavyzdys: Tarkim vidutinis žemės žmonių ūgis 1,75m, o ūgio standartinis nuokrypis (==SD=vidutinis kvaratinis nuokrypis) yra 0,15m. Tuomet didesnių negu 1,75, bus tiek pat kiek ir mažesnių (nes kreivė simetriška). 68 visų žemės žmonių ūgis bus nuo 1,6m iki 1,9m ir t.t. Imtį apibūdina šie išsibarstymo dydžiai: 1. limitas [minimali reikšmė ÷ maksimali reikšmė] 2. amplitudė (A = maksimali reikšmė – minimali reikšmė) 3. dispersija (variance) SD= (x-xn)2 (n-1) 4. standartinis nuokrypis (SD) Standartinis nuokrypis (SD, standart deviation), vidutinis kvadratinis nuokrypis) – tai dydis, rodantis kiek vidutiniškai kiekviena reikšmė yra nukrypusi nuo vidurkio. Šis dydis yra žymimas įvairiai: , s, SD. SD= (x-xn)2 (n-1) Praktinė vidutinio kvadratinio nuokrypio reikšmė: • Juo galima apibūdinti variacinės eilutės išsibarstymą (aritmetinis vidurkis ± 2 SD apima 95 proc. visų imties reikšmių) • Juo galima sulyginti vienarūšių požymių įvairumo reikšmes (pvz. viename ir kitame kaime vyrų ūgio vidurkis gali būti vienodas, bet skirsis SD) • Leidžia išsiaiškinti labiau pastovius ir dažniau kintančius požymius • Jis reikalingas nustatant standartinę paklaidą Lyginti du skirtingais matavimo vienetais išreikštus arba dviejų nevienodų grupių vidutinius kvadratinius nuokrypius netikslinga. Šiuo atveju reikia skaičiuoti imties variacijos koeficientą (CV), išreikštą procentais: CV= SD m (aritmetinis vidurkis) Kuo CV didesnis, tuo požymis yra labiau kintantis ir jo reikšmės labiau išsibarsčiusios. Pvz. vidutinė paauglių kūno masė 52,5 kg, SD – 4,2kg; ūgis 160,2 cm, SD – 6,5 cm. CV (masės)=8proc., CV(ūgio)= 4proc. Tai reiškia, kad kūno ūgis yra pastovesnis dydis, perpus mažiau varijuojantis negu masė. Yra laikoma, kad jei: CV0,05 Išvada: tikimybė atsitiktinai gauti skirtumą, kai jo nėra generalinėje aibėje yra daugiau, nei 5 procentai, todėl mes negalime atmesti nulinės hipotezės. Gautas skirtumas yra statistiškai nepatikimas. 3 užduotis. Ištirta 143 berniukai ir 127 mergaitės, 36 (25proc.) berniukų ir 18 (14 proc.) mergaičių buvo mažesnio svorio negu norma. Klausimas: ar ištirtoje populiacijoje nepakankamo svorio berniukų daugiau, nei mergaičių? Sprendimas: Sudarome lentelę: Mažesnis svoris Normalus svoris berniukai 36 107 R1=143 mergaitės 18 109 R2=127 S1=54 S2=216 270 Apskaičiuojame: 2= (a*d-b*c)2 * n = (36*109-107*18)2*270 =5,9 R1 * R2 * S1 * S2 143*127*54*216 Remiantis gauta 2 reikšme nustatome, kad p
Šį darbą sudaro 7924 žodžiai, tikrai rasi tai, ko ieškai!
★ Klientai rekomenduoja
Šį rašto darbą rekomenduoja mūsų klientai. Ką tai reiškia?
Mūsų svetainėje pateikiama dešimtys tūkstančių skirtingų rašto darbų, kuriuos įkėlė daugybė moksleivių ir studentų su skirtingais gabumais. Būtent šis rašto darbas yra patikrintas specialistų ir rekomenduojamas kitų klientų, kurie po atsisiuntimo įvertino šį mokslo darbą teigiamai. Todėl galite būti tikri, kad šis pasirinkimas geriausias!
Norint atsisiųsti šį darbą spausk ☞ Peržiūrėti darbą mygtuką!
Mūsų mokslo darbų bazėje yra daugybė įvairių mokslo darbų, todėl tikrai atrasi sau tinkamą!
Panašūs darbai
Atsisiuntei rašto darbą ir neradai jame reikalingos informacijos? Pakeisime jį kitu nemokamai.
Pirkdamas daugiau nei vieną darbą, nuo sekančių darbų gausi 25% nuolaidą.
Išsirink norimus rašto darbus ir gauk juos akimirksniu po sėkmingo apmokėjimo!