nemoku.lt

Navigacija

Pirkinių krepšelis

Darbų paieška

Kursiniai darbai

Neuronų tinklų panaudojimas bioinformatikoje

9.6 (3 atsiliepimai)

Neuronų tinklų panaudojimas bioinformatikoje 2 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 3 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 4 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 5 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 6 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 7 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 8 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 9 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 10 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 11 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 12 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 13 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 14 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 15 puslapis

Neuronų tinklų panaudojimas bioinformatikoje 16 puslapis

Aukščiau pateiktos peržiūros nuotraukos yra sumažintos kokybės. Norėdami matyti visą darbą, spustelkite peržiūrėti darbą.

Atsisiųsti šį kursinį darbą

Ištrauka

1. Įvadas Bioinformatika yra nauja, sparčiai besivystanti mokslo sritis atsiradusi informatikos, molekulinės biologijos ir biochemijos mokslų sąveikoje. 1953 metais James Watson ir Francis Crick pasiūlė DNR modelį, pagal kurį DNR sudaryta iš dviejų spiralių (grandinių). Spiralė nusakoma nukleotidų (adeninas, citozinas, guaninas ir timinas) seka. Turint vieną spiralę vienareikšmiškai galime gauti ir kitą, kadangi adeninas visuomet jungiasi su timinu, o citozinas su guaninu. Grandinės ilgis kinta nuo kelių tūkstančių (paprasčiausi mikroorganizmai) iki ~ 3.5 milijardų (žmogus) nukleotidų. Informaciniu požiūriu DNR susideda iš dviejų rūšių atkarpų: koduojančių kokį nors baltymą egzonų (genų) ir nekoduojančių intronų (tarpų). Supratimas, kaip šios detalės yra sudedamos, ir yra pagrindinė problema, tradiciškai sprendžiama laboratorinių eksperimentų ir bandymų keliu. Bioinformatika tiria –biologinius duomenis, duomenų analizes metodais. Apie 1980 sukurti SOM (Self Organizing Maps) kurių veikimas pagrįstas konkuravimo principu. SOM neuronai patalpinami mazguose tinkle, dažniausia dvimačiame, ir sunumeruojami, tokiu būdu gaunamas neuronų tinklelis. Kitaip tariant SOM tinka n-mačiams duomenims atvaizduoti dvimatėje erdvėje. Pati SOM idėja buvo pateikta Suomiu profesoriaus Teuvo Kohoneno todėl jie dar vadinami Kohoneno Žemėlapiais. Dar SOM naudojami: automatiniam balso atpažinimui, klinikinių duomenų analizei, elektrinių smegenų signalų analizei ir apskritai duomenų analizei. SOM neuronai sudedami mazguose tinklelyje, kuris yra dažniausia vienmatis arba dvimatis. Didesnio matavimo žemėlapiai yra įmanomi, bet retai naudojami. Neuronai tinklelyje yra sureguliuojami pagal panašumą į įėjimo duomenis (žr. Apie SOM algoritmą). Neuronai „sustumdomi“ pagal reikšmę vienas šalia kito. Todėl jų pavadinimas ir yra save sutvarkantys žemėlapiai. SOM skiriasi nuo žmogaus smegenų struktūros modelio. Žmogaus smegenys sudarytos taip, kad skirtingi sensoriniai signalai yra apdorojami skirtingai pagal topologiją išdėstytų skaičiavimo centrų. Lytėjimo, regos ir klausos yra skirtingose smegenų dalyse ir jų topologinis išsidėstymas smegenų žievėje skiriasi. Be to skaičiuojamasis žemėlapis paskiria paprastus statybinius blokus informaciją apdorojančioje nervinėje infrastruktūroje. Skaičiuojamasis žemėlapis yra apibrėžiamas kaip seka neuronų, kurie veikia kaip nedaug besiskiriantys filtrai, kurie operuoja su pateikta informacija paraleliškai. Dėl šios priežasties neuronai transformuoja signalus į tikslią vietą turinčius duomenis su atitinkamais parametrais. 1.1 Tipai Yra du žemėlapių pagal požymius sudarymo būdai, jie dalinai atspindi smegenų veikimo modelį. Šie du modeliai skiriasi vienas nuo kito pagal įvesties tipą. Žmogaus smegenys beveik visiškai padengtos smegenų žievės pilkąja medžiaga, kuri paslepia kitas smegenų dalis. Pagal sudėtingumą, smegenų žievė lenkia bet kokią kitą struktūrą. Lygiai taip pat sudėtingai veikia mechanizmas, reaguojantis į skirtingus sensorinius dirgiklius (lytėjimo, klausos, regos), kurių apdorojimo centrai yra tvarkingai išsidėstę smegenų žievėje. Kompiuteriniai žemėlapiai turi tokias savybes: Kiekviename atvaizdavimo lygyje, ateinanti informacija, yra saugoma tinkamu pavidalu apdorojimui. Mūsų tikslas yra sukurti dirbtinius SOM žemėlapius, kurie gali patys išmokti, biologinių smegenų veikimo principu. Šis principas pagrįstas kopijuojant neurobiologinius procesus smegenyse, tinkamus dviems skirtingiems kompiuteriniams žemėlapių sudarymo metodams. Paveikslėlyje matome dviejų modelių schemą. Abejais atvejais išvesties neuronai yra išdėstyti dvimačiame tinklelyje. Tokio tipo topologija užtikrina kad kiekvienas neuronas turės grupę kaimynų. Modeliai skiriasi tarpusavyje būdu kuriuo pateikiami duomenys į tinklą. Paveikslėlyje 1.A matome Willshaw - von der Malsburg (1976) modelį pagrystą biologiniu veikimu. Yra du skirtingi dviejų dimensijų neuronų tinklai sujungti tarpusavyje, įterpti vienas į kitą. Vienas tinklas atspindi įvestį, antrasis išvestį atspindinčius neuronus. Du tinklai susijungia per jungiamuosius neuronus. Išvesties tipo neuronai nėra „laimėtojas pasiima viską“ (winner takes all). Yra slenkstis kuris padarytas tam kad užtikrintų kad tik keli išvesties neuronai suaktyvės vienu metu. Be to tam kad išvengti besaikio svorių augimo visame tinkle, kuris gali privesti prie nestabilumo, bendras svoris yra susietas su kiekvieno išvesties neurono maksimaliu galimu svoriu. Be to vienų neuronų svoriams kylant kitų svoriai krenta. Willshaw –von der Malsburg modelis yra sukurtas geometriniam artimumui ir sąveikai tarp įvesties neuronų nustatyti, ir panaudoti tas sąveikas išvesties tinkle taip kad neuronai turintys sąveiką įvesties tinkle turėtų ja ir išvesties tinkle. Taip sukuriamas žemėlapis ir yra savi sutvarkymas. Naudojant Willshaw –von der Malsgurg modelį įvesties ir išvesties tinklai turi būti vienodų matavimų. Paveikslėlyje 1.B matome modelį sukurta T.Kohonen (1982), jis sukurtas ne tam kad paaiškintų smegenų veikimo principus. Metodas paima reikiamas savybes iš smegenų modelio bet išlieka skaičiuojamasis, toks kurį įmanoma dirbtinai sukurti. Kohonen modelis labiau tinkamas dimensijų sutraukimui, aukštesnio matavimo atvaizdavimui, į žemesnį neprarandant informacijos. Kohonen SOM modelis labiau panašus į vektorius kvantuojančius algoritmus. Šis modelis suteikia galimybe topologiškai išdėstyti vektorius pagal jų reikšmes žemesnio (dažniausia dvimačio) matavimo žemėlapyje. Kohonen modelis gali būti pasiekiamas dviem būdais. Galima panaudoti savęs sutvarkymo idėjas, pagrįstas neurobiologiniu principu, tai yra standartinis priėjimas. Alternatyva yra vektorių kvantavimo modelis. Kohonen modeliu yra domimasi kur kas labiau nei Willshaw –von der Malsburg todėl kad šis yra paprastesnis ir efektyvesnis. 1.2 SOM algoritmas Pagrindiniai SOM komponentai yra šie: Tinklelio dydis. Kaimyninė funkcija hj,i(x)(n) laiko atžvilgiu, apibrėžiama aplink laimintį neuroną Apmokymo stabdymo parametras η(n) prasideda reikšme η0 ir mažėja atitinkamai iteracijų kiekiui n, bet niekada nepasiekia nulio. Kaimyninei funkcijai hj,i(x)(n) ir apmokymo greičiui η(n) galime naudoti tokias formules n=0,1,2… (2.1) Kaimyninė funkcija n=0,1,2… (2.2) žr į 2.1 (2.3) Euklidinis atstumas (2.4) žr į 2.2 n=0,1,2… (2.5) mokymo greitis τ2= ~1000 , η0= ~0,1, σ0= 1 kad mokymas būtų stabilus, η(n) turėtų būti santykinai mažas (0,01 arba dar mažesnis atitinkamai iteracijų kiekiui). Kai n pakankamai didelis kaimyninė funkcija neuronų suartinimo procese įtakoja tik artimiausius laiminčio neurono kaimynus, ir gali sumažėti iki vieno arba išvis netekti kaimynų. Yra trys pagrindinės fazės SOM programos darbe: atrinkimas, panašumo ieškojimas, atnaujinimas. Šie trys žingsniai kartojami kol susiformuoja žemėlapis, viską susumavus algoritmas atrodytų taip: 1.Paleidimas: parenkami atsitiktiniai pradiniai svoriai wj(0), vienintelis reikalavimas svoriu pradinėms reikšmėms yra toks, kad jie skirtųsi vienas nuo kito (dviejų neuronų su tokiais pačiais pradiniais svoriais turi nebūti), svorius rekomenduojama sugeneruoti kaip mažus skaičius. Kitas inicializavimo būdas, pradinius neuronų svorius {wj(0)lj=1} paimti iš įėjimų {xi}Ni=1 atsitiktine tvarka 2.Atrinkimas: su vienodomis tikimybėmis traukiamas pavyzdys x iš įvesties duomenų. Vektorius x atspindi suaktyvėjimo šabloną tinkle. 3.Panašumų suradimas: Surandamas geriausia tinkantis (laimintis) neuronas žingsnyje n naudojant minimalaus euklidinio atstumo formulę i(x)= arg minj||w(j)-x||, j=1,2,...,L (L -SOM dydis) (2.6) 4.Atnaujinimas: Visiems neuronams kiekviename žingsnyje pakeičiami svoriai pagal formule wj(n+1)=wj(n)+η(n)*hj,i(x)(n)(x-wj(n)) (2.7) kur η(n) (2.5) apmokymo stabdymo parametras ir hj,i(x)(n) (2.1) kaimyninė funkcija, yra naudojami aplink laimintį neuroną (3.pav) i(x); ir apmokymo stabdymo ir kaimyninė funkcijos kinta dinamiškai 5.Kartojimas: 2 žingsnis kartojamas tol kol atsiranda pokyčiai žemėlapyje. 1.3 Kontekstiniai žemėlapiai Yra skirtingi būdai kaip atvaizduoti SOM. Vienu atvaizdavimo metodu žemėlapis atvaizduojamas kaip elastingas tinklas, vektorių svoriai veikia kaip rodykles į laiminčius neuronus kurie yra atvaizduojami, ko pasakoje duomenys iš visiškai netvarkingų, išsidėlioja artimai tolygiai išsidėsčiusiems. Toks atvaizdavimo būdas tinka tik dvimačiams duomenims. Antras atvaizdavimo būdas suklasifikuoja neuronus pagal požymius dvimačiame žemėlapyje, ko pasakoje gaunami regionai tarpusavyje susiję pagal reikšme. Susijusius ta prasme kad kiekviena neuronų grupė atsidurs šalia kitos grupės turinčios panašias savybes. Žinoma ar SOM atrinks požymius teisingai priklauso nuo duomenų pateikimo. Kaip pavyzdį galima pateikti (1 lentelę) Kiekviename stulpelyje yra gyvūnas apibūdinamas pagal 13 savybių kurias jis turi (1) arba neturi (0). Gyvūnus sunumeruokime nuo 1-16 ir pažymėkime Xs savybes 1-13 ir pažymėkime Xa tokiu būdu mes gauname įvesties vektorių x kuris susideda iš 29 elementų. Išvesties duomenys atvaizduojami 10x10 tinkle. Vektorių svoriai sugeneruojami, taip kad nebūtų dviejų vienodų. Per 2000 iteracijų tinklas pasiekia stabilią būseną. Testavimui duomenys apibrėžiami x=[Xs,0]T imamas tik vieno gyvūno kodas ir tikrinama kuris išvesties neuronas artimiausias duotajam. Tai atliekama su visais 16 gyvūnų. Tai atlikę gauname tokį žemėlapį Šiame žemėlapyje pažymėti tik laimėję neuronai. Pilnas žemėlapio vaizdas su kaimynais atrodytų taip 2. Darbo tikslai 2.1 Darbo tikslai – sukurti programinę įrangą darbui genų tyrimui, jos pagalba išsiaiškinti kiek efektyvus yra SOM (Self organizing maps) panaudojimas bioinformatikoje (šiuo atveju bakterijų atskyrime). 2.2 SOM taikymo schema 1. Sukuriamas SOM tinklas. 2. SOM tinklas apmokomas su fiksuota apmokymo duomenų imtimi. 3. SOM tinklas testuojamas su duomenimis, kurie mokymo metu panaudoti nebuvo. SOM vizualizuotas tokiu būdu: Pateikus pavyzdį gauname suaktyvėjusį neuroną. Priklausomai nuo to kokiai bakterijai priklauso pavyzdys šį neuroną tinklelyje pažymime: - Suaktyvėjęs neronas (kai duomenys yra Bordetella bronchiseptica bakterijos) - Suaktyvėjęs neuronas (kai duomenys yra Streptococcus pyogenes SSI-1 bakterijos). - Suaktyvėjęs neuronas (kai duomenys yra Bordetella bronchiseptica bakterijos; testavimas po vieną pavyzdį – per TreeView). - Suaktyvėjęs neuronas (kai duomenys yra Streptococcus pyogenes SSI-1 bakterijos; testavimas po vieną pavyzdį – per TreeView). • - nesuaktyvėjęs SOM neuronas. Su 3460 apmokymo pavyzdžių (100% genomo) 9,34 MB ir su 188 testavimo pavyzdžiais (549 KB) tinklas nepadarė klaidų, nesuaktyvėjo 54 neuronai Pav (1.1) Su 2793 apmokymo pavyzdžiu (80% genomo) 7,48 MB, ir su 150 testavimo pavyzdžių (420 KB) tinklas klaidų nepadarė, nesuaktyvėjo 66 neuronai Pav (1.2) Su 1700 apmokymo pavyzdžių (49.1% genomo) 4,39 MB, ir su 150 testavimo pavyzdžių (420 KB) tinklas klaidų nepadarė, nesuaktyvėjo 139 neuronų Pav (1.3) Su 849 apmokymo pavyzdžiais (24.5% genomo) 2,23 MB ir su 150 testavimo pavyzdžių 420 KB tinklas klaidų nepadarė, 288 neuronai nesuaktyvėjo Pav (1.4) Su apmokymo 100 pavyzdžių (2.9% genomo) 227 KB ir su 40 testavimo pavyzdžių105 KB tinklas atskyrė bakterijas, 800 neuronų nesuaktyvėjo Pav (1.5a) Pav(1.5b) Su 34 pavyzdžiais (1% genomo) 67,5 KB ir su 400 testavimo pavyzdžiais (1,07 MB) tinklas bakterijas atskyrė. Matomas ryškus testavimo pavyzdžių pasiskirstymas Pav (1.6a) Pav(1.6b) Pav (1.6c) Iš šių paveikslėlių galima padaryti išvadas: 1. Kuo daugiau duomenų tuo mažiau nesuaktyvėjusių neuronų, kadangi SOM gauna daugiau pavyzdžių atitinkamai „nelaimėję“ neuronai su kiekvienu papildomu pavyzdžiu turi galimybę jais pasidaryti. (pav 1.1) 2. Esant pakankamai duomenų SOM turi savybė „apibendrinti“ – t.y. pateikus pavyzdį, kuris testavimo metu algoritmui nebuvo pateiktas, suaktyvėja neuronas iš regiono, kuriam „priklauso“ pateiktas pavyzdys. 3. Jeigu duomenų nėra daug (1% genomo) (pav 1.6a,b,c), norint gauti adekvačią informaciją, pakanka nedidelio SOM tinklelio. 3 Programos aprašymas. Programa, kuri buvo naudota šiame darbe, sukurta su Borland C++ builder platforma. SOM algoritmas realizuotas klasėje. Konfigūracija nuskaitoma iš XML bylos, pvz.

Daugiau informacijos...

Šį darbą sudaro 1856 žodžiai, tikrai rasi tai, ko ieškai!

★ Klientai rekomenduoja

Šį rašto darbą rekomenduoja mūsų klientai. Ką tai reiškia?

Mūsų svetainėje pateikiama dešimtys tūkstančių skirtingų rašto darbų, kuriuos įkėlė daugybė moksleivių ir studentų su skirtingais gabumais. Būtent šis rašto darbas yra patikrintas specialistų ir rekomenduojamas kitų klientų, kurie po atsisiuntimo įvertino šį mokslo darbą teigiamai. Todėl galite būti tikri, kad šis pasirinkimas geriausias!

Norint atsisiųsti šį darbą spausk ☞ Peržiūrėti darbą mygtuką!

Detali informacija

Darbo tipas

Kursiniai darbai

Šaltiniai

✅ Šaltiniai yra

Failo tipas

Word failas (.doc)

Apimtis

17 psl., (1856 ž.)

Peržiūrėti darbą

Turi dovanų kodą? Spausk čia

Darbo duomenys

Informacinių technologijų kursinis darbas
17 psl., (1856 ž.)
Word failas 738 KB
Lygis: Universitetinis
✅ Yra šaltiniai

Atsisiųsti šį kursinį darbą

Ne tai, ko ieškai?

Mūsų mokslo darbų bazėje yra daugybė įvairių mokslo darbų, todėl tikrai atrasi sau tinkamą!

Panašūs darbai

Privalumai

Darbo pakeitimo garantija

Atsisiuntei rašto darbą ir neradai jame reikalingos informacijos? Pakeisime jį kitu nemokamai.

Gauk 25% nuolaidą

Pirkdamas daugiau nei vieną darbą, nuo sekančių darbų gausi 25% nuolaidą.

Greitas aptarnavimas

Išsirink norimus rašto darbus ir gauk juos akimirksniu po sėkmingo apmokėjimo!

Atsiliepimai

Dainius Studentas

Naudojuosi nuo pirmo kurso ir visad randu tai, ko reikia. O ypač smagu, kad įdėjęs darbą gaunu bet kurį nemokamai. Geras puslapis.

Aurimas Studentas

Puiki svetainė, refleksija pilnai pateisino visus lūkesčius.

Greta Moksleivė

Pirkau rašto darbą, viskas gerai.

Skaistė Studentė

Užmačiau šią svetainę kursiokės kompiuteryje. :D Ką galiu pasakyti, iš kitur ir nebesisiunčiu, kai čia yra viskas ko reikia.

Atsisiųsti šį kursinį darbą

Palaukite! Šį darbą galite atsisiųsti visiškai NEMOKAMAI! Įkelkite bet kokį savo turimą mokslo darbą ir už kiekvieną įkeltą darbą būsite apdovanoti - gausite dovanų kodus, skirtus nemokamai parsisiųsti jums reikalingus rašto darbus.

Rodyti daugiau

Kursiniai darbai

Neuronų tinklų panaudojimas bioinformatikoje

Privalumai

Atsiliepimai

Panaudok dovanų kodą