ŽMOGAUS GENOMO PROJEKTO REZULTATAI Genų nustatymas nukleotidų sekose, genų skaičiaus žmogaus genome įvertinimas, pradinis integruotas genų indeksas (IGI) ir asocijuotas integruotas baltymų indeksas (IPI). Žmogaus genomo sekų įvairovė ir pasiskirstymas. Nustatyta, kad žmogaus genomą sudaro 3,2x109 bp (3,2 Gb), iš jų 2,95 Gb sudaro euchromatinas. IHGP (International Human Genome Project) nusekvenavo ~90% euchromatininės genomo dalies, privati Celera kompanija sekvenavo 88-93% euchromatino. Visuomeninio projekto duomenimis pirminis genų kiekis 32000, iš jų 15000 yra žinomi genai, 17000 – nuspėjami genai. Manoma, kad tikrų genų yra 24000, nes kai kurie nuspėjami genai gali būti pseudogenai. Celera duomenimis genų yra 39000, tačiau 12000 genų įrodymai silpnoki. 1 lentelė. 2001 metų žmogaus genomo projekto rezultatai: sekvenuotų bazių ir euchromatino kiekis, numanomas bendras žmogaus genų skaičius ir genų, tenkančių 1 mln bazių porų, kiekis Žmogaus DNR pirminė nt seka Sekvenuota bp (mln) / % viso genomo Sekvenuota euchromatino (%) Spėjamas genų skaičius Genų skaičius mln’ui sekvenuotų DNR bp IHGP 2 693 (84%) 90 31 780 12 Celera 2 654 (83%) 88-93 39 114 15 IHGP genomo seką sudarė iš fizinių genolapių, dengiančių >90% euchromatininės genomo dalies, o kartu su papildomomis sekomis tai sudaro ~94% žmogaus genomo. Žmogaus genai turi gana mažus egzonus (vidutiniškai 50 kodonų), atskirtus ilgais intronais (net iki 10 kb). Todėl sunku kompiuterinėmis programomis tiesiogiai nustatyti genus. Vietoj to genų numatymas remiasi cDNR sekomis arba konservatyviomis genų ir baltymų sekomis kituose organizmuose. Genų ieškoma naudojant genų apskaičiavimo programas (ieško ASR ir kitų požymių) arba sekvenuojant kDNR arba EST bibliotekas. Homologines genomines sekas galima identifikuoti naudojant BLASTN ar kitus labiau specializuotus metodus. Nekoduojančios RNR. Tūkstančiai genų produkuoja tokias RNR (nkRNR), jų yra kelios klasės: 1) tRNR; 2) rRNR; 3) snoRNR (dalyvauja rRNR procesinge); 4) snRNR (splaisosomų, RNP sudėtyje). Baltymus koduojantys genai. Šių genų identifikavimas yra svarbiausias, bet ir sunkiausias. Žinomų genų kDNR seka gretinama su genomo seka. Tai leidžia tirti egzonų-intronų struktūrą ir GC sąstatą. Taip pat genai susiejam su genetiniais ir citogenetiniais genolapiais, susieja juos su reguliacinėmis sekomis. Toks sugretinimas įmanomas tik ketvirtadaliui žinomų genų. Žinomi genai pateikti RefSeq duomenų bazėje, pilnos mRNR sekos yra GenBank bazėje. Dalinis sugretinimas atliktas 9 212 genų, o iš jų 5 364 jau pilnai sugretinti su genomo seka. Dauguma genų yra ilgesni nei 100 kb, didžiausias distrofino genas – 2,4 Mb. Visiškai baigta 1 Gb sekos, o likusioje genomo dalyje dar turi būti užpildyti likę tarpai. Pilnai sekvenuotos 21 ir 22 chromosomos. 22 chromosomoje nustatyti 247 žinomi genai, 298 numanomi genai. Visas chromosomas planuojama baigti 2003 metais. Bet vien sekos neužtenka genų nustatymui. Reikia šias sekas palyginti su kitais organizmais. Genų identifikavimas žmogaus DNR apsunkintas, nes koduojančios sekos sudaro tik ~5% kiekvieno geno. Pradiniai genų kiekio skaičiavimai. Tai netiesiogiai nustatyti genai. Buvo remtasi mRNR kiekiu (10 000 – 20 000) tipiškuose stuburinių audiniuose ir ekstrapoliuota, kad iš viso jų yra 40 000. 1980 metais Gilbert teigė, kad yra 100 000 genų. Jis rėmėsi geno (~3x104bp) ir genomo (3x109bp) dydžiu. 70 000 – 80 000 genų skaičius ekstrapoliuotas iš CpG salų ir jų santykio su žinomais genais. Turint informaciją apie seką tapo įmanoma ekstrapoliuoti iš įvairių duomenų: EST, žinomų genų mRNR, palyginimo su kitomis rūšimis ir baigtų chromosomų analizės. EST paremti genų kiekio apskaičiavimai svyravo nuo 35 000 iki 120 000. Žmogaus genomo seką palyginius su kito organizmo ir nustačius egzonų tankį, apskaičiuotas genų skaičius buvo ~30 000. Ekstrapoliacijos atliktos ir iš genų kiekio, nustatyto 21 ir 22 chromosomose. Šie apskaičiavimai svyruoja nuo 30 500 iki 35 500. Genų numatymas. Dabartiniai genų numatymo metodai naudoja: 1) tiesioginį EST ar mRNR transkriptų sugretinimą su genomo seka; 2) netiesioginį įrodymą, paremtą anksčiau identifikuotų genų ar baltymų sekų panašumu; 3) ab initio egzonų grupių atpažinimą, besiremiantį statistine informacija apie splaisingo vietas, egzonų ir intornų ilgiais (Genscan, Genie, FGENES programos). Pirmas metodas remiasi tiesioginiais eksperimentiniais duomenimis, bet pasitaiko nemažai artefaktų dėl EST, kilusių iš nespalaisuotos mRNR, dėl genominės DNR užteršimo ir negeninių transkriptų (pvz.: nuo JGE promotoriaus). EST sekų sugretinimas su genomo sekomis rodo, kad ~60% žmogaus genų turi daugybinius splaisingo variantus. Antrasis metodas teisingai identifikuoja genų sekas, bet dalis jų gali būti pseudogenai. Genai randami pagal ryšį su kitų rūšių genais – ortologais. Lyginant žmogaus ir pelės mRNR iš LocusLink duomenų bazės megaBLAST programa galima identifikuoti ortologus. Taip pelės baltymų sekos buvo palygintos su žmogaus genomo pradiniu planu ir rasti atitikimai tam tikrose žmogaus chromosomose. Kitas būdas – ieškoti paralogų (kilusių iš genų duplikacijų). BLAST paieška baltymų rinkinį sutapatina su projekto sekomis ir randa atitikimą peptidui, kurį koduoja tam tikra chromosoma. Tačiau negalima nustatyti tikrai naujų genų, kurie neturi sekos panašumų su žinomais genais. Kartais genus reikia nustatyti pagal poziciją genome, o ne pagal sekų panašumus. Visuomeninis projektas naudojo FISH, kad genomo sekoje lokalizuotų BAC klonus, turinčius atitinkamas sekos atkarpas. Šiuo būdu nustatomos citogenetinės genų koordinatės. Genų numatymui pakaktų vien trečio – ab initio – metodo, bet tik tuo atveju, jei jis galėtų nustatyti bruožus, kuriuos ląstelės naudoja genų atpažinimui. Šis metodas žmoguje individualius egzonus gali nustatyti 70%, o koduojančius egzonus – 20% tikslumu. Pradinis integruotas genų indeksas (IGI – Initial Gene Index) ir asocijuotas integruotas baltymų indeksas (IPI – Initial Protein Index). Naudojami numatymai, gauti naudojant Ensembl sistemą. Ensembl naudoja ab initio numatymus, gautus su Genscan, tada mėginama juos patvirtinti pagal panašumą baltymams, mRNR, EST ir baltymų motyvams iš bet kokio organizmo. Ensembl numatė 35 500 genų su 44 860 transkriptų. Toliau Ensembl genus apjungė su genais numatytais naudojant kitą programą – Genie. Ši programa pradeda nuo mRNR arba EST ir pratęsia jas ab initio statistiniu metodu. Toliau gauti rezultatai buvo apjungti su RefSeq, SWISSPROT ir TrEMBL duomenų bazėse esančiais žinomais genais. Galiausiai gautas rezultatas – IGI.1 (jame yra ~24 500 genų), o jį nutransliavus gautas ir atitinkamų baltymų rinkinys – IPI.1. Taigi, numatyti iš viso 31 778 baltymai: [14 882 RefSeq/SWISSPROT/TrEMBL žinomi genai] + [4 057 Ensembl-Genie numatyti genai] + [12 839 Ensembl numatyti genai]. Vidutinis žinomų baltymų ilgis yra 469 am.r., Ensembl-Genie baltymų – 443 am.r., vien Ensembl – 187 am.r. (Ensembl numato daugiau genų dalis, o ne pilnus genus). Vidutinis visų baltymų dydis – 352 am.r. IGI/IPI įvertinimas. IGI/IPI rinkinio jautrumui ir specifiškumui nustatyti naudota keletas metodų. Palyginimas su “naujais” žinomais genais, rastais nepriklausomuose tyrimuose. Identifikuotas 31 genas: 22 įėjo į Refseq ir 9 iš Sanger Centro genų identifikacijos programos. Iš šių genų 28 buvo genomo sekoje ir 19 buvo IGI/IPI rinkinyje. Tai rodo, kad genų numatymo jautrumas yra 68% (19/28) ir, kad į IGI įeina 61% (19/31) naujų genų. Vidutiniškai nustatyta 79% kiekvieno geno. Taip pat 477 IGI numatyti genai buvo palyginti su 22 chromosomos 539 genais ir 133 pseudogenais.nustatyta, kad 9% IGI numatymų gali būti pseudogenai Dabartinio IGI sudėtyje yra patikimas dalinių genų, fragmentuotų ir susiliejusių genų bei pseudogenų skaičius. Bet jame taip pat trūksta patikimo skaičiaus tikrų genų. Tačiau ir toks genų numatymas vertingas daugeliui biologinių tyrimų. Žmogaus genomo sekų įvairovė ir pasiskirstymas. Genomo seka varijuoja dėl nevienodo genų, judriųjų genomo elementų (JGE), CG sudėties, CpG salų ir rekombinacijos dažnio pasiskirstymo. Baltymus koduojančių genų skaičius svyruoja tarp 30 000 – 35 000, tai sudaro 1,1 – 1,5% viso genomo. Koduojančios sekos sudaro 61% sudaro Alu, o 1p36 >15% sudaro MIR elementas. Kai kurios genomo sritys beveik visai neturi KS. 4 sritys su mažiausiu KS dažniu yra 4 homeo genų klasteriai: HOX A, HOX B, HOX C ir HOX D. Kiekviename lokuse yra ~100 kb sritys, kuriose KS sudaro 1,42 mln. VNP. 1,91 kb genomo tenka 1 VNP. VNP dažni didžiojoje genomo dalyje: tik 4% genomo sekų patenka į didesnius nei 80 kb intervalus be VNP. Egzonuose 1 aptiktas VNP tenka 1,08 kb (greičiausiai dėl didesnio egzonams skirto dėmesio). Nustatytas normalizuotas genomo heterozigotiškumas (tikimybė, kad nukleotido padėtis bus heterozigotinė, iš populiacijos atsitiktinai paėmus 2 chromosomas) 7,5110–4 atitinka 1 VNP 1,331 kb. Autosomų heterozigotiškumas svyruoja nuo 8,7910–4 (15-os) iki 5,1910–4 (21-os). Mažesnis lytinių chromosomų heterozigotiškumas (X: 4,6910–4; Y: 1,5110–4) pirmiausia aiškinamas mažesniu, nei autosomų, jų skaičiumi populiacijoje (ir todėl retesniu patekimu į mejozę). VNP skaičiaus tam tikro ilgio sekose pasiskirstymas turi didesnę dispersiją nei ta, kuri būtų stebima, jei kiekvienos nukleotido padėties įvairavimas būtų vienodas (tada VNP skaičius pasiskirstytų pagal Puasono skirstinį). Tokį netolygumą sąlygoja biocheminiai (dažnos CpG TpG mutacijos) ir evoliuciniai veiksniai. ‘Celera’ nustatinėjo VNP, lygindama gautąją genomo seką su IHGSC genomo seka ir kitais šaltiniais (VNP ir žmogaus genų mutacijų duomenų bazėmis). 1 VNP buvo aptiktas 1,2 – 1,5 kb sekos. ‘Celera’ išvados apie VNP pasiskirstymą iš esmės neprieštarauja IHGSC. Nustatyta, kad egzonuose vyrauja “tylintys” VNP. Tarp keičiančių koduojamą aminorūgštį VNP labai reti keičiantieji ją į nekonservatyvią. VNP intronuose dažnesni nei egzonuose. Tai rodo koduojančiose genų dalyse esančių VNP patiriamą atrankos spaudimą. ‘Celera’ nustatė daugiau nei 3 mln. VNP. Literatūra: 1. Initial sequencing and analysis of the human genome. International Human Genome Sequencing Consortium. Nature, 409, 15 Feb 2001. 2. The sequence of the human genome. Venter, J. C., et al. Science, 291, 16 Feb 2001. 3. A map of human genome sequence variation containing 1.42 million SNPs. The International SNP Map Working Group. Nature, 409, 15 Feb 2001. | Žmogaus genomo projekto rezultatų panaudojimas. Tolesnės projekto perspektyvos Žmogaus genomo projektas, jo rezultatai ir jų panaudojimo perspektyvos rodo, kad biologija šiame amžiuje eis priekyje kitų mokslų. Žmogaus genomo projekto rezultatai yra ir bus panaudojami molekulinėje medicinoje, įvertinant riziką, teismo ekspertizėje, tiriant žmogaus kilmę, migraciją ir kt. Molekulinė medicina – tai geresnė ligų diagnostika, ankstesnis genetinio polinkio ligai nustatymas, vaistų taikinių paieška, genų terapija. Žymiai tikslesni genolapiai jau padėjo detaliau išsiaiškinti įvairių ligų genetinį pagrindą, įskaitant miotoninę distrofiją, trapiosios X chr. sindromą, 1 ir 2 tipo neurofibromatozes, Alzhaimerio ligą, šeimyninį krūties vėžį ir kt. Ateityje bus orientuojamasi ne į simptomų gydymą, bet į fundamentalias ligos priežastis. Greitesni ir labiau specifiniai diagnostiniai testai padės anksčiau išgydyti daugelį negalavimų, be to, bus įmanoma kurti naujoviškus terapijos režimus, paremtus specialiais vaistais, imunoterapija, aplinkos sąlygų, kurios sąlygoja ligą, pašalinimu, efektyvių genų papildymu ar pakeitimu sveikais (genų terapija). Rizikos įvertinimas – tai žalos sveikatai dėl radiacijos, mutageniškų ir kancerogeniškų medžiagų įvertinimas ir nustatymas, paveldimų mutacijų tikimybės mažinimas. Pažymėtina, kad žmogaus genomo projektas, jo rezultatai svarbūs ne tik medicinai. Projektui sukurtos ir nuolat tobulinamos technologijos leis jas panaudoti tiriant ir kitus organizmus. Tai galės būti panaudojama energetikoje, gamtos apsaugoje, žemės ūkyje ir kitose srityse. Bet kol kas tai yra ateities darbai. Gi dabartiniai žmogaus genomo projekto rezultatai panaudojami tokiuose tyrimuose: Naujų genų, kurie koduoja kol kas nežinomos funkcijos polipeptidus, paieška. Iš virš 26500 numanomų baltymų tokių aptikta apie 41 (12731). Šiuo metu naudojamais metodais ir taisyklėmis (analizė baltymų šeimų lygyje (Pfam duom. bazė ir Celera‘s Panther Classification ir analizė domenų lygyje (SMART)) jų neįmanoma priskirti žinomoms baltymų šeimoms. Pritaikius ne tokius griežtus klasifikavimo algoritmus pasirodė, kad iš 5 (636) iš tų 41 galima buvo priskirti molekulines funkcijas. 1/3 jų yra endogeniniai retrovirusiniai baltymai. Spėjama, kad likę 12095 nežinomi genai, gali būti ir klaidingai teigiamai identifikuoti kaip potencialūs genai. Dažniausiai identifikuotos molekulinės funkcijos: transkripcijos faktoriai, dalyvavimas nukleorūgščių metabolizme, receptoriai, kinazės, hidrolizės (dauguma jų yra proteazės), protoonkogenai. Gretinant žmogaus genomą su kitų organizmų sekvenuotais genomais pastebėta, kad pagrindiniai ląstelinių procesai evoliuciškai yra konservatyvūs. Aptikti 2758 „griežti ortologai“ (genai, kilę iš bendro protėvio) tarp žmogaus ir drozofilos, 2031 tarp žmogaus ir nematodės genų. 1523 iš tų žmogaus baltymų turi ortologus tiek drozofiloje, tiek nematodėje. Kaip taisyklė tai yra nukleorūgščių baltymai (DNR/RNR metilazės, DNR/RNR polimerazės, helikazės, DNR lipazės, DNR/RNR brendimo faktoriai, nukleazės, ribosominiai baltymai), ribonukleoproteinai, transferazės, oksidoreduktazės, liazės, izomerazės. Pastebėtina, kad hidrolazės į šią „dvigubų“ ortologų kategoriją nepapuola (organizmai jau buvo divergavę, kai pradėjo formuotis šios šeimos). Iš reguliatorinių baltymų „dvigubi“ ortologai yra mažosios GTPazės, ląstelės ciklo reguliatoriai (ypač ciklino C šeima), o taip pat baltymai dalyvaujantys transporte, šaperonai (DNAJ, Hsp60, 70, 90). Analizuojant molekulinės funkcijos, baltymų šeimų ir baltymų domenų lygiuose nustatyta, kad skirtingai nuo drozofilos ir C. elegans, žmogaus baltymams, dalyvaujantiems ontogenezės reguliacijoje ir įv. ląsteliniuose procesuose (įgytas imunitetas, neuroninės funkcijos, hemostazė), būdinga domenų ekspansija (didėjimas, plėtimasis). Įgytas imunitetas: tai vienas iš aiškiausių skirtumų, kuriuo žmogaus genomas skiriasi tiek nuo drozofilos, tiek nuo C. elegans. Tačiau to ir tikėtasi, kadangi tipiškas įgytas imunitetas – išimtinai stuburinių bruožas. (MHC, citokinai, chemokinai, STAT ir kt. baltymai). Nervinės sistemos vystymasis, struktūra ir funkcija: žmogaus genome žymiai daugiau genų šeimų, dalyvaujančių nervinės sistemos vystymesi (neurotrofiniai faktoriai, signalinės molekulės, struktūriniai ir funkciniai baltymai. Šie duomenys gerai koreliuoja su fenotipiniais lyginamų taksonų nervinės sistemos skirtumais (neuronų gebėjimas sudaryti jungtis, skirtingų nervinių ląstelių tipų skaičius, individualių aksomų ilgis ir glijos ląstelių skaičius). Tarpląsteliniai ir viduląsteliniai signalai dalyvaujantys ontogenezėje ir hemostazėje: hormonai ir augimo faktoriai (TGF-, FGF, PDGF, efrinai), receptoriai, adhezijos molekulės, viduląst. signalinės molekulės, nurašymo veiksniai (transkripcijos faktoriai, turintys C2H2 cinko „pirštus“ ), tarpląstelinės metaloproteinazės (ADAM ir MMP). Kitos baltymų šeimos: žmogaus genome yra mažiau P450 genų nei drozofilos ar nematodės genomuose. Žmogaus genome yra 8 – 10 kartų daugiau ribosominių genų kopijų (tarp jų nepažai retropozonų kilmės pseudogenų), apie 2.5 karto daugiau baltymų dalyvaujančių sukirpime (splaisingas). Žmogaus genomo projekto rezultatai akivaizdžiai parodė, kad žmogus ryškiai skiriasi savo imunine ir nervine sistemomis, kraujagyslių sistemos ir hemostazės mechanizmais, citoskeleto sudėtingumu. Nustatytas mažesnis nei lauktas žmogaus genų skaičius, lengvai gali būti kompensuojamas įvairove, sąlygota alternatyvaus sukirpimo, nurašymo ir sintezės kontrolės, įvairių potransliacinių modifikacijų. Akivaizdžiai jaunų domenų evoliucija ir didėjantis reguliacijos sudėtingumas (dėl domenų „suaugimo tiek kokybiškai, tiek kiekybiškai) – būdingas žmogaus bruožas. Gera to iliustracija C2H2 cinko pirštų domenai.
Šį darbą sudaro 3245 žodžiai, tikrai rasi tai, ko ieškai!
★ Klientai rekomenduoja
Šį rašto darbą rekomenduoja mūsų klientai. Ką tai reiškia?
Mūsų svetainėje pateikiama dešimtys tūkstančių skirtingų rašto darbų, kuriuos įkėlė daugybė moksleivių ir studentų su skirtingais gabumais. Būtent šis rašto darbas yra patikrintas specialistų ir rekomenduojamas kitų klientų, kurie po atsisiuntimo įvertino šį mokslo darbą teigiamai. Todėl galite būti tikri, kad šis pasirinkimas geriausias!
Norint atsisiųsti šį darbą spausk ☞ Peržiūrėti darbą mygtuką!
Mūsų mokslo darbų bazėje yra daugybė įvairių mokslo darbų, todėl tikrai atrasi sau tinkamą!
Panašūs darbai
Atsisiuntei rašto darbą ir neradai jame reikalingos informacijos? Pakeisime jį kitu nemokamai.
Pirkdamas daugiau nei vieną darbą, nuo sekančių darbų gausi 25% nuolaidą.
Išsirink norimus rašto darbus ir gauk juos akimirksniu po sėkmingo apmokėjimo!