Přečtení lidského genomu je snem mnoha vědců již po několik desítek let. Před více než třiceti lety tak vznikl Human Genome Project, který si dal za úkol rozklíčovat většinu písmenek všech 24 lidských chromozomů. Vědci ovšem genom doposud četli trochu děravě, a některé části lidské DNA tak nebyly vůbec známy. Až nyní se výzkumníkům podařilo přečíst každý lidský chromozom jedním dechem.

Lidský genom tvoří 22 chromozomů somatických a pohlavní chromozomy X a Y. Každý si neseme kombinaci dvou pohlavních chromozomů (XX nebo XY) a dvě varianty každého z 22 chromozomů. Chromozom je pak vlastně komplikovaně smotané vlákno DNA, které se ovíjí okolo proteinů zvaných histony. Molekula DNA na sobě nese jako korálky různě poskládané čtyři nukleotidové báze – adenin, guanin, cytosin, thymin. Tyto čtyři molekuly, čtyři písmenka genetického kódu, pak kódují veškeré geny a z nich vzniklé proteiny, a tedy živý svět, jak ho známe. Pro větší různorodost ale tato písmenka mohou mít „diakritiku“, tedy jednotlivé nukleotidy nebo histony jsou trochu chemicky pozměněné, pak mluvíme o epigenetice.

Celá práce vznikla pod taktovkou „Telomere to Telomere (T2T)“ konsorcia, jehož název se dá přeložit jako od „začátku do konce“, neboť jako telomery označujeme právě konce každého chromozomu. Vedení konsorcia se pak zhostil National Human Genome Research Institute (NHGRI) pod americkým Národním institutem zdraví (NIH) a dále vědci z Kalifornské a Washingtonské univerzity. Celý projekt byl tak rozsáhlý a jeho poznatky tak důležité, že z této spolupráce vzniklo hned šest publikací v prestižním časopise Science.

Dva tisíce Biblí v každé buňce

Human Genome Project odhalil v roce 2003 sekvenci většiny lidského genomu, což byl naprosto přelomový moment v genetice a molekulární biologii. Zbylých 8 % lidského genomu ovšem zůstalo doposud utajených. Tato část genomu totiž povětšinou neobsahuje žádné geny a tvoří ji například repetitivní sekvence, tedy kratší úseky, které se mnohonásobně opakují, což znesnadňuje jejich čtení. Projekt T2T konsorcia doplnil známé sekvence genomu právě o tyto „problematické“ oblasti, a sestavil tak knihu lidského genomu o délce úctyhodných tří miliard písmenek. Pro představu, anglický překlad Bible obsahuje přes tři miliony písmen. Každá jaderná buňka našeho těla tedy obsahuje zápis o délce jednoho tisíce Biblí, a to hned dvakrát.

„Sestavení doopravdy kompletní sekvence lidského genomu je úžasný vědecký úspěch, který nám konečně přináší dostatečně rozsáhlý náhled na náš úplný základ – naši DNA,“ popisuje Eric Green, ředitel NHGRI, tento důležitý milník lidského poznání. Vědci pod vedením T2T konsorcia využili ke čtení genomu lidských buněk, které byly trochu zvláštní tím, že obsahovaly dvě naprosto stejné sady chromozomů (naše buňky mají dvě rozdílné sady, každou od jednoho rodiče). To vědcům značně ulehčilo práci, ale zároveň tak nemohli rozluštit chromozom Y, který dané buňky vůbec neměly.

Obarvené lidské chromozomy se dají pozorovat mikroskopem. Zdroj: Wikimedia Commons

Děravé čtení k nezaplacení

Čtení genomu není v dnešní době žádným nedosažitelným cílem, díky rozvoji moderních a čím dál levnějších technologií. Rozluštění lidského genomu v rámci Human Genome Project údajně během 13letého trvání projektu stálo astronomické 3 miliardy amerických dolarů (v přepočtu přes 67 miliard Kč). V dnešní době lze většinu našeho genomu přečíst už přibližně za 600 amerických dolarů (13,5 tisíce Kč). Tyto technologie, ať z devadesátých let nebo novější, mají ale pořád své mezery, a to doslova. I současné techniky totiž většinou genom čtou po menších kouscích, úsecích několik stovek písmenek dlouhých. Ty na sebe mohou plynule navazovat, ale v některých oblastech se tvoří mezery.

V posledním desetiletí ale vznikly dvě metody, které dokáží přečíst podstatně delší úsek DNA. Sekvenace s názvem PacBio HiFi DNA je schopná bez jediné chyby rozluštit až 20 tisíc nukleotidů DNA za sebou, Oxford Nanopore DNA dokonce dokáže s vysokou přesností přečíst až 1 milion písmenek DNA na jeden nádech. A právě nejnovější projekt T2T konsorcia využil obou těchto moderních metod.

DNA obsahuje nukleotidové báze adenin, guanin, cytosin a thymin (A, G, C, T). Z dvojvlákna DNA si buňka potřebnou sekvenci přepisuje do molekuly RNA, kde je thymin nahrazen uracilem (U). Tři písmenka DNA a RNA poté kódují jednu aminokyselinu následně vzniklého proteinu. Zdroj: Wikimedia Commons

Léčba ušitá na míru

To, co dělá každého člověka unikátního, jsou jemné rozdíly v písmenkách genomu. Konkrétní variantu genu nazýváme jako alela, ta ovšem může mít ještě různé odlišnosti zvané polymorfismy, případně mutace, pokud jsou vzácné. Alely, polymorfismy a mutace jednotlivých genů (a jejich součinnost) nám umožňují odlišnost, být malí, velcí, mít modré nebo hnědé oči. Některé variantu genu (ať už polymorfismy nebo mutace) ale mohou způsobovat různá onemocnění, která jsou v mnohých případech vážná a neléčitelná.

„Když v budoucnu přečteme něčí genetickou informaci, budeme schopni najít všechny varianty a odlišnosti v DNA daného člověka, což můžeme využít například pro jeho lepší a účinnější léčbu. Dokončení sekvence celého lidského genomu je jako bychom si nasadili nové brýle. Teď najednou vidíme všechno jasně, čímž jsme už jen krůček od toho, abychom porozuměli, proč to tak je a jak to celé funguje,“ vysvětluje Adam Phillippy, vědec z NHGRI.

Publikace vzniklé z projektu:
Sergey Nurk et al. The complete sequence of a human genome. Science, 2022; 376 (6588): 44
Ariel Gershman et al. Epigenetic patterns in a complete human genome. Science, 2022; 376 (6588)
Mitchell R. Vollger et al. Segmental duplications and their variation in a complete human genome. Science, 2022; 376 (6588)
Savannah J. Hoyt et al. From telomere to telomere: The transcriptional and epigenetic state of human repeat elements. Science, 2022; 376 (6588)
Sergey Aganezov et al. A complete reference genome improves analysis of human genetic variation. Science, 2022; 376 (6588)
Nicolas Altemose et al. Complete genomic and epigenetic maps of human centromeres. Science, 2022; 376 (6588)
Zdroj: ScienceDaily
Úvodní obrázek: Wikimedia Commons