Grupa naukowców zrzeszona w konsorcjum Telomere-to-Telomere (T2T) opublikowała pierwszą kompletną, pozbawioną luk sekwencję ludzkiego genomu. Wiedza ta ma kluczowe znaczenie dla zrozumienia podstaw różnych chorób, zmienności genetycznej człowieka czy ewolucji.
W sześciu artykułach opublikowanych łamach pisma „Science” (DOI: 10.1126/science.abj6987, DOI: 10.1126/science.abj5089, DOI: 10.1126/science.abj6965, DOI: 10.1126/science.abk3112, DOI: 10.1126/science.abl3533, DOI: 10.1126/science.abl4178) naukowcy opisali żmudną pracę nad odczytaniem genomu człowieka. Prace te wykonano w ramach konsorcjum Telomere-to-Telomere (T2T – nazwa zaczerpnięta od końcówek chromosomów), w skład którego weszli badacze m.in. z National Human Genome Research Institute (NHGRI), które jest częścią National Institutes of Health, naukowcy z University of California w Santa Cruz oraz z University of Washington w Seattle. Badaniami kierował Adam Phillippy z National Institutes of Health.
Nowe metody
Pierwsze publikacje na temat odczytania genomu człowieka ukazały się ponad 20 lat temu. Było to ogromne osiągnięcie i stali za tym badacze skupieni w Human Genome Project. Odszyfrowany genom obejmował większość regionów kodujących białka, ale brakowało około ośmiu procent genomu do zsekwencjonowania. Potrzeba było dwóch kolejnych dekad, by poznać ludzki genom w całości. Trudności polegały przede wszystkim na tym, że brakujące osiem proc. to powtarzające się fragmenty DNA, które trudno dopasować do reszty. Ówczesne technologie sobie z tym nie radziły.
Jednak przez te 20 lat nastąpił znaczny postęp w metodach sekwencjonowania. Tysiące badaczy z różnych instytucji rozsianych po całym świecie opracowało lepsze narzędzia laboratoryjne, metody obliczeniowe i podejścia do rozszyfrowania złożonej sekwencji. Pomogła przy tym specjalna linia komórkowa, która ma dwie identyczne kopie każdego chromosomu, w przeciwieństwie do większości komórek ludzkich, które mają dwie nieco różne kopie.
Do niedawna sekwencjonowanie polegało na rozbiciu na mniejsze kawałki całości genomu i odczytaniu tych mniejszych fragmentów. Jednak stosowanie tej metody pozostawia pewne luki w zmontowanych sekwencjach genomu. Ponieważ sekwencje te są powtarzalne i zawierają wiele zduplikowanych regionów, próbę ułożenia ich w odpowiednich miejscach można porównać do układanie puzzli, w których wszystkie elementy mają ten sam kształt i nie mają obrazu z przodu.
Postęp
Maszyny sekwencjonujące i oprogramowanie do składania genomu nie mogły przedrzeć się przez obszary, w których sekwencja DNA zawierała wysoce powtarzalne odcinki. Powtórzenia można było łatwo pominąć lub niepoprawnie połączyć, co kumulowało błędy. Wraz z rozwojem technologii sekwencjonowania i spadkiem kosztów naukowcy zmniejszyli liczbę luk lub nieprawidłowo złożonych sekwencji, czego kulminacją było opublikowanie w 2017 r. genomu referencyjnego zwanego GRCh38. Stał się one dla wielu podstawą pracy i odniesieniem, ale nadal zawierał luki.
Jednak w ciągu ostatniej dekady pojawiły się nowe technologie sekwencjonowania, które pozwoliły na analizę znacznie większych odcinków DNA, co pozwoliło na odkrycie wcześniej niedostrzeżonych fragmentów.
Metoda sekwencjonowania DNA nazywana Oxford Nanopore może odczytać do 1 miliona liter DNA w jednym odczycie, jednak dokładność tej technika nie jest najwyższa. Ale inna metoda – PacBio HiFi – może odczytać około 20 tys. liter z niemal idealną dokładnością. Naukowcy z konsorcjum T2T wykorzystali obie metody sekwencjonowania DNA do wygenerowania pełnej sekwencji genomu ludzkiego.
Ludzki genom poznany
Nowy genom referencyjny, nazwany T2T-CHM13, zostanie udostępniony publicznie. – Wygenerowanie naprawdę kompletnej sekwencji ludzkiego genomu jest niesamowitym osiągnięciem naukowym, dostarczającym pierwszego kompleksowego obrazu naszego DNA – powiedział dr Eric Green, dyrektor NHGRI. – Te fundamentalne informacje wzmocnią wiele trwających wysiłków zmierzających do zrozumienia wszystkich funkcjonalnych niuansów ludzkiego genomu – dodał.
– Odkąd mieliśmy pierwszy szkic sekwencji ludzkiego genomu, określenie dokładnej sekwencji złożonych regionów genomu było wyzwaniem – powiedział dr Evan Eichler z University of Washington School of Medicine i współprzewodniczący konsorcjum T2T. – Jestem podekscytowany, że udało nam się wykonać to zadanie. Kompletny genom zrewolucjonizuje sposób, w jaki myślimy o zmienności genomu człowieka, chorobach i ewolucji – dodał.
Naukowcy zauważyli, że większość nowo dodanych sekwencji DNA znajduje się w pobliżu powtarzających się telomerów (długie końce każdego chromosomu) i centromerów (gęste środkowe sekcje każdego chromosomu). Wcześniej nieczytelne sekwencje genomu, które teraz zostały ustawione we właściwym miejscu i kolejności, mają kluczowe znaczenie dla zrozumienia pełnego spektrum zmienności genomu człowieka i zrozumienia wkładu genetycznego w niektóre choroby.
Kompletna wersja składa się z 3,055 mld par zasad, które składają się na ludzki genom. Badacze poznali też 1900 nieznanych wcześniej genów. Wykorzystali również kompletną już sekwencję genomu jako do odkrycia ponad 2 milionów dodatkowych wariantów w ludzkim genomie. Badania te dostarczają dokładniejszych informacji o wariantach genomowych w 622 medycznie istotnych genach.
Zwiastun nowej ery
– W przyszłości, gdy ktoś zsekwencjonuje swój genom, będziemy w stanie zidentyfikować wszystkie warianty w jego DNA i wykorzystać te informacje, aby lepiej pokierować jego opieką zdrowotną – powiedział dr Phillippy. – Prawdziwe zakończenie sekwencji ludzkiego genomu to jak założenie nowej pary okularów. Teraz, gdy wszystko widzimy wyraźnie, jesteśmy o krok bliżej zrozumienia, co to wszystko oznacza – dodał.
Części genomu z wieloma powtarzającymi się odcinkami obejmują te, w których występuje większość ludzkiej zmienności genetycznej. Zmienność w tych regionach może również dostarczyć kluczowych wskazówek na temat tego, jak nasi przodkowie przeszli gwałtowne zmiany ewolucyjne, które doprowadziły do do tego, kim obecnie jesteśmy. Podczas sekwencjonowania każdego centromeru dowiedzieli się, że zduplikowane regiony różnią się znacznie pod względem wielkości, co było dość nieoczekiwane.
– Uważamy, że podczas badań tych nowych części genomu, pojawi się zmienność genetyczna przyczyniająca się do wielu różnych cech i ryzyka chorób – powiedział Rajiv McCoy z Johns Hopkins University, członek konsorcjum T2T. – Ogólnie rzecz biorąc, to nie wiemy jeszcze, czego nie wiemy – dodał.
Źródło: Science, National Institutes of Health, Rockefeller University, National Human Genome Research Institute, fot.