Dodano: 01 grudnia 2020r.

Sztuczna inteligencja rozwiązała jeden z trudniejszych problemów w biologii

Wieloletni i niezwykle złożony problem naukowy dotyczący struktury i zachowania białek został rozwiązany przez nowy system sztucznej inteligencji AlphaFold. Naukowcy z DeepMind wykazali, że stworzona przez nich sztuczna inteligencja może przewidzieć, jaki trójwymiarowy kształt utworzą białka z sekwencji aminokwasów.

Przewidywanie, jaki będzie trójwymiarowy kształt białka, stanowiło dla naukowców zagadkę od pół wieku. Możliwość dokładnego przewidywania struktur białek na podstawie ich sekwencji aminokwasów byłaby ogromnym dobrodziejstwem dla nauk przyrodniczych i medycyny. To znacznie przyspieszyłoby wysiłki na rzecz zrozumienia elementów budulcowych komórek i umożliwiłoby szybsze opracowywanie nowych leków.

Z problemem poradziła sobie sztuczna inteligencja opracowana przez zespół z DeepMind. To firma powiązana z Google i ma spore osiągnięcia w tworzeniu zaawansowanych algorytmów. Kilka lat temu ich program AlphaGo kilkukrotnie rozgromił mistrza gry w Go. Inna z ich sztucznych inteligencji, znana jako AlphaStar, okazała się lepsza od 99,8 proc. graczy w strategicznej grze w czasie rzeczywistym StarCraft II. Jednak osiągnięcie ich nowej sztucznej inteligencji – AlphaFold – bije na głowę dobre wyniki w grach.

AlphaFold

AlphaFold dokonała gigantycznego kroku w rozwiązaniu jednego z największych wyzwań w biologii - określenia trójwymiarowego kształtu białka na podstawie jego sekwencji aminokwasów. Sztuczna inteligencja opracowana przez zespół badaczy z DeepMind pokonała około 100 innych zespołów w odbywającym się co dwa lata konkursie CASP (Critical Assessment of Structure Prediction) mającym na celu opracowanie systemów zdolnych do przewidzenia trójwymiarowego kształtu białek. W konkursie zespoły badaczy otrzymują sekwencje aminokwasów dla około 100 białek i na tej podstawie mają opracować ich strukturę. Wyniki uzyskane przez zespoły są porównywane z wynikami prac laboratoryjnych.

Eksperci są pod wrażeniem pracy AlphaFold. Wskazują, że będzie to miało dalekosiężne skutki, wśród nich radykalne przyspieszenie tworzenia nowych leków. - To, co udało się osiągnąć zespołowi DeepMind, jest fantastyczne i zmieni przyszłość biologii strukturalnej i badań nad białkami - mówi Janet Thornton, emerytowana dyrektor Europejskiego Instytutu Bioinformatyki. - To problem sprzed 50 lat. Zaczynałem już myśleć, że nie zostanie on rozwiązany za mojego życia - dodaje John Moult z University of Maryland w Shady Grove i współzałożyciel CASP.

AlphaFold pierwszy raz udział w CASP wzięła w 2018 roku. W końcowej tabeli konkursu zajęła pierwsze miejsce. Ale algorytmy londyńskiego DeepMind w tym roku wprawiły wszystkich w osłupienie. Nawet konkurencja wskazywała, że AlphaFold działa tak zadziwiająco dobrze, że może zwiastować rewolucję w biologii.

- To przełom w grze. To zmieni medycynę, zmieni badania, zmieni bioinżynierię. To wszystko zmieni - podkreśla Andrei Lupas, biolog z Instytutu Biologii Rozwojowej im. Maxa Plancka w Tybindze w Niemczech, który oceniał wydajność różnych zespołów w CASP.

Problem fałdowania białek

Od około 50 lat naukowcy starają się przewidzieć, w jaki sposób białka osiągają swoją trójwymiarową strukturę. Brzmi banalnie, ale nie jest to łatwy do rozwiązania problem. Astronomiczna liczba potencjalnych konfiguracji jest tak zadziwiająco duża, że naukowcy zajmujący się problemem wskazywali, iż zbadanie wszystkich możliwych układów molekularnych zajmie więcej czasu niż wiek Wszechświata.

Białka są budulcem życia, odpowiedzialnym za większość tego, co dzieje się wewnątrz komórek. Organizm ludzki wykorzystuje dziesiątki tysięcy różnych białek, z których każde składa się z kilkudziesięciu do nawet wielu setek aminokwasów. Kolejność ułożenia w trójwymiarowej strukturze tych aminokwasów dyktuje ich funkcjonowanie. Innymi słowy, to kształt determinuje funkcje. A białka mają tendencję do przybierania kształtu bez niczyjej pomocy, kierując się wyłącznie prawami fizyki.

Znajomość tych kształtów pomaga naukowcom opracować leki, które mogą osadzać się w kieszeniach i szczelinach białek. Możliwość syntezy nowych białek o pożądanej strukturze może na przykład przyspieszyć rozwój enzymów wytwarzających biopaliwa i rozkładających odpady z tworzyw sztucznych.

Dotychczasowe metody

Przez dziesięciolecia naukowcy rozszyfrowali trójwymiarowe struktury białek za pomocą technik eksperymentalnych, takich jak krystalografia rentgenowska lub mikroskopia krioelektronowa. Ale takie metody trwają miesiące, a nawet lata i nie zawsze działają. Dzięki nim opracowano struktury i zrozumiano funkcje tylko dla około 170 tys. z ponad 200 milionów białek odkrytych w różnych formach życia.

Pierwsze kompletne struktury białek określono w latach 50. XX wieku, przy użyciu krystalografii rentgenowskiej. To dzięki tej technice ustalono lwią część struktur białkowych. Jednak w ciągu ostatniej dekady mikroskopia krioelektronowa stała się ulubionym narzędziem wielu laboratoriów biologii strukturalnej.

W latach 60. XX wieku naukowcy zdali sobie sprawę, że gdyby mogli wyliczyć wszystkie indywidualne interakcje w obrębie sekwencji białka, mogliby przewidzieć jego trójwymiarowy kształt. Przy setkach aminokwasów w białku i wielu sposobach interakcji każdej pary aminokwasów, liczba możliwych struktur na sekwencję jest ogromna. Oczywiście wzrok badaczy padł na komputery, ale wczesne próby ich wykorzystania do przewidywania struktur białek w latach 80. i 90. przyniosły słabe wyniki.

CASP

W 1994 roku Moult i jego koledzy wystartowali z CASP. W ramach zawodów, choć Moult woli CASP nazywać eksperymentem, uczestnicy mają za zadanie określenie prawidłowej struktury około 100 nieznanych jeszcze białek, na podstawie sekwencji aminokwasów. W CASP wyniki podawane są w skali od zera do 100, a rezultat powyżej 90 jest traktowany na równi z metodami eksperymentalnymi. Do 2016 roku konkurujące ze sobą grupy osiągały wyniki dla bardziej złożonych białek w okolicach 40 punktów. Głównie poprzez wyciąganie wniosków ze znanych struktur białek.

Kiedy DeepMind po raz pierwszy wystartował w zawodach w 2018 roku, jego algorytm AlphaFold opierał się na podobnej strategii porównawczej. Ale sztuczna inteligencja wykorzystywała również inne podejście zwane głębokim uczeniem (deep learning). Uczyła się na ogromnych zbiorach danych - w tym przypadku na sekwencjach i strukturach poznanych już białek. Uczyła się też dostrzegać wzorce. W 2108 roku DeepMind wygrał z łatwością, pokonując konkurencję średnio o 15 proc. na każdej strukturze i zdobywając wyniki 60 punktów dla najbardziej złożonych białek.

Jednak prognozy te nie było zbyt dokładne. By poprawić przewidywania AlphaFold John Jumper, który kieruje rozwojem sztucznych inteligencji w DeepMind, połączył głębokie uczenie z algorytmem naśladującym sposób, w jaki człowiek układa puzzle: najpierw łączenie elementów w małe grupy - w tym przypadku skupiska aminokwasów - a następnie szukanie sposobów połączenia mniejszych grup w większą całość. AlphaFold z nowym założeniami przeszła szkolenie na banku danych zawierającego około 170 tys. struktur białkowych.

Zwiastun rewolucji

Nowa taktyka i szkolenie zaaplikowane AlphaFold przez uczonych z DeepMind przyniosło rezultaty. W tegorocznym CASP AlphaFold osiągnęła średni wynik 92,4. Choć algorytm radził sobie raz lepiej, raz gorzej, około 2/3 przewidywań nie różniło się od wyników uzyskiwanych czasochłonnymi metodami laboratoryjnymi.

Ten nieprawdopodobny wynik zwrócił uwagę organizatorów konkursu na ewentualną próbę oszustwa ze strony DeepMind. Lupas postawił więc przed AlphaFold szczególne wyzwanie: białko błonowe starożytnej grupy drobnoustrojów. Zespół Lupasa próbował wszystkich sztuczek, by uzyskać strukturę tego białka. Ich badania trwały 10 lat i nic. Ale AlphaFold nie miał żadnych problemów z zadaniem. Zwrócił szczegółowy obraz trzyczęściowego białka z dwoma długimi, spiralnymi ramionami pośrodku w około pół godziny.

Jako warunek przystąpienia do CASP, DeepMind - podobnie jak wszystkie inne zespoły - zgodziło się ujawnić wystarczająco szczegółowe informacje o swojej metodzie, aby inne grupy mogły ją odtworzyć. To daje ogromne możliwości badaczom, którzy będą w stanie wykorzystać dokładne przewidywania struktury, aby nadać sens nieprzejrzystym danym rentgenowskim. Może również umożliwić projektantom leków szybkie ustalenie struktury każdego białka w nowych i niebezpiecznych patogenach, takich jak SARS-CoV-2, co może okazać się kluczowym krokiem w poszukiwaniu molekuły, która zablokuje koronawirusa.

Osiągnięcia AlphaFold są spektakularne, ale sztuczna inteligencja ma pewnie niedociągnięcia. W konkursie zauważono potknięcia przy określaniu struktury z aminokwasów, które zniekształcają nawzajem swoje pozycje podczas składania. Jumper chce wyszkolić AlphaFold w rozwiązywaniu takich właśnie struktur, a także kompleksów białek, które współpracują ze sobą, aby pełnić kluczowe funkcje w komórce.

- To jeszcze nie koniec. To początek wielu nowych rzeczy - mówi Thornton.

Źródło: Science, Nature, fot. DeepMind