Dodano: 29 lipca 2022r.

Sztuczna inteligencja przewiduje kształt prawie każdego znanego nauce białka

Algorytm AlphFold określił prawdopodobne struktury prawie wszystkich znanych nauce białek. Obejmuje to około 200 milionów białek z prawie każdego znanego organizmu na Ziemi, którego genom został zsekwencjonowany. Przełom ten może umożliwić szybsze opracowywanie nowych leków, pomóc w walce z malarią czy opornością na antybiotyki i odpadami z tworzyw sztucznych.

Sztuczna inteligencja przewiduje kształt prawie każdego znanego nauce białka

 

System sztucznej inteligencji AlphFold rozszyfrował strukturę praktycznie każdego znanego nauce białka, torując drogę do rozwoju nowych leków lub technologii, które mogą pomóc sprostać globalnym wyzwaniom, takim jak głód czy zanieczyszczenie środowiska. Od dziś określenie trójwymiarowego kształtu konkretnego białka będzie tak proste, jak wpisanie odpowiednich słów w wyszukiwarkę Google.

AlphaFold to sztuczna inteligencja opracowana przez zespół z DeepMind. To firma powiązana z Google i ma spore osiągnięcia w tworzeniu zaawansowanych algorytmów. Kilka lat temu ich program AlphaGo kilkukrotnie rozgromił mistrza gry w Go (więcej na ten temat w tekście: Sztuczna inteligencja ponownie pobiła mistrza Go i przechodzi na emeryturę). Inna z ich sztucznych inteligencji, znana jako AlphaStar, okazała się lepsza od 99,8 proc. graczy w strategicznej grze w czasie rzeczywistym StarCraft II (więcej na ten temat w tekście: Sztuczna inteligencja AlphaStar pokonała 99,8 proc. graczy w StarCraft 2). Jednak osiągnięcie AlphaFold bije na głowę dobre wyniki w grach.

AlphaFold udostępnia strukturę 200 mln białek

Białka są budulcem życia. Są zbudowane z łańcuchów aminokwasów i złożone w skomplikowane kształty, a ich trójwymiarowa struktura w dużej mierze determinuje ich funkcję. Są odpowiedzialne za większość tego, co dzieje się wewnątrz komórek. Organizm ludzki wykorzystuje dziesiątki tysięcy różnych białek, z których każde składa się z kilkudziesięciu do nawet wielu setek aminokwasów. Kolejność ułożenia tych aminokwasów dyktuje ich funkcjonowanie. Większość leków projektuje się z wykorzystaniem informacji strukturalnych, a dokładne mapy są często pierwszym krokiem do odkrycia sposobu działania białek.

Od kilku dekad naukowcy starali się przewidzieć, w jaki sposób białka osiągają swoją trójwymiarową strukturę. Brzmi banalnie, ale nie jest to łatwy do rozwiązania problem. Astronomiczna liczba potencjalnych konfiguracji jest tak zadziwiająco duża, że ​​naukowcy zajmujący się problemem wskazywali, iż zbadanie wszystkich możliwych konfiguracji zajmie więcej czasu niż wiek Wszechświata.

Poznanie trójwymiarowej struktury białka pozwala zrozumieć, jak ono działa i jak zmienić jego zachowanie. Chociaż DNA dostarcza instrukcji tworzenia łańcucha aminokwasów, przewidywanie, w jaki sposób wchodzą one w interakcje, tworząc trójwymiarowy kształt, do niedawna było bardzo trudne. Z tego też powodu naukowcy rozszyfrowali tylko ułamek z około 200 milionów białek znanych nauce.

Pod koniec 2020 roku AlphaFold dokonała gigantycznego kroku w rozwiązaniu jednego z największych wyzwań w biologii - określenia trójwymiarowego kształtu białka na podstawie jego sekwencji aminokwasów. Od tego czasu algorytmy analizują kody genetyczne każdego organizmu, którego genom został zsekwencjonowany i przewidują struktury setek milionów białek.

Kilka miesięcy po ogłoszeniu wyników AlphaFold, zespół z DeepMind opublikował w otwartej bazie danych struktury białkowe dla 20 gatunków – w tym prawie wszystkich 20 tys. ludzkich białek. Teraz sztuczna inteligencja zakończyła pracę i wypuściła katalog przewidywanych struktur dla ponad 200 milionów białek, obejmujących prawie każde znane białko na planecie!

Dane opracowane przez algorytmy zostaną udostępnione publicznie. Baza działa na podobnej zasadzie co wyszukiwarka Google. Generuje bardzo dokładne prognozy kształtu 3D białek. Dostarcza również informacji o dokładności swoich prognoz, dzięki czemu naukowcy wiedzą, na czym mogą polegać.

"Cały Wszechświat białek"

- Zasadniczo można myśleć o tym, że katalog ten obejmuje cały Wszechświat białek. Obejmuje przewidywane struktury dla roślin, bakterii, zwierząt i wielu innych organizmów, otwierając przed AlphaFold ogromne nowe możliwości wywierania wpływu na ważne kwestie, takie jak zrównoważony rozwój, bezpieczeństwo żywnościowe czy różne choroby – powiedział Demis Hassabis, założyciel i dyrektor generalny DeepMind. - Jesteśmy na początku nowej ery biologii cyfrowej - dodał.

Naukowcy już wykorzystują niektóre z wcześniejszych prognoz, aby pomóc w opracowywaniu nowych leków. W maju badacze pod kierunkiem prof. Matthew Higginsa z Uniwersytetu Oksfordzkiego ogłosili, że wykorzystali modele AlphaFold, aby pomóc określić strukturę kluczowego białka pasożyta malarii i ustalić, gdzie prawdopodobnie będą się wiązać przeciwciała, które mogą blokować przenoszenie pasożyta.

- Wcześniej używaliśmy techniki zwanej krystalografią rentgenowską, aby ustalić, jak wygląda ta cząsteczka, ale ponieważ jest dość dynamiczna i porusza się, po prostu nie mogliśmy się z nią uporać – powiedział Higgins. - Kiedy wzięliśmy modele AlphaFold i połączyliśmy je z naszymi eksperymentalnymi dowodami, nagle wszystko nabrało sensu. Struktura ta zostanie teraz wykorzystana do zaprojektowania ulepszonych szczepionek, które indukują najsilniejsze przeciwciała blokujące transmisję - dodał.

Modele AlphaFold są również wykorzystywane przez naukowców z Centrum Innowacji Enzymów na Uniwersytecie w Portsmouth do identyfikacji enzymów ze świata naturalnego, które można by dostosować do recyklingu tworzyw sztucznych. - Przejście przez tę ogromną bazę danych struktur zajęło nam dość dużo czasu, ale otworzyliśmy całą gamę nowych trójwymiarowych kształtów, których nigdy wcześniej nie widzieliśmy, a które mogłyby faktycznie rozkładać tworzywa sztuczne – powiedział prof. John McGeehan.

Dotychczasowe metody

Przez dziesięciolecia naukowcy rozszyfrowali trójwymiarowe struktury białek za pomocą technik eksperymentalnych, takich jak krystalografia rentgenowska lub mikroskopia krioelektronowa. Ale takie metody trwają miesiące, a nawet lata i nie zawsze działają. Dzięki nim opracowano struktury i zrozumiano funkcje tylko dla około 170 tys. z ponad 200 milionów białek odkrytych w różnych formach życia.

Pierwsze kompletne struktury białek określono w latach 50. XX wieku, przy użyciu krystalografii rentgenowskiej. To dzięki tej technice ustalono lwią część struktur białkowych. Jednak w ciągu ostatniej dekady mikroskopia krioelektronowa stała się ulubionym narzędziem wielu laboratoriów biologii strukturalnej.

W latach 60. XX wieku naukowcy zdali sobie sprawę, że gdyby mogli wyliczyć wszystkie indywidualne interakcje w obrębie sekwencji białka, mogliby przewidzieć jego trójwymiarowy kształt. Przy setkach aminokwasów w białku i wielu sposobach interakcji każdej pary aminokwasów, liczba możliwych struktur na sekwencję jest ogromna. Oczywiście wzrok badaczy padł na komputery, ale wczesne próby ich wykorzystania do przewidywania struktur białek w latach 80. i 90. przyniosły słabe wyniki.

Według Europejskiego Laboratorium Biologii Molekularnej (EMBL), z którym DeepMid współpracuje, około 35 proc. prognoz z opracowanego właśnie katalogu jest bardzo dokładne, co oznacza, że ​​są one tak dobre, jak struktury określone eksperymentalnie. Kolejne 45 proc. uznano za wystarczająco pewne, aby można było na nich polegać w wielu zastosowaniach.


 

Źródło: Science, New Scientist, The Guardian, fot. DeepMind. Na zdjęciu struktura białka witellogeniny — prekursora żółtka jaja — zgodnie z przewidywaniami AlphaFold.