Dodano: 01 maja 2017r.

Poszukiwania nowych leków: zdając się na "wyobraźnię komputerów"

Komputer wyposażony w odpowiednie oprogramowanie jest w stanie zauważyć skomplikowane zależności, których ludzki umysł nigdy by nie dostrzegł. Tylko pozwólmy maszynie znaleźć reguły - mówi w rozmowie z PAP dr Rafał Kurczab, który w poszukiwaniu nowych leków używa algorytmów uczenia maszynowego.

Pigułki

 

Uczenie maszynowe (ang. machine learning) to koncepcja zakładająca, że zamiast programować komputery do wykonywania konkretnych zadań – jak podchodzono do tego wcześniej – można zaprogramować je tak, aby rozpoznawały skomplikowane wzorce i doskonaliły swoje działanie w oparciu o zdobyte wcześniej dane.

To dzięki uczeniu maszynowemu wyszukiwarka Google jest coraz skuteczniejsza i uczy się, czego potrzebują od niej użytkownicy. I wystarczy czasem nawet kilka liter, aby "domyśliła się”, czego szukamy. Uczenie maszynowe coraz lepiej spisuje się też w pracy banków, sieci handlowych czy firm marketingowych - by precyzyjnie analizować potrzeby klientów, bazując na ich wcześniejszych działaniach.

Selekcja niezbyt naturalna

Ale uczenie maszynowe stosowane jest też przez naukowców. - Ja np. używam algorytmów uczenia maszynowego, aby szukać nowych związków aktywnych biologicznie - mówi w rozmowie z PAP dr Rafał Kurczab z Instytutu Farmakologii PAN w Krakowie. Dodaje, że algorytmy uczenia maszynowego pomagają zoptymalizować dobór reagentów w syntezie chemicznej, co w konsekwencji pozwala na efektywniejsze poszukiwanie nowych związków aktywnych biologicznie.

- Za pomocą sztucznej inteligencji możemy szybciej i sprawniej przeszukiwać duże bazy danych - zawierające informacje o milionach związków, które zostały już zsyntezowane, albo które można wytworzyć - opowiada dr Kurczab.

Podaje przykład, że koledzy z Uniwersytetu Jagiellońskiego poprosili go o wyselekcjonowanie związków, jakie można przygotować z dostępnych na rynku odczynników chemicznych, które najskuteczniej działałyby na pewien konkretny cel biologiczny. - Gdybyśmy wzięli wszystkie reagenty, które pasują do tej reakcji, to można by otrzymać ponad 51 mln różnych związków. A my stosując różne modele otrzymaliśmy listę 100 związków, które mogły być najbardziej skuteczne. Współpracownicy z UJ zsyntezowali je, a 80 z nich rzeczywiście było aktywnych - opisuje dr Kurczab.

Zadania, z jakimi mierzą się algorytmy, mogą być różne. Czasami pokazuje się algorytmowi miejsce wiązania w receptorze, które ma konkretny kształt. I algorytm wyszukuje związek, który w ten kształt się może dobrze wpasować. Czasem z kolei znane są tylko związki, które na dany receptor działają i trzeba znaleźć do nich podobne, mimo że struktura samego receptora często jest nieznana.

- Chemikowi wystarczyłaby kartka z rysunkiem związku. On już będzie wiedział, jak szukać związków podobnych. A komputer musi po swojemu zrozumieć, czym taki związek jest - opowiada naukowiec. I opisuje, że w poszukiwaniu nowych związków chemicznych algorytmy korzystać mogą z przestrzeni liczących setki wymiarów.

Nowe wymiary badań

Położenie punktu w trójwymiarowej przestrzeni opisywane jest trzema zmiennymi. Ale dlaczego kończyć na trzech danych? Obiekty można przecież opisywać mnóstwem różnych zmiennych, czyli "wymiarów". Jeśli np. chodzi o związki chemiczne, na jednej osi może być np. określana długość łańcucha węglowodorowego, na innej - obecność pierścienia aromatycznego, na kolejnych - obecność różnych pierwiastków czy grup funkcyjnych itp. Algorytmy uczenia maszynowego są w stanie skleić te dane i „zobaczyć” w nich wielowymiarowy kształt, który niesie wiele cennych informacji.

Zadaniem algorytmu będzie teraz wyszukanie w bazie kształtów podobnych. - Człowiek, nawet gdyby nad tymi danymi siedział bardzo długo, nie jest w stanie ich efektywnie analizować. Po prostu zaczyna brakować mu wyobraźni - mówi dr Kurczab.

Dobra karma

- Na początku "karmimy" algorytm danymi wejściowymi - o związkach, o których wiemy, że są aktywne - opowiada rozmówca PAP. Wyjaśnia, że komputer sam sobie ma znaleźć między tymi związkami podobieństwo i określić łączące je cechy. A potem program wyszukuje obiekty o podobnej charakterystyce.

- Algorytmy uczenia maszynowego są w stanie wykonywać polecone im zadanie w bardzo abstrakcyjny sposób - mówi chemik. I opowiada, że programy takie często wskazują w bazie obiekty, których podobieństwo do związków referencyjnych wcale nie jest oczywiste. A mimo to ich wybór w wielu wypadkach okazuje się strzałem w dziesiątkę.

Dr Kurczab używa algorytmów uczenia maszynowego do poszukiwania nowych leków. Ale zaznacza, że z algorytmów tych, używanych coraz chętniej w różnych sferach życia, mogą korzystać badacze z wielu różnych dziedzin. - Darmowe oprogramowanie dostępne jest w sieci. Mogą z niego korzystać np. chemicy, biolodzy, psychologowie i wszyscy ci, którzy muszą przetwarzać w swojej pracy duże i skomplikowane zbiory danych - opowiada.

 

Źródło: PAP – Nauka w Polsce, Ludwika Tomala, fot. Ragesoss/CC 3.0/Wikimedia Commons