„Polski” ChatGPT? Naukowcy z Politechniki Wrocławskiej pracują nad polską wersją popularnego narzędzia opracowanego przez firmę OpenAI. Ma ona być uzupełniona o materiałem w języku polskim oraz o dane związane z polskim kontekstem społeczno-kulturalnym. Testowa wersja ma pojawić się w przyszłym roku.
ChatGPT to uruchomiony w grudniu 2022 r. generatywny transformer językowy stworzony przez firmę OpenAI, który teoretycznie jest w stanie odpowiedzieć na każde zadane mu pytanie, zachowując przy tym wysoką poprawność językową. O polski kontekst uzupełnią go naukowcy z konsorcjum CLARIN-PL na Wydziale Informatyki i Telekomunikacji Politechniki Wrocławskiej.
Rozwiązania dla Polaków
Z dużych modeli językowych o otwartym kodzie źródłowym korzystają wszyscy, także naukowcy. Takim rozwiązania pozwalają na zaawansowane prace. Mogą być wykorzystywane do przeróżnych zadań, jak chociażby generowanie tekstu, edycję tekstu, rozmowę z użytkownikiem, tworzenie streszczeń czy tłumaczenia.
– W strategii naszej uczelni badania związane ze sztuczną inteligencją są wpisane na pierwszym miejscu jako główny kierunek rozwoju. Trzeba przy tym pamiętać, że sztuczna inteligencja może mieć rozmaite zastosowania, a kto inny, jeśli nie uczelnia, powinien dążyć do tego, żeby były one jak najbardziej pozytywne – przyznał cytowany na stronach internetowych uczelni dr hab. inż. Tomasz Kajdanowicz, prof. uczelni, kierownik Katedry Sztucznej Inteligencji.
Naukowcy z Pwr już kilka miesięcy temu przygotowali polskie okienko dialogowe dla ChatGPT, co pozwala rozmawiać z chatbotem za pośrednictwem polskiej strony. Dzięki temu użytkownicy z naszego kraju mają łatwiejszy dostęp do amerykańskiej aplikacji, a badacze zdobywają bazę zapytań do czatu i informacje, czego w tych odpowiedziach brakuje.
CLARIN-PL
W ramach projektu CLARIN-PL uczeni od lat badają technologie językowe, co zaowocowało powstaniem infrastruktury badawczej wykorzystywanej głównie w obszarach nauk humanistycznych i społecznych. Ostatnie lata zdominowały badania nad wieloma zróżnicowanymi bazami danych i bazami do przetwarzania języka naturalnego.
– W ten sposób wpisaliśmy się w to, co jest obecnie symbolem sztucznej inteligencji, czyli wielkie modele językowe. Doszliśmy również do wniosku, że konieczne jest stworzenie wielkiego polskiego modelu językowego, który w przyszłości byłby podstawą do opracowania takich rozwiązań jak polski ChatGPT – wyjaśnił na stronach Pwr dr hab. inż. Maciej Piasecki, prof. uczelni, koordynator konsorcjum naukowego CLARIN-PL.
Badacz dodał, że obecnie modele językowe zaczynają kształtować język i coraz więcej treści jest generowanych właśnie przez tego typu rozwiązania. – Chcielibyśmy, żeby nasz model bardzo dobrze oddawał specyfikę języka polskiego i pozytywnie na niego oddziaływał – zaznaczył prof. Maciej Piasecki dodając jednocześnie, że pojawiła się koncepcja utworzenia konsorcjum badawczego, w którego skład weszłaby jak największa liczba podmiotów naukowych oraz prywatnych przedsiębiorstw. Dodał również, że w powstający projekt zaangażowany jest już resort Cyfryzaji oraz Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy.
W ramach planowanych badań naukowcy chcą zebrać wszelkie dostępne zasoby językowe oraz wiedzę dotyczącą budowy wielkich modeli językowych i opracować rozwiązanie, które będzie dostępne dla wszystkich zainteresowanych osób.
Więcej na temat projektu na stronach Politechniki Wrocławskiej.
Źródło: PWr, fot. Pixnio/ CC0