Izraelscy naukowcy wykorzystali sztuczną inteligencję (SI) do przetłumaczenia tekstów zapisanych pismem klinowym na język angielski. Opracowany przez badaczy model SI może pomóc odczytać tysiące glinianych tabliczek zapisanych w języku nieużywanym już od około dwóch tysięcy lat.
Odczytywanie starożytnego pisma nie jest prostym zadaniem. Potrzeba do tego dużej wiedzy. Ale przede wszystkim czasu. Aby przyspieszyć ten proces naukowcy z Uniwersytetu w Tel Awiwie i Uniwersytetu Ariel opracowali model sztucznej inteligencji (SI), który potrafi przetłumaczyć trudny do rozszyfrowania język akadyjski zapisywany pismem klinowym.
Wyniki i rezultaty prac izraelskich badaczy ukazały się na łamach pisma „PNAS Nexus” (DOI: 10.1093/pnasnexus/pgad096).
Setki tysięcy glinianych tabliczek
Jednym z niewątpliwie trudniejszych do przetłumaczenia jest język akadyjski zapisywany pismem klinowym. Posługiwano się nim głównie na terenie Mezopotamii, której znacząca część znajduje się obecnie na terytorium Iraku. Jednym z narodów, które posługiwały się takim właśnie pismem byli Asyryjczycy. Nazwa ich państwa – Asyria – wiązana jest przede wszystkim z imieniem ich boga, Aszura, zaś znajdowało się ono głównie na Nizinie Mezopotamskiej. W 721 roku p.n.e. Asyria położyła kres istnieniu Królestwa Izraela, biorąc jeńców, którzy zostali przesiedleni na Nizinę Mezopotamską.
Na tym obszarze archeolodzy odnaleźli setki tysięcy tabliczek zapisanych pismem klinowym. Najstarsze sięgają nawet 3 400 roku p.n.e. Są one dla nas szczególnie istotne, ponieważ zawierają bezcenne informacje o politycznej, gospodarczej, społecznej, jak i naukowej historii Mezopotamii. Ich odczytanie jest oczywiście możliwe, natomiast zazwyczaj jest to proces niezwykle mozolny. Wymaga on zaangażowania ekspertów znających nie tylko starożytne języki, ale i posiadających gruntowną wiedzę o tym, jak wyglądało życie w tamtych czasach. A że grupa takich ekspertów jest niewielka – większość znalezionych tabliczek do tej pory pozostaje nieprzetłumaczona.
Sztuczna inteligencja kontra pismo klinowe
Tym, co może sprawić, że uda się przyśpieszyć proces tłumaczenia tabliczek zapisanych pismem klinowym może okazać się sztuczna inteligencja. Dowodzą tego ostatnie próby przeprowadzone przez izraelskich naukowców przy wykorzystaniu SI, która „uczy się” tłumaczyć język akadyjski na angielski. Postanowiono jednak „zaprogramować” ją dwutorowo: jeden jej wariant dokonuje tłumaczenia ze słów odzwierciedlających pismo klinowe, ale napisanych alfabetem łacińskim (transliteracja), natomiast drugi – w oparciu o analogiczne przełożenie, ale zapisane w standardzie unicode.
Rozwiązanie to okazało się dość skuteczne, aczkolwiek wersja pracująca w oparciu o litery łacińskie radziła sobie z tym zadaniem nieco lepiej, uzyskując w punktacji Best Bilingual Evaluation Understudy 4 (BLEU4) rezultat na poziomie 37,47. BLEU4 jest testem zgodności pomiędzy tłumaczeniem takiego samego tekstu wykonanego przez człowieka, jak i przez SI.
Jednakże póki co i ten system tłumaczenia starożytnych tekstów asyryjskich nie jest pozbawiony wad. Generalnie najlepiej radzi sobie ze zdaniami składającymi się ze 118 liter lub krótszymi. Zdarzały się natomiast sytuacje, w których – jak określili to sami naukowcy – system zaczynał mieć „halucynacje”, tworząc sformułowania, które co prawda pod względem składniowym były prawidłowe, ale nie odzwierciedlały sensu danego zdania. Wydaje się zatem, że jak na razie rozwiązanie to będzie mogło jedynie być stosowane jako „pierwsze podejście” do tekstu, po którym i tak konieczne będzie dokonanie niezbędnych poprawek przez redaktora-człowieka.
Źródło: The Jerusalem Post, fot. A.Davey from Portland, Oregon, EE UU, CC BY 2.0, via Wikimedia Commons