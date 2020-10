Ginący świat

Dzisiejszy, coraz szybciej zmieniający się świat ma swoje ciemne strony. Rozwój przemysłu niszczy przyrodę, tempo życia wpływa niekorzystnie na naszą psychikę, a globalizacja prowadzi do zanikania języków o małym zasięgu i niewielkiej populacji nim władającej. Co więcej, na przestrzeni dziejów ten proces, choć znacznie wolniej, także zachodził pozostawiając nam dokumenty, których nie potrafimy zinterpretować. A przecież w źródłach, których nie potrafimy odczytać, kryje się napewno wiele ciekawych informacji.

Potęga algorytmu

System został stworzony pod nadzorem profesor Reginy Barzilay, wybitnej specjalistki od algorytmów, która otrzymała ostatnio nagrodę 1 mln dolarów za stworzenie narzędzi tego typu przydatnych w diagnozowaniu i leczeniu raka piersi. Napisany przez jej zespół algorytm korzysta z kluczowych zasad językoznawstwa historycznego, które zostały odkryte w ramach „ludzkich” badań nad rozwojem języków.

Jako jeden z przykładów takich prawideł podano wyraz z literą „b”, w którym w miarę rozwoju języka lub wystąpienia zapożyczenia, może zajść jej zmiana w podobne w wymowie „p”. Jednocześnie nie nastąpi raczej konwersja na zupełnie odmienne fonetycznie „k”. Na tej zasadzie, z setek podobnych zależności, stworzono rozbudowany model, który w efekcie nie dość, że potrafi rozszyfrować słowa już nie występujące, potrafi też odnajdywać związki lub ich brak pomiędzy badanymi językami.

Nie jesteście rodziną

Jako przykład takiego działania, wskazano na wynik porównania języka iberyjskiego z baskijskim, w którym system postawił diagnozę, że nie są spokrewnione, co pokrywa się z ostatnimi „klasycznymi” badaniami w tym zakresie. W związku z tym możliwe ma być częściowe odszyfrowanie języków o nieznanym pochodzeniu, algorytm jest w stanie znaleźć samodzielnie odpowiednie zależności.

Badanie na chwilę obecną skupiło się na językach należących do grup gotyckiej oraz iberyjskiej, a jako języków pomocniczych użyto jeszcze hiszpańskiego, arabskiego, węgierskiego, tureckiego, klasycznej łaciny i baskijskiego. System cały czas jest dopracowywany, ale już teraz przewyższa skutecznością konkurencyjne rozwiązania.

Rybka Babel

Nie da się ukryć, że w dziedzinie tłumaczenia języków czy to żywych, czy martwych, algorytmy są przyszłością. Zapewne za kilka lat spełni się wizja Douglasa Adamsa i pojawi się elektroniczna wersja rybki Babel z „Autostopem przez Galaktykę”. Bardzo jestem ciekaw jak to wpłynie na naszą cywilizację.

Można przypuszczać, że nauka języków stanie się w dużej mierze zbędna, co jednak może przełożyć się na mniejsze, nazwijmy to, zrozumienie kulturowe. Uczenie się języka obcego, chcąc nie chcąc, zmusza nas do nabywania umiejętności choć szczątkowego myślenia jego kategoriami, przy tłumaczeniu podanym przez maszynę, nawet najdoskonalszą, ta sfera przestanie istnieć.

Polska język, trudna język

Jak łatwo zauważyć, wśród wymienionych języków zabrakło polskiego, zaliczanego do grupy najtrudniejszych języków świata. Mam jednak nadzieję, że naukowcy podejmą rękawicę i w tej kwestii, ponieważ ktoś w końcu musi sobie dać radę z tym, aby przełożyć go na „cyfrowy” język. Kto wie, może pomoc przyjdzie z tak niespodziewanej strony, jak badanie wymarłych języków i dzięki temu doczekamy się polskiej Siri, a Asystent Google przestanie tak bardzo kaleczyć nasz język?

Zdjęcie: Bjørn Christian Tørrissen / wikipedia