Wiele dyskutuje się o tym, jak algorytmy i uczenie maszynowe zmienią nasz świat. Oczywistością są korzyści z ich stosowania w przemyśle, olbrzymią rolę odegrają w wojsku (co budzi też wiele obaw). Mało kto zwraca uwagę na to, że algorytmy pomagają nam też w odkrywaniu historii.
Uczenie maszynowe dla Indiany Jonesa
Najsłynniejszy z filmowych archeologów, Indiana Jones, z pewnością byłby zachwycony widząc, jak nowoczesne technologie wspomagają dziś jego rzeczywistych kolegów. Dzięki zaawansowanym robotom, sensorom możemy dziś badać obiekty, które kiedyś trzeba było poważnie naruszyć (czasem oznaczało to częściowe zniszczenie), aby poznać ich naturę.
Pytia z Itaki
Uczenie maszynowe pomaga nam z kolei w odtwarzaniu tekstów z obiektów, które w dużej mierze uległy zniszczeniu. W serwisie Nature pojawił się ostatnio artykuł o tym, jak korzystający z sieci neuronowych i maszynowego uczenia system Ithaca pomaga odczytywać starożytne greckie teksty zamieszczone na mocno zdewastowanych „nośnikach”.
Ithaca została stworzona na bazie technologii Google DeepMind i jej systemu rekonstrukcji teksów o nazwie Pythia. Co ciekawe, Google udostępniło całość na licencji open-source, uczelnie i naukowcy mogą wykorzystać jej kod oraz wstępnie wytrenowany model rekonstrukcyjny. Dane do treningu zostały pobrane z największego zdigitalizowanego zbioru greckich inskrypcji, stworzonego przez kalifornijski Packard Humanities Institute.
System przygotowano w ten sposób, żeby wykorzystać w nim także czynnik ludzki. Wszystkie wyniki podawane są w kilku wariantach, a Ithaca określa ich prawdopodobieństwo. Archeolodzy, historycy i językoznawcy mogą to następnie weryfikować w oparciu o swoją wiedzę. Według twórców system działa zaskakująco dobrze.
Punktem wyjścia do oceny jego skuteczności są osiągnięcia ludzkich naukowców. Ci, pracując samodzielnie, osiągali 25% skuteczności, Ithaca osiągnęła 62%, a połączone wysiłki człowieka i maszyny aż 72%. Jeśli chodzi o określanie miejsca pochodzenia, Ithaca bazując na ocenie różnych niuansów językowych ma pozwalać na 71% skuteczność, datowanie wykonywane jest z dokładnością ~30 lat.
Ateńskie dekrety
Do weryfikacji całego systemu użyto między innymi dekretów ateńskich udostępnionych w bazie PHI, których datę powstania datowano jeszcze niedawno na lata 446 - 445 p.n.e. Jednak ostatnie ustalenia naukowców przesunęły datę ich powstania na czasy około 420 p.n.e. Ithaca, pozbawiona tych ostatnich danych, samodzielnie zweryfikowała ich datę na podstawie analizy językowej na 421 p.n.e. (średnia zaproponowanych wyników).
Jeśli ta skuteczność będzie się utrzymywać wraz z kolejnymi analizowanymi tekstami, może czekać nas prawdziwy przełom w badaniach historycznych, nie tylko w kontekście starożytnej Grecji. W kolejce czekają przecież teksty innych ludów, jak choćby zawsze fascynujących amerykańskich cywilizacji prekolumbijskich.
Rewolucyjność tego rozwiązania nie polega tylko w wyższej skuteczności przy rekonstruowaniu tekstów, równie ważna może być wydajność całego procesu. Taki system da się w dużym stopniu zautomatyzować, a na bazie wstępnych interpretacji Ithaci segregować teksty pod kątem ich historycznego znaczenia. Nie dziwię się, że naukowcy są tak podekscytowani tym, co Ithaca już pokazała.
Podsumowując, opisana tu technologia ma potencjał stać się archeologiczno-historycznym odpowiednikiem obserwatorium Jamesa Webba. Jeśli zadziała, nagrodą będzie rozwiązanie wielu tajemnic z przeszłości naszej cywilizacji. Nam pozostaje czekać na pierwsze odkrycia.
Źródło: nature.com / deepmind.com
Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu