Facebook

Bułgarscy influencerzy, newsy z Gruzji, pogoda w Maroko - dzięki nowemu tłumaczowi Facebooka będziesz mógł obserwować wszystko

Konrad Kozłowski
Bułgarscy influencerzy, newsy z Gruzji, pogoda w Maroko - dzięki nowemu tłumaczowi Facebooka będziesz mógł obserwować wszystko

Napotkane posty, artykuły i wypowiedzi w językach, których nie znamy pozostają dla niedostępne zbyt często, dlatego Meta opracował nowy model tłumaczeń NLLB-200 obsługujący aż 200 języków i przewyższający skutecznością inne rozwiązania o nawet 44%.

NLLB-200 to tak naprawdę skrót od No Language Left Behind, bo tak nazywana jest inicjatywa na rzecz
rozwoju wysokiej jakości tłumaczenia maszynowego obejmującą większość języków świata. Liczba 200 odnosi się oczywiście do liczby języków, które obsługuje i wedle zapewnień Meta nowy model osiąga najlepsze wyniki w swojej klasie. Wrażenie ma robić nie tylko jakość tłumaczeń, ale właśnie szeroki wachlarz języków wspieranych przez NLLB-200, bo obsługiwane są te, z którymi najlepsze dostępne narzędzia miały nie radzić sobie zbyt dobrze lub nawet wcale. Dla porównania zwrócono uwagę na języki afrykańskie, których NLLB-200 obsługuje 55, a a nie jak konkurencja, która wspiera tylko 25 takich języków.

NLLB-200, czyli nowa jakość tłumaczeń automatycznych na Facebooku, Instagramie i Wikipedii

Ale dla nas najważniejsza jest jakość najczęściej używanych języków i tutaj NLLB-200 ma średnio przewyższać pozostałe narzędzia o 44%. By to sprawdzić, skorzystano z bazy porównawczej FLORES-101 i ocen BLEU. Dla innych zakątków świata to także dobra wiadomość, bo w przypadku niektórych indyjskich i afrykańskich języków NLLB-200 ma mieć nawet 70% przewagę. Ale jakie tego będą wymierne efekty dostępne dla każdego użytkownika?

Cała zdobyta wiedza, techniki i wnioski z projektu wpłyną na ulepszenie i rozbudowania tłumaczeń na Facebooku, Instagramie i Wikipedii. W każdym z tych przypadków liczba treści przekracza możliwości kogokolwiek, kto mógłby zapewnić tłumaczenie, dlatego prędkość i jakość automatycznego przekładania tekstu z jednego języka na drugi jest niezwykle istotna.

Modele Meta będą dostępne na zasadzie licencji open-source

Na tym jednak nie koniec, bo modele NLLB-200 będą też dostępne na zasadzie licencji open-source. Oprócz nich udostępnione zostaną FLORES-200, kod szkoleniowy modelu oraz kod umożliwiający ponowne utworzenie zestawu danych szkoleniowych. To wszystko pozwoli kolejnym ekspertom i badaczom rozwijanie narzędzi do tłumaczeń, by granicę ich możliwości przesunąć jeszcze dalej. O tym, jak przydatne, ale i niedokładne bywają tłumaczenia maszynowe przekonujemy sie każdego dnia w mediach społecznościowych, sklepach, stronach z artykułami czy napisami do filmów. Te ostatnie automatycznie tłumaczy np. YouTube. Pomyślcie tylko, jak duże możliwości dałoby połączenie automatycznego generowania i tłumaczenia napisów do filmów w Internecie.

 

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu