0

Google chce, aby na Wikipedii nie pisali ludzie. Ma na to sposób

Co można zrobić, aby wyręczyć ludzi z pisania artykułów na Wikipedii? Wytrenować do tego maszynę. Jak się okazuje, Google właśnie pracuje nad tym, by sztuczna inteligencja była w stanie stworzyć odpowiednio wyczerpujący i atrakcyjny dla czytelnika wpis encyklopedyczny.

Zespół zajmujący się Google Brain – projektem odpowiedzialnym za rozwój machine learningu nauczył wstępnie sztuczną inteligencję jak tworzy się artykuły encyklopedyczne. I cóż – wyniki są bardzo zróżnicowane – niektóre wpisy wyglądają naprawdę dobrze, inne natomiast wymagają tego, aby zajął się nimi człowiek. Co nie jest zaskakujące – im trudniejsze jest zagadnienie, tym większe problemy mogą pojawić się w tekście wynikowym. Zadaniem sztucznej inteligencji jest tworzenie zasadniczo krótszych, skondensowanych treści na podstawie już istniejących publikacji – Google ma w tym pewne doświadczenie tworząc tzw. „snippets”, jednak nigdy wcześniej nie próbowano zaprzęgać AI do konstruowania warstwy tekstowej.

Ale to już było. Czym różni się tekst Google Brain od tych osiągnięć innych maszyn tworzących teksty

Warto zwrócić uwagę na to, że np. Salesforce stworzyło podobny mechanizm i uzyskano całkiem dobre wyniki. Nie można jednak oprzeć się wrażeniu, że teksty konstruowane przed dotychczas stworzone mechanizmy są… mało atrakcyjne i zwyczajnie „mało sexi”. Zapewne rozumiecie, że nawet teksty encyklopedyczne powinny zostać napisane prostym, aczkolwiek atrakcyjnym dla czytelnika językiem tak, aby przyswojenie danych lub ich redystrybucja były znacznie prostsze. W przeciwnym wypadku otrzymamy fakty, fakty i tylko fakty, a ich konsumpcja będzie zwyczajnie mało ciekawa.

Google Brain musi więc nauczyć się robić dobre „skróty” encyklopedyczne i jednocześnie ubierać je w atrakcyjny dla czytelnika język. Wykorzystywane są zdania wielokrotnie złożone (tam, gdzie trzeba), łączy się konteksty i jednocześnie dba się o to, by wynikowy tekst był możliwie jak najbardziej precyzyjny.

W tym momencie jednak ludzie są znacznie lepsi w tym tworzeniu encyklopedycznych skrótów – zobaczcie, jak wygląda to na przykładzie wpisu „Wings over Kansas” – po prawej znajduje się tekst pisany przez ludzi, po lewej natomiast ten wygenerowany przez AI:

Google Wikipedia

Tekst stworzony przez Google Brain jest… dłuższy. Ten napisany przez ludzi jest znacznie precyzyjniejszy i dotyka tylko tych kwestii, które są istotne. Google Brain wiedzy o „wadze” konkretnych niuansów nie ma, więc podsumowuje dosłownie wszystko, co mu się podsuwa w materiale wejściowym. Wypracowanie w sztucznej inteligencji takiej zdolności jest trudne, bo ocena przydatności konkretnego zagadnienia wymaga swego rodzaju „refleksyjności”, a tego jeszcze AI nie jest w stanie osiągnąć. Ta służy do rozwiązywania problemów, nie do rozmyślania nad własnymi wynikami pracy.

Co to oznacza? Mniej więcej to, że o ile kiedyś zapewne uda się stworzyć naprawdę dobry mechanizm podsumowujący konkretne zagadnienia, to jeszcze przez długi czas artykuły będą pisać ludzie (ja się robotów nie obawiam), bo oni w sposób naturalny rozumieją to, jak powinien wyglądać atrakcyjny wpis na wielu płaszczyznach. Napisanie tekstu to nie tylko wykorzystanie zdolności wyłuskiwania oraz rozumienia pewnych faktów, ale również własna ocena co jest w źródle ważne i jak ubrać to w atrakcyjny dla czytelnika język. Mediaworkerzy (czyli osoby piszące teksty, obsługujące CMS-y, charakteryzujące się kompetencjami w kwestii obsługi programów graficznych, posiadający podstawy wiedzy o pozycjonowaniu, itd., itp.) z tego żyją i robią to właściwie bezwiednie, bo na co dzień korzystają z danego języka i mają często ogromne doświadczenie w tych kwestiach. Maszyna aż tak kreatywna niestety nie jest i jeszcze długo będzie potrzebowała nadzoru specjalistów.