Badania podjął się amerykański serwis edukacyjny EduRef, który postanowił porównać umiejętności generatora i świeżych absolwentów uniwersytetów. Zatrudniono w tym celu grupę wykładowców, którzy przygotowali wytyczne i podpowiedzi do pisania esejów z zakresu historii Stanów Zjednoczonych, metod badawczych, kreatywnego pisania i prawa.

Nie, GPT nie pokonał jeszcze ludzi, ale w wielu miejscach była z nimi praktycznie na równi. Deklasował za to swoich białkowych przeciwników, jeśli chodzi o tempo pracy. Podczas gdy ludziom napisanie pracy konkursowej zajmowało średnio 3 dni, GPT-3 robił to w czasie od 3 do 20 minut…

Jeszcze nie prymus

Najlepiej poszły mu eseje z zakresu historii i prawa, gdzie uzyskał ocenę B- (amerykańskie skala to oceny od A do F, gdzie A jest najwyższa). Grupa kontrolna absolwentów uzyskała oceny pomiędzy B a C+, przy czym z zakresu prawa SI zajęło 2-gie miejsce. W przypadku pracy o metodach badawczych nad szczepionką Covid-19 uzyskał C, podczas gdy studenci B i D.

Sztuczni humaniści? Jeszcze nie…

Generator poległ natomiast zupełnie w przypadku zadania kreatywnego, gdzie otrzymał niedostateczne F, podczas gdy grupa kontrolna otrzymała oceny od A do D+. I to pomimo tego, że organizatorzy musieli mu pomóc, dodając więcej wzorców i umożliwiając więcej prób. W sumie to że GPT-3 nie jest wybitnym humanistą, nie powinno aż tak zaskakiwać.

Ślepa próba

Badanie było oczywiście anonimowe, wykładowcy oceniający prace nie wiedzieli, że oceniają prace generatora tekstów. Według ich ocen GPT-3 świetnie radzi sobie z gramatyką, składnią i w ogóle trzymaniem się ogólnych zasad pisania, a problemy ma wtedy, gdy trzeba wykreować silną narrację i wzbudzić emocje.

Twórcy testu uważają, że wynika to stąd, że zadania kreatywne polegają na sięganiu do naszych doświadczeń i wspomnień wzmocnionych przez uczucia, a GPT-3 jak narazie nie potrafi tego ostatniego czynnika zasymulować. Stąd świetnie wypada raczej w zadaniach których clue stanowią konkretne dane, jak w przypadku historii i prawa.

Postrach wykładowców?

Tak czy inaczej, algorytmy w coraz większej ilości dziedzin mogą zacząć działać jak trucizna i równie ważne jak rozwój jej technik, będzie umiejętność tworzenia antidotum, kontr-algorytmów ujawniających ich działanie. To, że Amerykanie mogą już całkiem niedługo mieć problem z nieuczciwymi studentami, którym prace zaczną pisać generatory tego typu wydaje się bardzo prawdopodobne.

Ciekawe, czy jeśli powstałby taki anty-GPT potrafiłby wykryć oszustwo, w przypadku gdy studenci zdecydują się na „doszlifowanie” tak wygenerowanych prac? Wszystko przed nami. W tej kwestii Polska choć raz będzie górą, nasz język jest dla komputerów takim koszmarem, że podobnie skutecznego generatora w wersji PL raczej szybko nie zobaczymy.

