Wywiady

Jednolity System Antyplagiatowy - czyli bójcie się studenci?

Jakub Szczęsny
Jednolity System Antyplagiatowy - czyli bójcie się studenci?
1

Plagiaty to w obecnych realiach poważny problem - mamy dostęp do niezliczonych publikacji zawartych w sieci, a poruszanie się po uniwersyteckich bibliotekach jest niezwykle proste i w wielu przypadkach intuicyjne. Nowe czasy wymagają zupełnie nowych rozwiązań pod kątem sprawdzania nowych prac w kontekście możliwych plagiatów. Obecne systemy wydają się być nieco dziurawe: stąd też pomysł na Jednolity System Antyplagiatowy.

Twórcy Jednolitego Systemu Antyplagiatowego chwalą się, że ich algorytm analizuje ok. 1 miliarda dokumentów oraz korzysta z największej w naszym kraju bazy prac dyplomowych: Ogólnopolskiego Repozytorium Pisemnych Prac Dyplomowych (ORPPD), która skupia blisko 3 miliony takich prac również w językach obcych. JSA porównuje dane wejściowe z ok. 770 mln stron internetowych i informacjami zawartymi w Wikipedii w sześciu językach. Co więcej, JSA korzysta także z bazy aktów prawnych.

Jednolity System Antyplagiatowy (JSA) to system wykorzystywany do sprawdzenia prac dyplomowych pod kątem plagiatu, przeznaczony do wsparcia pracy weryfikacyjnej promotora (opiekuna) pracy. System jest udostępniany nieodpłatnie wszystkim uczelniom w Polsce.

Czytaj więcej: Centrum pomocy JSA

Odpowiedzi serwisowi Antyweb udzielił: Dr inż. Marek Kozłowski, kierownik Laboratorium Inżynierii Lingwistycznej w OPI PIB - instytucie badawczym, który realizuje działania (w tym JSA) na zlecenie MNiSW.

AW: Jak według twórców JSA wygląda problem plagiatów w Polsce? Przede wszystkim interesują nas uczelnie i prace dyplomowe.

Dr inż. Marek Kozłowski: Trudno jednoznacznie odpowiedzieć na to pytanie w perspektywie ostatnich lat. Głównie dlatego, że dopiero od 2019 roku zaczął działać Jednolity System Antyplagiatowy, z którego – zgodnie z ustawą – powinny korzystać wszystkie polskie uczelnie. Dotychczas ten rynek był mocno rozbity i dlatego nie ma spójnych danych dotyczących zjawiska plagiatu. W roku 2016 poziom użycia jakichkolwiek narzędzi walki z plagiatami wśród uczelni sięgał jedynie 30-40 proc. obron. To się jednak zmienia. Tylko w tym roku z JSA skorzystali promotorzy ponad 90 proc. uczelni i jednostek w Polsce. Nie jest to 100 proc., ponieważ nie wszędzie w tym czasie obrony w ogóle się odbywały. Na tej podstawie można wysnuć pewne wnioski. Do końca lipca przebadano 273 992 prace dyplomowe. W 22 077 pracach został osiągnięty próg ostrzegawczy, który oznacza domyślnie, że przynajmniej 40 proc. treści w danej pracy może potencjalnie pochodzić z innego źródła, co z kolei może świadczyć o plagiacie. To ok. 8 proc. wszystkich analizowanych prac dyplomowych. W praktyce jednak nie wszystkie prace, które przekroczyły wspomniany próg, muszą być plagiatami. Podobieństwo może wynikać np. z bliskości tematycznej niektórych prac lub z powoływania się na określone ustawy czy dokumenty, dlatego promotor może te prace zaakceptować.

AW: Czy "przepisanie" fragmentu używając zupełnie innych wyrazów jest skuteczne w przypadku JSA?

Dr inż. Marek Kozłowski: To zależy, jak dużych interwencji dokona autor. Jeśli faktycznie wszystkie słowa w przepisanym fragmencie będą zastąpione nowymi, być może studentowi uda się oszukać system antyplagiatowy. Jednak rzadko zdarza się, by ktoś, kto chce dokonać plagiatu, był aż tak skrupulatny w swoim oszustwie – oznaczałoby to, że wkłada w to więcej wysiłku niż w napisanie autorskiego tekstu. Wracając do pytania – jeśli fragment zostanie przepisany z zachowaniem większości zdań i wykonane zostaną typowe prace maskujące, polegające na usunięciu części słów, dodaniu nowych zdań czy wyrażeń, Jednolity System Antyplagiatowy wyłapie tę manipulację.

Jak to działa? Dotychczas systemy antyplagiatowe skupiały się na znalezieniu podobieństw między dokumentami w bardzo krótkich, najczęściej kilkuwyrazowych i równoważnych leksykalnie fragmentach tekstu. Jeśli system widział niemal „lustrzane podobieństwo” jakichś fragmentów – zaznaczał je. Jednolity System Antyplagiatowy idzie krok dalej – bada i porównuje długie fragmenty tekstu, dzięki czemu wyłapuje próby oszustwa pod kątem zmiany kolejności zdań w kopiowanym fragmencie, zmiany szyku wyrazów, zmiany stylu wypowiedzi, czy przeplatania tekstu źródłowego swoimi zdaniami czy wyrazami. JSA jest czuły na zabieg tzw. maskowania skopiowanego tekstu. Dzięki temu nawet bardzo duża ingerencja w przerobienie po swojemu skopiowanego tekstu może nie pomóc nieuczciwemu autorowi w oszukaniu systemu.

AW: W czym tkwi różnica między obecnie wykorzystywanymi technikami wykrywania plagiatów a JSA?

Dr inż. Marek Kozłowski: Każdy system antyplagiatowy ma inny zestaw algorytmów, według którego działa i inne bazy źródłowe, do których porównuje badany tekst pracy. Dlatego ujednolicenie sposobu wykrywania plagiatów było tak istotne. Już wspomniałem o tym, że w przeciwieństwie do innych dostępnych na rynku rozwiązań, Jednolity

System Antyplagiatowy analizuje dłuższe fragmenty tekstu, a nie tylko pojedyncze zbieżne słowa czy wyrażenia kilkuwyrazowe, co pozwala na wykrycie wspomnianych wcześniej manipulacji o większym zakresie ingerencji autora w tekst źródłowy. Jednolity System Antyplagiatowy jako jedyny ma dostęp do największej w kraju bazy prac dyplomowych – Ogólnopolskiego Repozytorium Pisemnych Prac Dyplomowych, a w przyszłości – także do bazy prac doktorskich i postępowań awansowych. Na koniec warto zaznaczyć, że JSA jest pierwszym ogólnodostępnym i bezpłatnym systemem antyplagiatowym w Polsce, co skutecznie zwiększyło świadomość o zjawisku plagiatu na uczelniach, a także możliwości walki z nim.

AW: Jak JSA radzi sobie z publikacjami niepolskojęzycznymi?

Dr inż. Marek Kozłowski: Pod względem technicznym, nie ma żadnej różnicy między tekstem polskim a obcojęzycznym. Kluczowe w tym przypadku są jednak zasoby, do których są porównywane wgrane do systemu pliki. W przypadku JSA, system weryfikuje oryginalność tekstów m.in. w zestawieniu z Ogólnopolskim Repozytorium Pisemnych Prac Dyplomowych (ORPPD), w którym są 3 miliony prac dyplomowych, także w językach obcych. To jednak nie wszystko. JSA ma też dostęp do bazy NEKST, nazywanej czasem „korpusem polskiego internetu”. Skupiająca ponad 880 milionów stron z domeny „.pl” baza ważąca 20 TB to zaledwie kropla w morzu obcojęzycznych treści. Zasób stron obcojęzycznych waży co najmniej 1000 razy więcej, dlatego nawet największe, międzynarodowe systemy antyplagiatowe, takie jak PlagDetector czy TurnItIN radzą sobie korzystając z pomocy wyszukiwarek Bing czy Google. Bo żadna firma, może właśnie poza Google, Microsoftem czy Baidu, nie ma dostępu do większości zasobów światowego internetu. Kluczowa jest zatem ciągła praca na rzecz powiększania zasobów systemu o kolejne obcojęzyczne źródła.

AW: Dla kogo właściwie jest JSA? Dla pracowników uczelni, studentów, innych osób?

Dr inż. Marek Kozłowski: Przede wszystkim – na pewno nie jest to system skierowany do studentów. Dostęp do JSA jest limitowany, dzięki czemu student nie ma możliwości, aby zweryfikować, czy zmienić skopiowany tekst na tyle skutecznie, by uniknąć wykrycia plagiatu. I muszę zaznaczyć, że wielu studentom się to nie podoba, bo zamiast dalej kombinować, muszą faktycznie napisać swoją pracę (śmiech)! Znamy przypadek uczelni, w której odpowiedzialność za weryfikację oryginalności pracy dyplomowej spoczywała na studencie. Student płacił za dostęp do systemu antyplagiatowego, sam weryfikował sobie pracę, a aby ją obronić przedkładał promotorowi jedynie raport z systemu. To patologia, której chcemy się przeciwstawić.

Czytaj także: Wywiad z Ministrem Cyfryzacji. Warto przeczytać!

System jest przeznaczony dla promotorów i pracowników uczelni. To narzędzie, które jest wykorzystywane w procesie dyplomowania i doktoryzowania. Przed każdą obroną zgodnie z prawem wynik raportu uzyskanego w Jednolitym Systemie Antyplagiatowym musi zostać dodany do „teczki” studenta, by ten mógł do owej obrony przystąpić. System jest skierowany do promotorów, bo to ich potrzeby stoją u podstaw jego powstania. Pracownicy dydaktyczni z całej Polski zauważali wyraźne różnice w działaniu i wynikach różnych komercyjnych systemów antyplagiatowych – te same prace mogły być analizowane w zupełnie różny sposób na różnych uczelniach, były porównywane do zupełnie innych baz dokumentów, czasami naprawdę niewielkich (np. własnej uczelnianej bazy prac dyplomowych). To rodziło ryzyko, że ta sama praca dyplomowa na jednej uczelni może być uznana za plagiat, a na innej nie. Właśnie dlatego Ministerstwo Nauki i Szkolnictwa Wyższego podjęło decyzję o stworzeniu Jednolitego Systemu Antyplagiatowego, który umożliwia wykrywanie plagiatów za pomocą jednego zestawu algorytmów dla wszystkich uczelni w kraju.

AW: Co oznacza człon "Jednolity" w nazwie rozwiązania? Do czego się odnosi?

Dr inż. Marek Kozłowski: Jednolity System Antyplagiatowy jest centralnym i bezpłatnym systemem, który służy do walki z plagiatami. Jednolitość w nazwie systemu odnosi się zatem przede wszystkim do jego zasięgu i dostępności. Czy system weryfikuje prace w sposób jednolity? Tak. JSA analizuje prace dyplomowe za pomocą jednego zestawu algorytmów, serca systemu. Ten zestaw algorytmów jest niezmienny od powstania systemu w 2019 roku. Nasi informatycy dbają o jego bieżące aktualizacje oraz unowocześnianie interfejsu. Nie zmienia to jednak faktu, że metodyka analizy prac dyplomowych jest jednolita.

AW: Czy JSA może pochwalić się już udanymi wdrożeniami / testami? Jakie są ich wyniki?

Dr inż. Marek Kozłowski: Z Jednolitego Systemu Antyplagiatowego od 1 stycznia do 31 sierpnia 2019 skorzystało badając prace dyplomowe prawie 340 uczelni i innych instytucji z sektora nauki i szkolnictwa wyższego. To dużo ponad 90 proc. wszystkich uczelni prowadzących w 2019 proces dyplomowania. Wprowadzenie tak dużego systemu było i nadal jest ogromnym wyzwaniem, które wymaga solidnych przygotowań i ciągłej pracy. Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy zapewnił możliwość organizacji bezpłatnych szkoleń dla przyszłych użytkowników systemu: administratorów, promotorów i pracowników dziekanatów, dzięki czemu administratorzy ze strony uczelni mogli dobrze zapoznać się z systemem przed jego wdrożeniem. To, co może być szczególnie ważne dla użytkowników systemu, to fakt, że zarówno sam system, jak i jego wszystkie aktualizacje czy usprawnienia będą bezpłatne. System będzie też cały czas rozwijany pod kątem ułatwień dla użytkowników i powiększania zasobów porównawczych. Są plany, by w 2020 roku JSA był pod tym względem największym systemem antyplagiatowym w Europie.

Wygląda więc na to, że Jednolity System Antyplagiatowy jest niesamowicie potężnym narzędziem, które wreszcie pasuje do obowiązujących w Polsce realiów. Z pewnością ten system niekoniecznie spodoba się studentom, którzy odtąd będą drżeć na myśl o konieczności "przepuszczenia" pracy przez tak doskonale przygotowany algorytm. Niemniej, ci twórcy prac dyplomowych, którzy nie mają sobie nic do zarzucenia bać się nie powinni: JSA o ile jest w stanie wykryć plagiaty w sposób znacznie szybszy i dokładniejszy niż poprzednie iteracje podobnych projektów, nie jest mechanizmem "złośliwym" i nigdy nie miał takiego charakteru, nawet w swoim zamyśle. Podstawowym jego celem jest krzewienie odpowiedniej kultury pisania prac oraz innych publikacji. Ale żeby komuś ufać, czasami trzeba mimo wszystko sprawdzić. Zwłaszcza, że sam wiem jak wśród niektórych studentów wygląda pisanie prac dyplomowych.

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu