Media negocjują umowy licencyjne z takimi firmami jak OpenAI, które pragną dostępu do ogromnych zbiorów danych szkoleniowych. Wiele z nich — szczególnie te kojarzone z "lewicą" lub chociażby wartościami liberalnymi, blokują roboty indeksujące "karmiące" AI. Co robią prawicowe media? Pozostają otwarte na takie roboty. Powody tego stanu rzeczy mogą być dwa — na razie trudno powiedzieć coś "na pewno".
Badania przeprowadzone przez startup Originality AI z siedzibą w Ontario ujawniły, że ponad 88 procent czołowych serwisów informacyjnych w Stanach Zjednoczonych blokuje obecnie boty indeksujące firm pracujących nad AI. Nawet renomowane gazety, takie jak The New York Times, The Washington Post czy The Guardian, oraz różnorodne magazyny, od ogólnotematycznych po specjalistyczne, ustawiają w robots.txt ograniczenia na niektóre "crawlery". GPTBot od OpenAI jest spośród nich tym najczęściej blokowanym. Jednak żadne z badanych prawicowych serwisów informacyjnych, w tym Fox News, Daily Caller i Breitbart ich nie blokuje.
Co może kryć się za tą niezrozumianą strategią prawicowych mediów? Jednym z możliwych wyjaśnień jest próba wprowadzenia perspektyw prawicowych do rozwijających się algorytmów AI. AI nasiąka tym, czym ją karmiono, gdy się rozwijała — wtedy dochodzi też do rozwijania się w niej swego rodzaju "uprzedzeń". To jak z papugą — ta, przy której nie przeklinano — sama nie zacznie bluzgać na prawo i lewo. Za to ta, przy której podwórkowej łaciny używano — będzie rzucać mięsem bardzo chętnie. W sumie, porównanie GPT do papugi jest całkiem dobre. Otwartość prawicowych serwisów na boty skrobiące AI może być próbą ich wyważenia liberalnych wpływów w algorytmach, zwłaszcza że wiele nowoczesnych modeli językowych wykazuje "lewicowe odchylenie" - przynajmniej według ekspertów i dziennikarzy, których kojarzy się z ideami konserwatywnymi.
Dane Originality AI wykazały, że wiele serwisów zaczęło blokować crawlery AI tuż po ogłoszeniu przez OpenAI, że będzie honorować ustawienia w robots.txt w sierpniu 2023 roku. Otwartość prawicowych mediów na boty skrobiące AI może wynikać z bardziej pragmatycznych, niż ideologicznych powodów. Niektóre z prawicowych serwisów mogłyby nie zdawać sobie sprawy z możliwości blokowania robotów indeksujących lub po prostu mają tę kwestię w poważaniu. Może być jednak tak, że ich otwartość wynika z chęci nauczelnia algorytmów tego, co same głoszą. A tutaj widzę pewne niebezpieczeństwo — z całym szacunkiem do idei prawicowych i konserwatywnych.
Niestety, ale przede wszystkim w USA, tego typu strony są siedliskiem teorii spiskowych (m.in. QAnon — tam mówi się wprost np. o tym, że demokraci to grupa pedofilów "hodujących" dzieci po to, by produkować z nich substancję o działaniu psychoaktywnym potrzebną do satanistycznych rytuałów). Co więcej, konserwatywne media w USA (i nie tylko w USA) bardzo często poddają w wątpliwość to, czy powinno się pomagać Ukrainie. Akurat z punktu widzenia polskiej racji stanu, to ogromne niebezpieczeństwo. Możecie się ze mną nie zgadzać — ale po prostu tak myślę i tak piszę.
Nie ma pewnej odpowiedzi na to, dlaczego prawicowe media pozostają otwarte crawlery firm pracujących nad AI, ale to mimo wszystko fascynujący fakt w kontekście walki o wpływy w zakresie algorytmów AI. A może media powinny patrzeć dalej niż czubek własnego nosa i blokowanie crawlerów to zwyczajnie zła i nieprzemyślana strategia — niezależnie od tego, jaką stronę ideologiczną reprezentują?. Ciekawe jednak jest to, że "lewicujące" serwisy blokują te crawlery, a te opozycyjne do nich — już nie.
A może po prostu chodzi o to, że w badaniu Originality AI przebadano mniejsze serwisy, które mogły zwyczajnie "nie wiedzieć" o możliwości blokowania robotów? Nie wiem, ale wiem, czym to się może skończyć. Chociażby tym, że AI jak wspomniana papuga, zacznie np. mówić, że Zełenski to agent chodzący na pasku Demokratów, a konflikt Rosji z Ukrainą należy rozwiązać tak, jak często rozwiązują je nauczyciele w szkołach. "Nieważne kto zaczął, macie obaj podać sobie ręce".
Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu