ChatGPT przebojem wdarł się do świadomości internautów na całym świecie. Z narzędzia cały czas korzystają miliony osób, ale pojawia się też coraz więcej wątpliwości natury prawnej w kwestii materiałów wykorzystanych do szkolenia sztucznej inteligencji.

New York Times nie dogadał się z Microsoftem

Generatywna sztuczna inteligencja była bez wątpienia przebojem 2023 roku. Narzędzia takie jak ChatGPT od OpenAI czy Bard od Google zdobyły sporą popularność i wiele osób zaczyna z nich korzystać w swojej codziennej pracy. Tym bardziej, że ChatGPT w formie Copilota od Microsoftu trafia nie tylko do pakietu Office ale również do systemu Windows. Jak sama nazwa jednak wskazuje, generatywna sztuczna inteligencja do tworzenia swoich treści wykorzystuje ogromne ilości danych, na których się uczy. Nie wszystkim twórcom podoba się wykorzystanie ich tekstów do szkolenia algorytmów, dlatego od kilku miesięcy trwają intensywne zakulisowe negocjacje.

Microsoft dogadał się między innymi z takimi wydawcami jak Axel Springer czy Associated Press, które pozwalają mu na korzystanie z ich bazy tekstów. New York Times też uczestniczył w podobnych rozmowach, ale obie strony nie doszły do porozumienia. W rezultacie wydawca New York Timesa złożył w sądzie pozew przeciwko Microsoftowi i OpenAI powołując się na złamanie zasad uczciwej konkurencji. Według przedstawicieli dziennika, sztuczna inteligencja najpierw uczyła się na tysiącach tekstów opublikowanych na łamach Timesa, a teraz sama tworzy konkurencyjne teksty, w których czuć wpływ stylu dziennikarzy tej gazety.

Według pozwu Microsoft i OpenAI mają sporo zarabiać na takim obrocie sprawy, New York Times czuje się natomiast zagrożony utratą "miliardów dolarów" potencjalnych zysków w przyszłości i nieuczciwą konkurencją ze strony takich usług jak Copilot. Dziennik chce aby modele LLM przestały wykorzystywać jego materiały do nauki. Podobnego zdania jest zresztą również BBC, CNN oraz Reuters, które zablokowały tzw. crawlery, przeczesując sieć w poszukiwaniu tekstów, z których Copilot/Chat GPT korzystają podczas tworzenia swoich artykułów. Będzie to zresztą coraz częstsze zjawisko, bo darmowy Copilot pozwala nie tylko tworzyć dłuższe formy artykułów, ale pozwala nawet na wybór stylu w jakim mają być napisane. Jeśli mają jednak dysponować aktualną wiedzą, to muszą być w stanie czerpać ją z sieci. Bez tego nawet najlepszy model będzie bezużyteczny.

Kwestia wykorzystania tekstów publikowanych w różnych mediach będzie zapewne poruszana coraz częściej, a firmy pracujące nad technologiami generatywnej sztucznej inteligencji będą musiały wypracować model pozyskiwania danych do szkolenia swoich modeli.

źródło: The Verge

źródło grafiki: Depositphotos