Na takie nowości czekali miłośnicy produktów od OpenAI. Firma od wielu miesięcy trzymała nas w napięciu w kwestii nowości związanych z generowaniem obrazów. Teraz, po ponad roku, Sam Atlman oficjalnie ogłosił pierwszą solidną aktualizację dla tamtejszego generatora grafik - i to taką, która ma zachwycić nawet najbardziej sceptycznie nastawionych do tego typu rozwiązań użytkowników.

Nowa generacja tworzenia obrazów z ChatGPT

Nowości jest wiele, ale bez wątpienia najważniejszą zmianą jest fakt, że ChatGPT może teraz natywnie tworzyć i modyfikować obrazy oraz zdjęcia dzięki modelowi GPT-4o. Dotychczas model ten napędzał platformę chatbotów opartych na sztucznej inteligencji i można było wykorzystać go wyłącznie do generowania oraz edycji materiałów tekstowych. Teraz 4o wchodzi w nową fazę.

Altman podczas oficjalnej prezentacji poinformował, że funkcja generowania obrazów przy użyciu GPT-4o jest dostępna już teraz w ChatGPT oraz Sorze -- czyli specjalnym narzędziu OpenAI do generowania materiałów wideo. Mogą z niego skorzystać subskrybenci planu Pro (czyli tego, który wyceniony został na 200 dolarów miesięcznie). Spokojnie jednak -- analogicznie do innych nowości od OpenAI, wkrótce opcje te mają być dostępne również dla użytkowników planów Plus i darmowych. Trafi ona także do deweloperów, którzy korzystają korzystających z API firmy.

Jeszcze lepsze obrazy prosto z generatora

Model GPT-4o z funkcją generowania obrazów analizuje dane dłużej i dokładniej niż jego poprzednik, DALL-E 3. Przekłada się to na tworzenie bardziej szczegółowych i precyzyjniej wykonanych grafik. Ponadto GPT-4o umożliwia edycję istniejących obrazów, w tym takich, które zawierają ludzi. Model potrafi modyfikować poszczególne elementy ilustracji oraz "wypełniać" brakujące detale, takie jak obiekty na pierwszym planie czy tło.

Aby wprowadzić nową funkcję, OpenAI miał przeszkolić model GPT-4o na ogromnym zestawie publicznie dostępnych danych, a także na zasobach pozyskanych w ramach współpracy z firmami takimi jak Shutterstock. Wielu dostawców AI traktuje dane treningowe jako przewagę nad konkurencją, dlatego nie ujawnia szczegółów dotyczących ich źródeł. Od początku jednak byliśmy świadkami potencjalnych problemów z prawami autorskimi -- w pierwszych generacjach generatory obrazów potrafiły przecież serwować nam również znaki wodne (lub ich fragmenty), które zaciągnęły wraz z "uczeniem" się na... no właśnie, na czym?

Szanujemy prawa artystów dotyczące sposobu, w jaki generujemy obrazy, i posiadamy polityki zapobiegające tworzeniu grafik naśladujących prace współczesnych artystów – powiedział Brad Lightcap, dyrektor operacyjny OpenAI, w wypowiedzi dla The Wall Street Journal

OpenAI umożliwia twórcom zgłaszanie swoich prac do usunięcia z zestawów treningowych poprzez specjalny formularz rezygnacyjny. Firma deklaruje również, że respektuje prośby o wykluczenie jej botów zbierających dane z witryn internetowych, w tym zdjęć.

Jestem bardzo ciekawy jak będą się rozwijać sprawy w tym temacie - bo obecnie generowane obrazy widać na kilometr i... to w sumie dobrze. Przynajmniej wiadomo czego spodziewać się po podejściu - czy to autorów wpisów w sieci, czy wydawców książek, którzy niestety coraz częściej zamiast zapłacić artystom za ilustrację korzystają z tego typu rozwiązań.