W przeszłości byliśmy już świadkami wielu przerażających (a jednocześnie: robiących wrażenie) opcji związanych ze obrazami i sztuczną inteligencją. Jedną z najgłośniejszych opcji było prawdopodobnie tworzenie ludzi, którzy nigdy nie istnieli i generowanie z nimi fotografii. Tym razem Google poszło o krok dalej i w swoim najnowszym projekcie zaprezentowali tworzenie grafik bazujących na... opisie tego, co miałoby znaleźć się na fotografii. Jak to wypada w praktyce? Zaskakująco dobrze.

Opisz co ma znaleźć się na obrazku, a sztuczna inteligencja wygeneruje je dla was

Nie jestem przekonany czy nazywanie tych kreacji zdjęciami to dobry pomysł — bo mimo że są one fotorealistyczne (choć nie muszą być — bo jedną z opcji jest też malarska stylizacja), to jednak bliżej im po prostu do bycia wygenerowanymi komputerowo grafikami. Kilka dni temu Google zaprezentowało swój własny system, który bazuje na wprowadzanych przez użytkowników opisach. Jak to działa w praktyce? Jako użytkownicy musimy po prostu wpisać co ma znaleźć się na grafice — a magia zadzieje się w tle na podstawie naszego opisu. Na oficjalnej stronie projektu Imagen możemy znaleźć cały szereg przykładów prezentujących jak możliwości usługi wypadają w praktyce.

Warto jednak mieć na uwadze, że to starannie wybrane przez twórców grafiki demonstracyjne — gdyby sami użytkownicy zaczęli wprowadzać swoje opisy, to nie mamy żadnej gwarancji że będą wyglądały one równie spektakularnie. No właśnie: gdyby. Google zdecydowało się bowiem NIE udostępniać tego narzędzia szerszemu gronu użytkowników. Dlaczego? Przede wszystkim ze względu na fakt, że narzędzie nie jest jeszcze odpowiednio dopieszczone i wytrenowane, by mogło być wykorzystywane przez każdego. Jak wszystkie projekty z AI w roli głównej, tutaj również potrzebne są ogromne ilości danych do odpowiedniego treningu — a takowy jest ciągle w toku. Algorytmy muszą się jeszcze wiele nauczyć, by można uznać to narzędzie za kompletne i dopracowane. Dlatego póki co, na oficjalnej stronie projektu możemy wybierać spośród kilku fraz, tworząc grafiki w oparciu o predefiniowane treści.

Imponujące, ale na tę chwilę... raczej dla większości użytkowników nie będzie to niczym więcej, niż ciekawostką. Jeżeli uda się algorytmy odpowiednio wytrenować — możliwe, że w przyszłości będzie można zrobić z tego większy użytek. Obecnie jednak Google może jedynie pochwalić się tym, że opracowało technologię działającą analogicznie do tego, czym kilka tygodni temu zachwycało nas DALL-E 2. A jakimi grafikami firma prezentuje swoją usługę? Dość szalonymi — ale z pewnością przykuwającymi wzrok. Zobaczcie sami!