Czy istnieje program w którym wystarczy napisać, co chcemy zobaczyć, a on nam to stworzy? Tak, nazywa się DALI-E i zmieni sposób, w jaki myślimy o AI.

Każdy z nas ma często w głowie jakąś wizję tego, co chciałby stworzyć, albo narysować. Wiecie - odpowiednia sceneria, detale, postaci. Wszystko jest w naszej głowie, do momentu, w którym trzeba przełożyć nasza wizję na papier. Moje umiejętności rysowania zatrzymały się na etapie ludzika z kresek, więc niestety - nawet jeżeli mam jakiś ciekawy pomysł na to, co chciałbym narysować, najczęściej (i być może - na szczęście) zostaje on tylko w mojej głowie.

Co jednak, gdyby można było po prostu "powiedzieć" programowi, co chciałoby się narysować, a on zrobiłby to za nas? W końcu przecież ciągle słyszymy, że sztuczna inteligencja rozwija się z niesamowitym tempie. Ba, co jakiś czas na światło dzienne wypływają programy, które pokazują to, jak SI może zmienić nasz sposób tworzenia rzeczy. Wystarczy chociaż wziąć pod uwagę program NVidii, który z dziecinnego rysunku robi realistyczne scenerie.

Jednak tutaj trzeba minimalnie przynajmniej wskazać programowi, czego się od niego chce. Co, jeżeli po prostu moglibyśmy powiedzieć komputerowi, czego chcemy? Cóż - nie ma się co dziwić, że wcześniej czy później ktoś stwierdzi, że taki projekt jest możliwy do zrealizowania. Taki projekt właśnie ujrzał światło dzienne.

Poznajcie DALL-E 2. Program, któremu wystarczy powiedzieć, czego chcecie

DALL-E to projekt, który, oczywiście w oparciu o SI jest w stanie przetworzyć na obraz wszystko to, co opiszemy. I to nie jest żart. Twórcy zapewniają, że nawet najbardziej abstrakcyjne kombinacje (jak niedźwiedź polarny grający na basie) DALL-E przetworzy na obrazy w realistycznym stylu.

Oprócz tworzenia zupełnie nowych grafik, program ma mieć też możliwość przerabiania istniejących zdjęć (np. zamiana psa na zdjęciu na kota) w taki sposób, że na pierwszy rzut oka nie widać, że coś było przy fotografii manipulowane. Jest to duży progres jeżeli chodzi o AI, ponieważ do tej pory sztuczna inteligencja była bardzo dobra, jeżeli chodzi o rozpoznawanie jednego typu obrazu, ponieważ tak działają algorytmy. AI była więc w stanie rozpoznać, czy na obrazie jest np. pies czy kot. Jednak DALI-E idzie o krok dalej, pokazując, że AI jest w stanie rozumieć, co jest na obrazie, tworząc grafiki, które zwyczajnie, po ludzku, mają sens. Twórcy pokazują, że jeżeli wpiszemy w ich program chociażby "żaba na rowerze", to AI będzie wiedziało, gdzie umieścić wspomnianą żabę, jak zrobić to z zachowaniem perspektywy i jak zblendować oba obrazki, aby wyglądały one naturalnie.

Niestety, obecnie twórcy DALI-E nie udostępniają swojego oprogramowania wszystkim. Istnieje specjalna waitlista na ich stronie internetowej, na którą można się zapisać. Sam to zrobiłem i jestem bardzo ciekawy, czy w najbliższym czasie będę miał możliwość pobawienia się tym programem. Jeżeli tak, bądźcie pewni, że pokażę wam dokładnie, jak on działa i co można za jego pomocą stworzyć.