Sztuczna Inteligencja

Generatory obrazów AI. DALL-E, Midjourney i co jeszcze?

Kacper Cembrowski
Generatory obrazów AI. DALL-E, Midjourney i co jeszcze?
10

Chcecie, żeby sztuczna inteligencja wygenerowała dla Was grafikę? Jeśli tak, to macie kilka możliwości — i przeglądamy te najważniejsze.

Narzędzia oparte na sztucznej inteligencji w ostatnim czasie szturmem wdarły się do naszego życia. Jeszcze kilka miesięcy temu narzędzia AI umiejące napisać za nas niemal wszystko (od opowiadań do szkoły, przez posty na social media, aż po felietony na dany temat), pomóc programistom w stworzeniu kodu, czy wygenerować obraz na podstawie krótkiego opisu, były wyłącznie melodią przyszłości. Teraz stały się wręcz codziennością.

Źródło: Depositphotos

Midjourney i podobne narzędzia wspierane przez sztuczną inteligencję narobiły już trochę szumu. Potrafią przecież tworzyć zdjęcia z imprez, które się nigdy nie odbyły, pozwalają zdobyć popularność fotografowi, który wcale nie robi zdjęć, a nawet wygrywać konkursy sztuk pięknych, pokonując prawdziwych artystów. Dzieje się sporo, jednak ten segment SI nie kończy się na Midjourney i DALL-E od OpenAI. Przejrzyjmy najważniejsze propozycje.

Midjourney

Zacznijmy od najpopularniejszej i najbardziej zaawansowanej propozycji, czyli Midjourney. Aplikacja niedawno doczekała się wersji v5 — i algorytm w nowej generacji faktycznie działa już dużo lepiej, zwracając uwagę na elementy, które do tej pory miewały pewne problemy (na przykład ilość palców czy zębów u ludzi). To właśnie przy użyciu tego narzędzia stworzono popularne ostatnio deepfake'i z aresztowaniem Donalda Trumpa czy zdjęcie papieża Franciszka w długiej, białej, puchowej streetwearowej kurtce i wielkim chainem z krzyżem wysadzonym diamentami. Midjourney w tej chwili bez dwóch zdań jest najbardziej zaawansowanym narzędziem, które stworzy grafikę z ludźmi, krajobrazem, a nawet jedzeniem czy wybranymi produktami — i ich jakość jest na tyle wysoka, że spokojnie mogłyby zostać wykorzystywane do reklam.

Źródło: Depositphotos

Jeśli chodzi o cenę, to niedawno twórca Midjourney ze względu na ogromną popularność deepfake'ów tworzonych przy użyciu tego narzędzia, całkowicie wyłączył możliwość tworzenia grafik za darmo. W tej chwili jest dostępna wyłącznie płatna wersja, a ceny abonamentu zaczynają się od 8 USD (~35 PLN).

DALL-E 2

Od DALL-E wszystko się tak naprawdę zaczęło. Nie da się jednak ukryć, że OpenAI w tej chwili głównie skupia się na chatbocie i to właśnie ChatGPT jest ich oczkiem w głowie — niedawno nawet udostępnili nowy model językowy, który jest dużo bardziej zaawansowany od poprzedników, czyli GPT-4. Niemniej jednak, DALL-E 2 jest naprawdę porządnym narzędziem, które generuje kilka wariantów grafiki na podstawie krótkiego opisu. Całość działa niezawodnie i bardzo szybko, chociaż minusem jest brak dedykowanej aplikacji — wszystko odbywa się w przeglądarce. Nie są to zdjęcia tak zaawansowane, jak w przypadku Midjourney, lecz wyniki będą dla większości użytkowników więcej niż zadowalające.

Źródło: Depositphotos

Co z ceną? OpenAI co miesiąc każdemu użytkownikowi daje możliwość stworzenia 15 darmowych grafik. Jeśli jednak chcecie generować więcej obrazów, możecie zawsze kupić dodatkowe 115 kredytów za 15 USD (~65 PLN).

Bing

Przeglądarka Microsoftu, od kiedy jest wspierana przez sztuczną inteligencję, również potrafi tworzyć grafiki na podstawie krótkiego opisu. Całość jest oczywiście stworzona przez OpenAI, więc działa dokładnie tak samo, jak DALL-E 2 — razem z cenami, jakością i szybkością działania. Plusem jednak jest to, że w przypadku Binga, wszystko dostępne jest w jednym miejscu. O wygenerowanie specjalnej grafiki możemy poprosić w tym samym miejscu, w którym rozmawiamy z ChatemGPT. Nie ma więc potrzeby skakania po różnych stronach internetowych.

Dream

Dream to propozycja od firmy WOMBO, która wyróżnia się tym, że jest dostępna nie tylko na komputerach, ale również na smartfonach. To właśnie na urządzeniach mobilnych Dream odnosi największe sukcesy, co udowodniło pierwsze miejsce w konkursie Google Play Awards 2022 w kategorii wszystkich aplikacji. Poziom generowanych grafik jest zadowalający, a na wyróżnienie zasługuje funkcja, która pozwala użytkownikom wybrać, w jakim stylu ma zostać wygenerowane ich zdjęcie. Mamy do wyboru takie opcje jak na przykład ekspresjonizm, komiks czy abstrakcja.

Źródło: Google Play

Podobnie jak w przypadku wszystkich tego typu aplikacji, możemy stworzyć kilka grafik za darmo. Jeśli jednak chcecie mieć możliwość nielimitowanego generowania grafik, możecie kupić miesięczną subskrypcję za 10 USD (~43 PLN), roczną za 90 USD (~390 PLN) lub dożywotnią za 170 USD (~730 PLN).

Craiyon

Craiyon nie jest najdokładniejszym narzędziem opartym na sztucznej inteligencji służącym do generowania obrazów — grafiki często wychodzą dość niedokładne i chociaż zachowują sens i faktycznie obrazują nasz opis, to od razu widać, że jest to grafika stworzona przez AI.

Źródło: Seeklogo

Można jednak Craiyon wybaczyć, ze względu na to, że jest to narzędzie całkowicie darmowe. Nie mamy tutaj ograniczonej ilości kredytów na stworzenie grafik — każdy może tworzyć nieskończoną ilość obrazów całkowicie bezpłatnie. Na ewentualne braki w jakości można więc przymknąć oko.

NightCafe

NightCafe nie tworzy specjalnie realistycznych grafik, a oferuje bardziej artystyczną wizję opisu przekształconego na obraz. Program jest w stanie stworzyć wszystko, co tylko zechcemy i dodatkowo pozwala nam wybierać styl graficzny — od komiksu, przez cyberpunk, steampunk, horror i surrealizm, aż po pop art czy grę 3D.

Źródło: NightCafe

Przy założeniu konta dostajemy 5 kredytów, lecz jeśli chcemy stworzyć więcej grafik, to musimy za to zapłacić. Dostępne ilości na miesiąc to 100 kredytów (5,99 USD [~26 PLN] miesięcznie, 14,37 USD [~62 PLN] kwartalnie), 200 kredytów (9,99 USD [~43 PLN] miesięcznie, 23,97 USD [~103 PLN] kwartalnie), 500 kredytów (19,99 USD [~86 PLN] miesięcznie, 47,97 USD [~206 PLN] kwartalnie) i 1400 kredytów (49,99 USD [~215 PLN] miesięcznie, 119,97 USD [~515 PLN] kwartalnie).

Artbreeder

Ostatnią propozycją jest Artbreeder (znany wcześniej pod nazwą Ganbreeder), który wykorzystuje modele StyleGAN i BigGAN, pozwalające na wygenerowanie całkiem realistycznych grafik na podstawie naszego opisu. Program działa całkiem imponująco, lecz twórcy, podobnie do NightCafe, nie są specjalnie hojni, jeśli chodzi o ilość darmowych kredytów.

Źródło: Twitter @Artbreeder

Bezpłatnie co miesiąc otrzymujemy 10 kredytów. Jeśli chcemy jednak stworzyć więcej grafik, możemy wykupić 100 kredytów za 8,99 USD (~39 PLN) miesięcznie, 275 kredytów za 18,99 USD (~82 PLN) miesięcznie lub 700 kredytów za 38,99 USD (~168 PLN) miesięcznie.

Który generator jest najlepszy? To zależy

Z całego zestawienia można więc wyciągnąć wnioski, że najbardziej zaawansowanym rozwiązaniem jest Midjourney — jednak aktualny brak możliwości generowania darmowych obrazów jest sporym minusem. Równowagą pod względem jakości i stworzenia czegoś za darmo jest DALL-E 2 od OpenAI, a jeśli zależy Wam na jak najniższych kosztach i jakość schodzi na drugi tor, to musicie zaprzyjaźnić się z Craiyonem. Które narzędzie jest Waszym ulubionym?

Stock Image from Depositphotos

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu