Generowanie obrazków wespół z AI to obecnie bardzo popularny kierunek. Część użytkowników bawi się modelami tworzącymi często imponujące obrazy, inni używają AI do tego, aby zaspokajać potrzeby komercyjnych projektów, a jeszcze inni - po prostu się inspirują. Niezależnie od tego, czego oczekujecie od AI - jest w stanie dać Wam naprawdę dużo.

Jednak poza oczywistym wyborem w tej materii - Midjourney, dostępne są jeszcze inne modele i oparte na nich usługi, z których można korzystać. Poniżej przedstawimy Wam alternatywy dla Midjourney, a także opiszemy, co warto robić, a czego... nie warto w kontekście tworzenia obrazów wprost z tekstu. Okazuje się, że niektóre rzeczy nie są tak w pełni oczywiste i warto pamiętać o kilku rzeczach.

Zestawienie usług do generowania obrazów z AI

Poniższe usługi pozwolą Ci w bardzo prosty sposób wygenerować obrazki z komendy tekstowej. Niektóre z nich są płatne, inne w pełni darmowe - jednak wszystkie: warte uwagi.

Stable Diffusion

Jeśli istnieje model, który może zbliżyć się do Midjourney pod względem zamiany tekstu na obraz, to jest to Stable Diffustion. Co ciekawe, jest darmowy i utrzymany w konwencji open source i co więcej: jest już wykorzystywany przez wiele stron internetowych i aplikacji do szybkiego generowania obrazów na podstawie wprowadzanego tekstu.

Stable Diffustion oparto LAION, OpenCLIP, bazę kodu ADM OpenAI, CompVis i inne. Jak chodzi o Stable Diffusion, muszę powiedzieć, że był on bardzo szybki w generowaniu obrazów.

Choć jakość generowanych obrazów nie dorównuje jeszcze Midjourney, najnowsza beta stara się nadrobić zaległości. Jednym z głównych problemów ze Stable Diffusion jest to, że nie potrafi prawidłowo renderować oczu, dłoni i palców, co sprawia, że wyglądają one nienaturalnie na portretach. Jednak poza tym jest to efektywny model zamiany tekstu na obraz, który zdecydowanie warto wypróbować.

DALL-E 2

DALL-E 2 jest prawdopodobnie najlepszą alternatywą dla Midjourney, jeśli chodzi o generowanie obrazów. Ten model został opracowany przez OpenAI, firmę odpowiedzialną za ChatGPT. Można go wykorzystać do tworzenia fotorealistycznych obrazów na podstawie opisów w języku naturalnym. Firma wprowadziła DALL-E w 2021 roku, a rok później stworzyła DALL-E 2. Jest on znacznie bardziej precyzyjny i realistyczny w generowaniu obrazów, a także oferuje 4-krotnie większą rozdzielczość. Trzeba jednak pamiętać, że DALL-E nie jest darmowy i po zużyciu 15 darmowych kredytów trzeba dokonać ich zakupu.

Najciekawszą cechą DALL-E 2 jest jego zdolność do rozumienia wskazówek i łączenia różnych koncepcji, stylów i atrybutów w celu stworzenia zaskakującego i unikalnego obrazu. Oprócz tego może rozszerzać obrazy, usuwać elementy za pomocą narzędzia Inpainting, dodawać cienie, tekstury, odbicia i wiele więcej. To mega potężny model, który zdecydowanie warto wypróbować.

Bing Image Creator

Microsoft zintegrował możliwość generowania obrazów przy użyciu sztucznej inteligencji z Bing AI Chat. Teraz już właściwie każdy obrazy za pomocą naturalnych wskazówek w interfejsie Bing Chat. Działa jako darmowa usługa dostępna w wyszukiwarce Bing. Należy jednak pamiętać, że po wykonaniu 25 operacji generowania grafik dziennie, na kolejne będziesz musiał odrobinę poczekać. Nie jest tak dobry w generowaniu ludzkich twarzy, a jakość może być nieco niższa niż w przypadku Midjourney, ale ogółem świetnie radzi sobie z szybkim tworzeniem obrazów przy użyciu sztucznej inteligencji - nawet, jeżeli projekt jest bardzo skomplikowany. Jeśli więc szukasz darmowej alternatywy dla Midjourney, warto dać Bing szansę.

Adobe Firefly

Adobe nie stoi w miejscu i wprowadza innowacje, rywalizując z innymi modelami generowania obrazów. W celu konkurowania z Midjourney, Adobe wprowadziło swój własny kreatywny model oparty na sztucznej inteligencji, nazwany Firefly. Posiada wiele narzędzi do generowania obrazów na podstawie tekstu, ubogacania i edycji obrazów, wprowadzania efektów tekstowych, malowania, szkicowania i wiele innych. Większość tych narzędzi jest wciąż rozwijana, ale Adobe już udostępniło narzędzie Text to Image, które jest obecnie dostępne za darmo dla wszystkich użytkowników jako beta. Aplikacja szybko generuje wysokiej jakości obrazy i świetnie radzi sobie z tworzeniem krajobrazów i innych koncepcji. Jednak w przypadku obrazów przedstawiających ludzi nie jest tak fotorealistyczna jak chociażby Midjourney.

Lexica

Lexica to strona internetowa, która opracowała własny model generowania obrazów oparty na stabilnej dyfuzji. Działa również jako wyszukiwarka obrazów generowanych za pomocą Stable Diffusion. Za jej pośrednictwem można wygenerować do 100 obrazów AI miesięcznie bez żadnych opłat. Istnieje również opcja wykupienia planu za 10 USD miesięcznie, który pozwala na generowanie nawet 1000 obrazów w ciągu miesiąca.

Jeśli chodzi o generowanie obrazów, możesz użyć modelu Lexica Aperture v3 lub v2 i wybrać rozmiar obrazu od 768 x 1152 pikseli. W moich krótkich testach Lexica sprawdziła się całkiem dobrze i generowała obrazy wysokiej jakości. Model oparto na Stable Diffusion, więc jakość jest więc wysoka niejako z urzędu.

W dzisiejszych czasach mamy wiele możliwości, jeśli chodzi o generowanie obrazów za pomocą sztucznej inteligencji. Możemy wybierać spośród różnych narzędzi, które pozwalają nam tworzyć obrazy na podstawie wskazówek tworzonych w języku naturalnym.

Wszystkie te alternatywy udowadniają, że dziedzina generowania obrazów przy użyciu sztucznej inteligencji rozwija się w ekspresowym tempie. Możemy cieszyć się coraz bardziej realistycznymi i zaskakującymi obrazami, które mogą być używane w różnych dziedzinach, od sztuki po projektowanie graficzne. Niezależnie od tego, czy jesteś artystą, projektantem czy po prostu chcesz eksplorować możliwości sztucznej inteligencji, warto zainteresować się tymi alternatywnymi modelami i odkryć, jak mogą wpłynąć na Twoją twórczość.

Jak generować obrazy na podstawie języka naturalnego?

Aby osiągnąć jak najlepsze wyniki podczas wprowadzania komend do modeli generujących obrazy AI, istnieje kilka czynników, na które warto zwrócić uwagę.

Po pierwsze, komendy powinny być jasne i precyzyjne. Wprowadzone instrukcje powinny wyraźnie określać, co chcemy uzyskać w wynikowym obrazie. Im bardziej precyzyjne są instrukcje, tym większa szansa na uzyskanie oczekiwanego rezultatu. Na przykład, zamiast powiedzieć "wygeneruj obraz kota", lepiej byłoby określić, jakiego rodzaju kota chcemy, na przykład "wygeneruj obraz kota rasy syjamskiej siedzącego na czerwonym dywanie".

Po drugie, ważne jest uwzględnienie kontekstu i dodanie dodatkowych informacji. Komendy powinny zawierać istotne szczegóły, takie jak tło, perspektywa, oświetlenie lub inne elementy, które pomogą modelowi lepiej zrozumieć zamierzenia użytkownika. Na przykład, jeśli chcemy uzyskać obraz zimowego krajobrazu, możemy dodać informacje o pokrywie śnieżnej, drzewach bez liści i chłodnym oświetleniu, aby precyzyjniej określić, czego oczekujemy.

Dodatkowo, warto eksperymentować z różnymi komendami i wariantami. Często można osiągnąć interesujące rezultaty, wprowadzając nieoczywiste instrukcje lub zestawiając ze sobą różne pojęcia. Twórcy zachęcają do interakcji z modelem poprzez modyfikowanie i uzupełnianie komend w celu doskonalenia wyników.

Jak widać - tworzenie obrazów z pomocą AI nie jest trudne i jest w zasięgu ręki każdego, kto tylko zechce się za coś takiego zabrać. Dla ludzi, którzy nie mają właściwie żadnych umiejętności w grafice - jest to coś naprawdę wartego uwagi. Zdecydowanie Wam polecam.