Sztuczna Inteligencja

Midjourney – wszystko co powinieneś wiedzieć o narzędziu AI do generowania obrazów

Patryk Koncewicz
Midjourney – wszystko co powinieneś wiedzieć o narzędziu AI do generowania obrazów
9

Jak go używać, ile kosztuje i przede wszystkim – czym jest Midjourney? Zebraliśmy najważniejsze informacje.

Tekst pierwotnie ukazał się 15 maja 2023. Przypominamy go z uwagi na aktualizację i duże zainteresowanie tematem.

Tekst aktualizowano 6 czerwca 2024.

Za jego pomocą wygenerujesz najbardziej pokręcone obrazy z Twojej wyobraźni lub połączysz już istniejące grafiki w nowe dzieło. Midjourney to obecnie jedno z najbardziej zaawansowanych narzędzi AI, które trzeba poznać już dziś. Oto wszystko, co powinniście o nim wiedzieć.

Czym jest Midjourney?

Midjourney to narzędzie AI służące do generowania obrazów na podstawie wpisywanych poleceń tekstowych, działające na tej samej zasadzie co DALL-E i Stable Diffusion. Wykorzystuje uczenie maszynowe do tworzenia przepięknych i realistycznych obrazów w zaledwie kilkach chwil, a jedynym zadaniem użytkownika jest wymyślenie zarysu efektu końcowego i użycie odpowiednich słów kluczowych, które będą dla AI zrozumiałem.

Źródło: Depositphotos

Midjourney nie zależy na gramatyce – polecania muszą być proste i szczegółowe, składające się z wyrazów jak najlepiej opisujących pożądaną grafikę. Zanim jednak do tej przejdziemy, omówmy kilka istotnych spraw.

Czy Midjourney jest darmowe?

Było. W marcu zapadła decyzja o usunięciu darmowych planów – zapewniających kilkanaście bezpłatnych wygenerowań – i zastąpienie ich płatną subskrypcją. Dlaczego? Bo po pierwsze narzędzie musi na siebie zarabiać, a po drugie użytkowników zbytnio ponosiła wyobraźnia, czego efektem były obrazy z Trumpem i Papieżem Franciszkiem, które mocno namieszały w sieci.

Obecnie korzystanie z Midjourney jest zarezerwowane dla zarejestrowanych użytkowników i wymaga opłacenia jednego z 3 abonamentów – Basic, Standard lub Pro. Droższe pakiety – oprócz nielimitowanego generowania obrazów – umożliwiają korzystanie z funkcji fast generations. To ważne, bo kolejki do stworzenia obrazu potrafią być naprawdę długie, a wspomniana opcja nadaje nam priorytet i znacznie przyspiesza pracę. Te jednak stanowią niemały wydatek – drugi i trzeci wariant subskrypcji to koszt kolejno 24 i 48 dolarów w ujęciu rocznym, lub 30 i 60 dolarów w rozliczeniu miesięcznym.

Jak korzystać z Midjourney?

Midjourney nie ma dedykowanej aplikacji – wszystkie czynności operowane są przez serwer na Discordzie, który znajdziecie pod tym adresem. Po utworzeniu konta i zalogowaniu się w usłudze na Discordzie pojawi się logo Midjourney, zlokalizowane na pasku nawigacyjnym po lewej stronie ekranu. Znajdziemy tam zakładki newcomer rooms, gdzie odbywa się generowanie grafik.

W Midjourney możemy korzystać z dwóch podstawowych komend – /imagine i /blend. Zatrzymajmy się przy tej pierwszej, bo to właśnie ona pełni rolę podstawowej funkcjonalności.

Po wpisaniu komendy /imagine w dolnym okienku tekstowym okienko prompt otworzy się automatycznie i to tam będziemy musieli wpisać frazę, która posłuży AI do wygenerowania obrazu.

WAŻNE! Przy wpisywaniu komendy tekstowej należy używać możliwie jak najprostszych słów i opisów, które dobrze obrazują oczekiwany efekt, jednak na tyle szczegółowych, by AI nie miało wątpliwości czego oczekujemy. Istnieje kilka szkół generowania grafik – zalecam rozpocząć od schematu "postać/zwierzę/obiekt (do wyboru) w *tu wstaw miejsce/lokalizację* w stylu (steampunk, akwarela, fotorealizm)", by zapoznać się z działaniem narzędzia. Później możecie eksperymentować do woli. 

Oto przykład – poprosiłem Midjourney o wygenerowanie mrocznego, podziemnego miasta, inspirowanego prozą Lovecrafta i mitologią Cthulhu oraz potwora czyhającego w jaskini.

AI wygeneruje 4 warianty obrazków, a każdy z nich możemy modyfikować, ulepszać lub stworzyć na nowo. Zwróćcie uwagę na kafelek z literami U oraz V. Odpowiadają one kolejnym obrazkom i za ich pomocą możemy edytować wygenerowane treści – U oznacza w tym przypadku update wizualny konkretnego wariantu, a V to nic innego jak prośba wygenerowania nowych grafik na podstawie wybranego obrazu.

Kliknięcie w ikonę strzałek wymusi na AI powtórzenie pracy i wygenerowanie grafik od nowa.

Komenda /blend to zupełnie inna bajka. Dzięki niej możemy połączyć dwa obrazy w jedną grafikę i choć nie działa to jeszcze idealnie, to i tak możemy uzyskać ciekawe efekty, o czym pisałem szerzej w tej publikacji.

Polecenie otworzy okienka, które możemy uzupełnić własnymi obrazami z galerii lub dysku, a te zostaną następnie zmiksowane w jedną grafikę. Ostrzegam jednak, że funkcja ta wciąż wymaga poprawek – możecie więc spodziewać się naprawdę komicznych i pokręconych efektów.

Generowanie obrazów trwa od kilku do nawet kilkunastu minut w zależności od stopnia zaawansowania polecenia, obciążenia serwerów i oczywiście posiadanego pakietu – przypomnę, że wariant Standard i Pro zapewniają nieco szybsze efekty.

Czy mogę używać obrazów z Midjourney komercyjnie?

Tak, subskrybenci mogą używać narzędzia do użytku komercyjnego, ale trzeba pamiętać, że AI szkolone jest na puli obrazów innych artystów. Oznacza to, że ktoś może rościć sobie prawa do wygenerowanego obrazu, jeśli ten ewidentnie kopiuje jego pracę bez wyraźnego oznaczenia.

Źródło: Depositphotos

Trzeba mieć też na uwadze publiczną dostępność grafik i zdjęć udostępnianych na serwerze Discord (zwłaszcza w przypadku opcji /blend). Wgląd ma bowiem każdy z użytkowników, dlatego zalecam dobierać grafiki w graniach rozsądku. No, chyba że korzystacie z abonamentu Pro – zapewnia ona opcję cichego generowania, przez co nasze grafiki nie wyświetlają się publicznie.

Czy warto skorzystać z Midjourny?

Owszem, zwłaszcza w przypadku branży kreatywnej. Narzędzie może posłużyć do generowania fantastycznych okładek książek, grafik do postów w mediach społecznościowych czy fotorealistycznych obrazów do użytku hobbystycznego i domowej biblioteki. To także świetne narzędzie do wejścia w świat AI i zapoznania się z generatorami grafik z uwagi na prostotę użytkowania. Miesiąc testowej zabawy w Midjourney to koszt około 50 zł – to relatywnie niewielka cena za możliwości, które oferuje narzędzie i gwarantuję, że nie będziecie zawiedzeni.

Źródło: Depositphotos

Zaawansowane techniki generowania obrazów w Midjourney

Midjourney oferuje szeroką gamę zaawansowanych technik, które pozwalają użytkownikom na tworzenie bardziej złożonych i unikalnych obrazów. Aby w pełni wykorzystać potencjał tego narzędzia, warto poznać kilka trików i strategii, które mogą znacząco poprawić jakość i precyzję generowanych grafik.

Optymalizacja komend tekstowych

Kluczowym elementem generowania obrazów w Midjourney jest umiejętność tworzenia skutecznych komend tekstowych. Podstawową techniką jest użycie prostych, ale szczegółowych słów kluczowych, które dokładnie opisują oczekiwany efekt. Na przykład, zamiast wpisywać "dog in a park," można użyć bardziej szczegółowego opisu, takiego jak "small brown dog playing in a green park, watercolor style." Taki poziom szczegółowości pomaga AI lepiej zrozumieć intencje użytkownika i generować bardziej precyzyjne obrazy.

Eksperymentowanie z różnymi stylami

Midjourney pozwala na tworzenie obrazów w różnych stylach artystycznych, takich jak steampunk, photorealism, watercolor, czy cyberpunk. Użytkownicy mogą eksperymentować z różnymi stylami, aby znaleźć ten, który najlepiej pasuje do ich wizji. Łączenie technik w jednej komendzie może prowadzić do unikalnych i interesujących efektów wizualnych. Na przykład, można poprosić o wygenerowanie obrazu "futuristic city in steampunk style with cyberpunk elements."

Wykorzystanie zaawansowanych parametrów

Midjourney oferuje szereg zaawansowanych parametrów, które pozwalają na dokładniejsze dostosowanie wyników. Parametry te mogą obejmować takie aspekty jak kolorystyka, poziom szczegółowości, proporcje obrazu, a nawet specyficzne techniki artystyczne. Używanie parametrów takich jak "--ar" (aspect ratio) czy "--v" (version) może pomóc w uzyskaniu bardziej dopasowanych wyników. Na przykład, komenda "futuristic landscape --ar 16:9 --v 4" dostosuje proporcje obrazu i wersję algorytmu Midjourney do bardziej specyficznych potrzeb.

Tworzenie serii obrazów

Jednym z bardziej zaawansowanych zastosowań Midjourney jest generowanie serii powiązanych ze sobą obrazów, które opowiadają historię lub przedstawiają różne aspekty tego samego tematu. Można to osiągnąć poprzez konsekwentne używanie określonych słów kluczowych i stylów w wielu komendach. Na przykład, można stworzyć serię obrazów przedstawiających różne sceny z życia w futurystycznym mieście, zachowując spójność stylu i atmosfery z komendą "futuristic cityscape, neon lights, cyberpunk theme."

Łączenie obrazów za pomocą komendy /blend

Komenda /blend pozwala na połączenie co najmniej dwóch obrazów w jedno dzieło. Ta funkcja jest szczególnie przydatna, gdy chcemy uzyskać kompozycję zawierającą elementy z różnych źródeł. Choć funkcja ta wciąż wymaga poprawek, oferuje duży potencjał dla twórców chcących eksperymentować z miksowaniem stylów i tematów. Na przykład, można połączyć obraz futurystycznego miasta z obrazem dzikiej przyrody, aby stworzyć unikalną hybrydę obu światów używając komendy "/blend image1.jpg image2.jpg." Pamiętajmy jednak, że to my musimy dostarczyć przywołany "obraz1" i "obraz2".

Praca z warstwami i dalsza edycja

Chociaż Midjourney nie oferuje rozbudowanych funkcji edycyjnych, użytkownicy mogą eksportować wygenerowane obrazy i pracować nad nimi w programach graficznych takich jak Photoshop czy GIMP. Dzięki temu możliwe jest dalsze dostosowywanie i poprawianie wygenerowanych grafik, dodawanie warstw oraz integracja z innymi elementami wizualnymi. Taka kombinacja generowania obrazów i tradycyjnej edycji graficznej pozwala na osiągnięcie naprawdę imponujących rezultatów.

Midjourney – Aspekty prawne i etyczne

Korzystanie z narzędzi AI do generowania obrazów, takich jak Midjourney, wiąże się z wieloma wyzwaniami prawnymi i etycznymi. Jednym z najważniejszych aspektów prawnych jest kwestia praw autorskich. Obrazy generowane przez sztuczną inteligencję często korzystają z ogromnych zbiorów danych, które mogą zawierać prace innych artystów. Istnieje ryzyko, że wygenerowane obrazy mogą naruszać prawa autorskie, szczególnie jeśli są bardzo podobne do istniejących dzieł. Użytkownicy powinni być świadomi tych ryzyk i starać się unikać generowania treści, które mogłyby naruszać prawa innych.

Drugim ważnym aspektem jest kwestia komercyjnego wykorzystania wygenerowanych obrazów. Midjourney umożliwia użytkownikom komercyjne użycie wygenerowanych treści, jednak należy pamiętać, że obrazy te mogą zawierać elementy pochodzące z innych źródeł, które mogą być objęte prawami autorskimi. Użytkownicy powinni upewnić się, że wygenerowane obrazy nie naruszają praw osób trzecich przed ich komercyjnym wykorzystaniem. Warto również zapoznać się z warunkami licencji oferowanej przez Midjourney, aby zrozumieć, jakie prawa i ograniczenia są związane z wygenerowanymi treściami.

Etyczne aspekty korzystania z AI do generowania obrazów również wymagają uwagi. Jednym z głównych problemów jest potencjalne nadużywanie technologii do tworzenia dezinformacji lub fałszywych treści. Obrazy generowane przez AI mogą być używane do tworzenia realistycznych, ale nieprawdziwych scen, co może prowadzić do dezinformacji i manipulacji opinią publiczną. Użytkownicy powinni stosować narzędzia takie jak Midjourney w sposób odpowiedzialny i unikać tworzenia treści, które mogą wprowadzać w błąd lub szkodzić innym.

Kolejnym etycznym wyzwaniem jest kwestia oryginalności i wartości artystycznej wygenerowanych obrazów. Sztuczna inteligencja może tworzyć dzieła, które na pierwszy rzut oka wydają się oryginalne, ale w rzeczywistości są wynikiem przetwarzania ogromnych ilości danych, w tym prac innych artystów. Warto zastanowić się nad miejscem tych dzieł w świecie sztuki i nad tym, jak wpływają one na wartość pracy twórczej ludzi.

Odpowiedzialność za treści generowane przez AI spoczywa obecnie na użytkownikach, gdyż prawo najwyraźniej nie nadąża nad korporacjami, które tworzą narzędzia. Używając platform takich jak Midjourney, powinniśmy przestrzegać obowiązujących przepisów prawa, zasad etyki oraz najlepszych praktyk w zakresie korzystania z technologii. Obejmuje to świadome podejście do kwestii praw autorskich, unikanie dezinformacji oraz promowanie uczciwego i odpowiedzialnego korzystania z technologii AI. Być może za jakiś czas doczekamy się regulacji, które pociągają do odpowiedzialności gigantów technologicznych. Na razie każdy robi co może, aby odkroić sobie kawałek tortu z napisem "AI", nie za bardzo przykładając wagę do konsekwencji moralnych...

Stock image from Depositphotos.

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu