Midjourney to narzędzie sztucznej inteligencji, które potrafi generować obrazy na podstawie opisów tekstowych. Jest to jeden z wielu generatorów obrazów opartych na uczeniu maszynowym, które pojawiły się w ostatnich latach. Mimo to, Midjourney stało się jednym z najpopularniejszych i najpopularniejszych narzędzi tego typu, obok DALL-E i Stable Diffusion.
Ile kosztuje Midjourney
Obecnie niestety nie posiada żadnego darmowego, testowego planu. Podstawowy plan kosztuje 10$ miesięcznie i pozwala wygenerować około 200 obrazów.
Jak zacząć korzystać z Midjourney
Midjourney używa się w dość specyficzny sposób, za pośrednictwem aplikacji Discord. Z doświadczenia wiem, że może to sprawiać problemy dlatego jego obsłudze poświęcimy trochę więcej czasu.
Discord to aplikacja, której można używać przez przeglądarkę tak więc nie musimy instalować żadnego dodatkowego oprogramowania.
Wchodzimy na midjourney.com i kilkamy przycisk Join beta
Zostaniemy przekierowani do aplikacji Discord gdzie musimy zarejestrować nowe konto.
Uzupełniamy nazwę użytkownika, datę urodzenia oraz adres email. Na koniec potwierdzamy rejestrację klikajac link który przyjdzie na naszą skrzynkę pocztową.
Nasze konto discord zostało założone. Wracamy na stronę midjourney.com, przechodzimy do naszego nowo utworzonego profilu i klikamy Purchase Plan.
Wybieramy plan wg cennika. Przypominam, że jest to subskrypcja, więc jeśli jej nie wyłączymy płatność będzie się odnawiała co miesiąc automatycznie.
Gotowe! Teraz możemy przejść do aplikacji Discord discord.gg/midjourney
Poruszanie się po serwerze Discord
Serwer discord przypomina swoją budową komunikator internetowy z różnymi pokojami. W zasadzie właśnie do tego celu został stworzony.
Aby wejść do MidJourney kilkamy ikonkę łódki po lewej strony (jeśli to twój pierwszy kontakt z discordem to będzie jedyna ikona).
Dla osób które zaczynają swoją przygodę z MidJourney przeznaczone są pokoje ‘Newbies’ – kliknij w jeden z nich.
Na środku pojawi ci się pole z promptami oraz grafikami wygenerowanymi przez innych aktywnych użytkowników. Jest to miejsce gdzie wszyscy użytkownicy danego kanału wpisują swoje prompty i tworzą swoje grafiki.
Kanały możesz zmieniać (nie ma żadnych reguł pod tym względem) i obserwować tworzenie grafik przez innych użytkowników.
Każdy taki wpis użytkownika składa się z
- tekstu prompta (czyli opisu grafiki, którą AI ma wygenerować)
- czterech grafik, które są tworzone za każdy razem kiedy wpiszesz prompta,
- nazwą użytkownika,
- formatem w jakim został stworzony (fast / relax – co to jest wyjaśnię później)
- oraz kilkoma ikonami pod nimi:
Pod grafiką zobaczysz ikony U i V.
Nawet jeśli nie jesteś autorem grafiki możesz mieć na nią wpływ.
Możesz poprosić MJ aby powiększył wybraną z grafik. Każda z grafik ma swój numer przykładowo kilkając przycisk “U3” („U” od „Upscale”) powiększysz dolną grafiką od lewej strony. .
Przycisk V oznacza ‘version’. Po kliknięciu przycisku V1 na naszym przykładzie, MidHourney wygeneruje kolejne 4 obrazki wzorujące się na pierwszym obrazku od góry.
Ikonka z białymi strzałkami powoduje ponowne wygenerowanie grafiki przy użyciu tego samego promptu.
Po powiększeniu pojedynczego obrazka (ikonka U) zobaczymy kolejny zestaw nowych ikon.
- Strzałki – pozwalają wygenerować nowy obrazek rozszerzony w stronę w którą wskazuje strzałka. Po kliknięciu strzałki w prawo, otrzymamy:
- Zoom – wygenerowanie nowego, przybliżonego obrazka.
- Vary – stworzy odmianę przeskalowanego obrazu i generuje nową siatkę czterech opcji na podstawie tej grafiki.
- Web – zapisze grafikę w naszej galerii na stronie https://midjourney.com/
- Serce – oznaczy grafikę jako „ulubioną” aby łatwiej ją było później znaleźć w galerii.
Galeria grafik
Standardowo wszystkie wygenerowane grafiki będą pokazywać się na czacie Discorda. Z czasem może być trudne ich odnalezienie dlatego wybrane obrazy możemy zapisać w Galerii.
Przechodzimy na nasze konto na stronie głównej Midjourney klikając Sign in w prawym dolnym rogu strony.
Po zalogowaniu zobaczymy wszystkie zapisane wcześniej obrazy.
W galerii możesz pobrać każdy obraz na dysk. Możesz również zaznaczyć wiele obrazów na raz (klikając w strzałkę w prawym górnym rogu) i pobrać je na raz, w jednej paczce.
Tworzenie komend
Tworzenie komend do Midjourney, inaczej prompt engineering to technika optymalizacji sposobu zadawania pytań modelom językowym bazującym na technologii AI. Chodzi o precyzyjne formułowanie pytań czy instrukcji (tzw. „promptów”), aby uzyskać od modelu odpowiedzi jak najbardziej zbliżone do oczekiwań.
Użytkownicy na ogół używają surowych i bezpośrednich promptów co pozostawia AI pełną dowolność w interpretacji.
Przykładowo podanie prostej instrukcji takiej jak: „cat on the beach” spowoduje, że praktycznie nie mamy wpływu co AI nam wygeneruje. Nie określiliśmy jaki kot, na jakiej plaży, w jakiej scenerii i jaki to ma być obraz. Im więcej szczegółów tym bardziej spersonalizowany wynik uzyskamy.
Jak wprowadzać prompty w Midjourney?
Na naszym serwerze Discord zjeżdżamy na sam dół.
W pustym polu wpisujemy komendę /imagine . Pojawi nam się czarny znacznik prompt w którym wpisujemy swoje polecenie będące informację jaką grafikę ma stworzyć dla nas AI.
Zatwierdzamy klikając enter.
Prompty wpisujemy wyłącznie w jezyku angielskim. W przeciwieństwie do ChatGPT, Midjourney słabo radzi sobie z naszym językiem.
Interpunkcja i zaawansowane ustawienia w promptach
Podczas tworzenia promptów w Midjourney należy pamiętać, że większość znaków interpunkcyjnych nie będzie miała znaczenia.. Jedynymi znakami interpunkcyjnymi, które są istotne w komunikacji, są następujące:
- Podwójne myślniki ograniczają parametry, na przykład „–-ar 16:9” lub „–-v 5”.
- Podwójne średniki ograniczają liczby całkowite (dodatnie i ujemne) dla wag. Na przykład „::-0.5”.
- Spacje są używane do oddzielenia każdego zapytania.
Wagi poszczególnych elementów obrazu
Czym jest „waga” w Midjourney? Generując obraz możesz wyodrębnić mniej lub bardziej ważne jego elementy.
Poprzez użycie oznaczenia „[element obrazu]::” dostosujesz wagę różnych elementów w Twoim poleceniu. Wagę możesz zastosować do jednego słowa lub do całego wyrażenia, wtedy umieść je w nawiasach [].
Wagę możesz również stopniować dodając cyfry dodanie i ujemne, jednak pamiętaj aby suma wag była liczbą dodatnią.
Przykładowo:
[cup with coffee]::3, [cake]::1, in a cafe on the table.
Głównym elementem grafiki jest filiżanka z kawą. a tort jest jako dodatek.
Zupełnie co innego otrzymamy jeśli zamienimy proporcje:
[cup with coffee]::1, [cake]::3, in a cafe on the table
--style raw
(styl)
Mówiąc najprościej, --style raw
używamy, gdy chcemy mieć większą kontrolę nad swoimi obrazami. Obrazy utworzone zz parametrem raw będą
mniej korzystać z domyślnego algorytmu MidJourney, co oznacza, że uzyskasz dokładniejsze dopasowanie, gdy poprosisz o jakiś określony styl.
--stylize
(stylizacja)
Bot MidJourney został przeszkolony do tworzenia obrazów preferujących artystyczny kolor, formy i kompozycję. Dodanie parametru --stylize
(lub samo --s
) może wpłynąć na to, jak mocno chcesz zastosować ten trening. W wersji MidJourney 5.2 domyślną wartością --stylize
jest 100. Zakres jaki możesz ustawić to od 0 do 1000.
Niskie wartości --stylize
dają obrazy ściśle powiązane z promptem, ale mniej artystyczny; natomiast wysokie tworzą obrazy, które są bardziej artystyczne, ale mogą znacząco odbiegać od Twojej komendy.
Poniżej przykład dla parametru –s 400
Jak komunikować się z AI aby uzyskać dokładnie to co chcę
Skuteczny prompt powinien być zwięzły, ale jednocześnie bogaty w szczegóły. Unikaj ogólników i bądź jak najbardziej specyficzny.
Midjourney lepiej reaguje na opisy zawierające emocje i wizualne detale. Dodawanie takich elementów jak “spokojny”, “tajemniczy”, “żywy” może znacząco wpłynąć na wynikowy obraz.
Proste prompty, nawet jedno słowo lub emoji, mogą generować obrazy, ale to czego sam nie określisz, zostanie wygenerowane losowo. Dlatego im więcej szczegółów wypiszesz, tym bardziej spersonalizowaną grafikę otrzymasz.
Znaczenie gramatyki i słownictwa
Bot Midjourney nie interpretuje gramatyki ani struktury zdania tak jak ludzie, choć w nadchodzącej wersji v6 ma to zostać znacząco poprawione. Precyzyjny dobór słów jest kluczowy. Unikaj zbędnych słów, aby każde miało większy wpływ na obraz. Bot nie interpretuje znaków interpunkcyjnych ani wielkości liter.
Wszystko, czego nie wspomnisz, zostanie uzupełnione przez AI, co może prowadzić do niespodziewanych rezultatów. Bądź jak najbardziej precyzyjny w opisie ważnych dla Ciebie szczegółów i kontekstu.
Podstawowe Elementy Promptu
- Określ podmiot: osoba, zwierzę, postać, miejsce, przedmiot itp.
- Wybierz technikę: zdjęcie, obraz, ilustracja, rzeźba, bazgroł, arras itp.
- Zdefiniuj środowisko: w pomieszczeniu, na zewnątrz, na Księżycu, w Narnii, pod wodą, w Szmaragdowym Mieście itp.
- Określ oświetlenie: delikatne, otoczeniowe, zachmurzone, neonowe, światła studyjne itp.
- Wybierz paletę kolorów: żywe, stonowane, jaskrawe, monochromatyczne, kolorowe, czarno-białe, pastelowe itp.
- Zdefiniuj nastrój: spokojny, opanowany, huczny, energetyczny itp.
- Określ kompozycję: portret, zdjęcie do dokumentów, zbliżenie, widok z lotu ptaka itp.
Konkretne liczby, jak “trzy koty”, są bardziej precyzyjne niż ogólne “koty”. Rzeczowniki zbiorowe, takie jak “stado ptaków”, również są skuteczne.
Pamiętaj, że AI operuje na bazie istniejących danych i obrazów. Jeśli twoje polecenie będzie zbyt abstrakcyjne lub nierealistyczne, wyniki mogą być nieprzewidywalne. Staraj się znaleźć równowagę między kreatywnością a realnością.
Gdy już opanujesz podstawy, spróbuj eksperymentować z bardziej zaawansowanymi ustawieniami promptów. Możesz dodawać parametry, takie jak proporcje obrazu, lub używać określonych słów kluczowych, aby podkreślić ważne dla ciebie elementy.
Midjourney – jak dodać własne zdjęcie
Możemy wygenerować nowy obraz na podstawie dowolnego zdjęcia z internetu. Wystarczy kliknąć na dowolnie wybraną grafikę prawym przyciskiem myszy i wybrać: „Kopiuj adres obrazu„.
Jeśli zdjęcie masz na dysku – po prostu wrzuć je do czatu Discord a następnie skopiuj do niego adres.
Następnie przechodzimy do Discord i po znaczniku /imagine wklejami link do zdjęcia a następnie od razu po spacji wpisujemy treść komendy.
Znasz już podstawy korzystania z Midjourney
Gratulacje! Znasz już podstawy korzystania z Midjourney – przełomowego narzędzia AI do generowania obrazów. Opanowałeś sztukę tworzenia efektywnych promptów, zrozumiałeś znaczenie precyzyjnego opisu i nauczyłeś się dostosowywać parametry, aby uzyskać pożądane efekty.
Te umiejętności są kluczowe, aby rozpocząć swoją przygodę z tworzeniem sztuki AI i odkrywać nieskończone możliwości, jakie oferuje Midjourney.
Choć podstawy są niezbędne, to tylko początek podróży. Midjourney oferuje znacznie więcej zaawansowanych funkcji, które pozwalają na pełne wykorzystanie potencjału tego narzędzia. Aby w pełni zrozumieć i wykorzystać zaawansowane funkcje Midjourney, przygotowaliśmy specjalny kurs, który pokaże Ci, jak maksymalnie wykorzystać możliwości tej technologii.
W naszym kursie poznasz tajniki zaawansowanego korzystania z Midjourney. Dowiesz się, jak:
- Tworzyć złożone i szczegółowe obrazy, wykorzystując zaawansowane techniki promptowania.
- Eksperymentować z różnymi stylami i estetykami, aby osiągnąć unikalne efekty wizualne.
- Wykorzystywać Midjourney do tworzenia profesjonalnych projektów graficznych, artystycznych i komercyjnych.
- Rozumieć i dostosowywać ustawienia techniczne, aby uzyskać najlepszą jakość i detale obrazów.
- Analizować i interpretować wyniki, aby nieustannie doskonalić swoje umiejętności.
Podstawowa wiedza, którą zdobyłeś, jest fundamentem, na którym możesz budować bardziej zaawansowane umiejętności. Nasz kurs to nie tylko szansa na rozwinięcie tych umiejętności, ale również okazja do dołączenia do społeczności innowatorów i twórców, którzy wykorzystują AI, aby przekształcać swoje wizje w rzeczywistość.
Zapraszamy Cię do rozpoczęcia tej ekscytującej podróży i pełnego wykorzystania potencjału Midjourney. Dołącz do naszego kursu już dziś i odkryj, jak możesz w 100% wykorzystać to niesamowite narzędzie do tworzenia sztuki AI. Twoja przygoda z Midjourney to dopiero początek – przekonaj się, dokąd może Cię zaprowadzić!