Midjourney wprowadza rewolucyjną funkcję do tworzenia spójnych postaci w AI

Midjourney, popularna usługa generowania obrazów AI, ogłosiła wprowadzenie innowacyjnej funkcji, która umożliwia tworzenie spójnych postaci w różnych generowanych obrazach.

Spis treści

1 Nowa funkcja Midjourney zmienia zasady gry

2 Techniczne aspekty nowej funkcji

3 Funkcja –cref w Midjourney – jak jej używać?

4 Potencjalny wpływ na przyszłość generatywnej sztuki AI

Nowa funkcja Midjourney zmienia zasady gry

Midjourney wzbogaca się o funkcję, która zrewolucjonizuje sposób, w jaki twórcy i artyści korzystają z AI. Tę zmianę napędza wprowadzenie tagu –cref, umożliwiającego generowanie spójnych postaci za pomocą wrzucenia w prompt jednego linku. To rozwiązanie otwiera nowe możliwości dla twórców treści, którzy pragną zachować ciągłość narracyjną swoich postaci w różnych dziełach wizualnych.

Klasyczne modele generatywne AI, takie jak modele dyfuzji oparte na algorytmie Stable Diffusion, mają trudności z utrzymaniem spójności generowanych obiektów (bez trenowania własnego modelu LORA) przez ich tendencję do tworzenia unikalnych odpowiedzi na każde zapytanie. Dzięki nowej funkcji Midjourney, użytkownicy mogą teraz nadawać swoim tworzeniom bardziej spersonalizowany i koherentny charakter. To szczególnie istotne w dziedzinie kreowania postaci, gdzie spójność wizualna odgrywa kluczową rolę.

Techniczne aspekty nowej funkcji

Nowa funkcja –cref w Midjourney działa poprzez dodanie właśnie takiego parametru do końca swoich poleceń tekstowych w Discordzie Midjourney, aby dopasować rysy twarzy, typ ciała i ubranie postaci z URL, który użytkownik wkleja po tym tagu. Ponadto, użytkownicy mają kontrolę nad „wagą” reprodukowania postaci, stosując tag –cw wraz z liczbą od 1 do 100, co pozwala regulować stopień odwzorowania pierwotnej postaci.

Funkcja najlepiej współpracuje z obrazami wcześniej wygenerowanymi przez Midjourney.
Twórcy mogą eksperymentować z różnymi stopniami reprodukcji postaci, dostosowując wartość „cw”.
Chociaż technika ta ma swoje ograniczenia, takie jak niemożliwość dokładnego kopiowania drobnych szczegółów jak piegi czy loga na koszulkach, jej potencjał jest ogromny.

Funkcja –cref w Midjourney – jak jej używać?

Zacznijmy od zera i wygenerujmy nową postać z następującym promptem: realistic photo of blonde surfer man with glasses and red baseball cap.

Przeskalujemy obraz, który najbardziej nam się podoba, a następnie klikając na niego prawym przyciskiem myszy na serwerze Midjourney Discord, wybierzmy opcję “kopiuj link”.

Funkcja --cref w Midjourney – jak jej używać?

Następnie możemy wpisać nowy prompt, np. wearing winter jacket on a sunny beach -cref [URL] i wkleić adres URL obrazu, który właśnie wygenerowaliśmy, a Midjourney spróbuje wygenerować tę samą postać w naszym nowo wpisanym ustawieniu.

generowanie spójnych postaci w midjourney

Jak widzisz Midjourney idealnie poradziło sobie z odwzorowaniem postaci. Co do pozostałych elementów, takich jak “winter jacket” można mieć zastrzeżenia, ale czasami trzeba poeksperymentować, aby uzyskać dokładnie to, co chcemy.

Potencjalny wpływ na przyszłość generatywnej sztuki AI

Zdolność do konsekwentnego odtwarzania postaci otwiera nowe horyzonty dla twórców treści. Możliwość utrzymania ciągłości wizualnej postaci w różnych projektach bez wątpienia sprawi, że Midjourney stanie się nieocenionym narzędziem dla artystów, pisarzy i twórców filmów. To tylko przykład, jak szybko rozwija się dziedzina sztucznej inteligencji, oferując narzędzia, które jeszcze kilka lat temu wydawałyby się science fiction.

Nowa funkcja wpisuje się w trend tworzenia bardziej spersonalizowanych i spójnych treści wizualnych.
Spodziewany jest wzrost zainteresowania ze strony profesjonalistów poszukujących nowych sposobów na wykorzystanie AI.

Midjourney V6 jeszcze znajduje się w fazie alpha, co oznacza, że funkcje mogą ulec zmianie. Niemniej jednak, już teraz społeczność twórców z zainteresowaniem przyjmuje nową funkcję, testując jej możliwości. Midjourney nieustannie przechodzi ewolucję, dążąc do zaspokojenia rosnących potrzeb swoich użytkowników.