Filmy

exai.plTechnologia AI

OpenAI prezentuje Sora, AI do tworzenia wideo z tekstu. Zaskakuje możliwościami.

Krzysztof Niewiadomski

16/02/2024 | 01:39

OpenAI ogłosiło uruchomienie Sora, narzędzia, które może przekształcić tekst w wideo trwające do jednej minuty. Chociaż Sora wciąż znajduje się na etapie badań i nie została jeszcze dodana do oferty firmy, to zapowiedź ta stanowi znaczący krok naprzód w dziedzinie generatywnej AI.

Spis treści

1 Konkurencja nie śpi

1.1 Sora – jak to działa?

1.2 Bezpieczeństwo i etyka na pierwszym planie

1.3 Perspektywy i dalsze kroki

Konkurencja nie śpi

Nie tylko OpenAI eksploruje ten obszar. Inne firmy, takie jak Meta, Google i Runway, również ogłosiły lub wprowadziły na rynek własne silniki tekst-na-wideo.

Na przykład Meta wprowadziło Make-A-Video, system AI umożliwiający tworzenie krótkich, wysokiej jakości klipów wideo z podanych tekstów.
Te innowacje otwierają nowe możliwości dla twórców i artystów, dając narzędzia do szybkiego i łatwego tworzenia nowych treści.

Sora – jak to działa?

Sora wykorzystuje model dyfuzji do generowania złożonych scen z wieloma postaciami, konkretnymi rodzajami ruchu oraz dokładnymi szczegółami przedmiotu i tła. Co ważne, Sora potrafi zrozumieć niuanse podanych wskazówek oraz sposób, w jaki różne obiekty zachowują się w fizycznym świecie.

Inną innowacją jest generowanie całego wideo za jednym razem, zamiast tworzenia go klatka po klatce. To rozwiązanie ma na celu uniknięcie problemów, z którymi borykały się inne modele, takie jak utrzymanie spójności postaci, nawet gdy tymczasowo znika z pola widzenia.

Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024

Bezpieczeństwo i etyka na pierwszym planie

OpenAI podkreśla, że na razie nie planuje szerokiego udostępnienia Sory, ponieważ kontynuuje pracę nad szeregiem kwestii związanych z bezpieczeństwem, w tym wysiłkami na rzecz zmniejszenia dezinformacji, treści pełnych nienawiści i stronniczości, a także wyraźnego oznaczania wyników jako generowanych przez AI.

Ta ostrożność jest odzwierciedleniem szerszej debaty na temat etyki i bezpieczeństwa w AI, co widać na przykład w inicjatywach takich jak dobrowolne zobowiązania do znakowania wodnego treści generowanych przez AI, ogłoszone przez firmy AI w odpowiedzi na apel Białego Domu.

Perspektywy i dalsze kroki

Sora jest obecnie dostępna dla “red teamerów” do oceny potencjalnych zagrożeń i szkód, co jest standardową praktyką w rozwoju bezpiecznych technologii AI.

OpenAI udostępnia również dostęp do narzędzia wybranym artystom wizualnym, projektantom i filmowcom, aby zebrać opinie na temat tego, jak model może być najbardziej pomocny dla profesjonalistów twórczych.

To podejście, polegające na wczesnym dzieleniu się postępami badawczymi i zbieraniu opinii z zewnątrz, ma na celu lepsze zrozumienie potencjalnych zastosowań i wyzwań związanych z Sora, zanim narzędzie zostanie szerzej udostępnione.

W kontekście szybkiego rozwoju technologii AI, Sora stanowi obiecujący krok naprzód w generatywnym tworzeniu treści wideo.

Dodaj komentarz Anuluj pisanie odpowiedzi