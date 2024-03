Sora to kolejny ogromny projekt OpenAI

Sora, chociaż nie jest pierwszym modelem zdolnym do generowania wideo na podstawie opisu tekstowego, to jako projekt OpenAI, prawdopodobnie stanie się jednym z najbardziej popularnych. Od jakiegoś czasu OpenAI jest wiodącą firmą w kwestii wszystkich narzędzi opartych na sztucznej inteligencji i to właśnie ta firma jest pionierem większości rozwiązań, co naturalnie wpływa na to, że ich projekty są najbardziej popularne i rozpoznawalne.

Źródło: Depositphotos

Według Sama Altmana, dyrektora generalnego firmy, w którą Microsoft zainwestował prawdziwą fortunę, Sora jest w stanie generować krótkie filmy (do 1 minuty) na podstawie opisu tekstowego, uwzględniając głównego bohatera, otoczenie oraz nawet zasady fizyki. Sora do tego umożliwia animację dowolnego obrazu, edycję istniejącego materiału wideo oraz dodawanie dodatkowych scen czy też rozszerzanie perspektywy. Na stronie demonstrującej możliwości tego modelu znajduje się kilkadziesiąt różnych filmów wygenerowanych przez sztuczną inteligencję na podstawie krótkich opisów słownych.

Obecnie dostęp do tego modelu jest ograniczony wyłącznie do osób pracujących w OpenAI. Jak donosiłem niedawno, Mira Murati, naczelny dyrektor techniczny w OpenAI, w wywiadzie z The Wall Street Journal, zdradziła, kiedy to się zmieni… a także poruszyła kilka innych kwestii. Zacznijmy jednak od pozytywnej strony: kiedy będziemy mogli sami korzystać z tego modelu językowego? Zgodnie z zapowiedziami Murati, Sora pojawi się „zdecydowanie w tym roku”, a potencjalnie „za kilka miesięcy”.

Źródło: Microsoft

Najważniejsze ogłoszenia podczas wywiadu

Poza przybliżoną datą premiery, Murati potwierdziła również, że firma chce umożliwić użytkownikom edycję wyników poprzez bezpośrednie proszenie o naprawienie błędów w filmach i modyfikowanie promptów. To jest bardzo ważna funkcja, która naprawdę może wywrócić branżę wideo do góry nogami. Co jednak istotne i o czym trzeba wspomnieć, to fakt, że Sora na razie nie będzie na razie współpracować z dźwiękiem.

Źródło: OpenAI

Najdziwniejsza strona tego wywiadu

Co jednak było najdziwniejsze podczas tego wywiadu, to odpowiedź Murati na pytanie dotyczące tego, na bazie jakich materiałów powstawała Sora. Joanna Stern zadała pytanie naczelnej dyrektorce technicznej OpenAI, jakich materiałów użyto do trenowania Sory, na co Murati odpowiedziała, że firma korzystała z publicznie dostępnych oraz licencjonowanych zasobów. Dziennikarka dopytała więc, czy OpenAI korzystało z filmików na YouTube, na co Murati odpowiedziała, że… nie jest pewna. Dalej dostała pytanie, czy były to więc materiały z Facebooka czy Instagrama, a na co odpowiedziała, że jeśli były one dostępne publicznie to możliwe, że tak, ale nie jest tego pewna i nie może odpowiedzieć na to pytanie z pełnym przekonaniem.

Stern dopytała, czy OpenAI korzystało z materiałów Shutterstocka, jako, że twórcy Sory z nimi współpracują. Murati tutaj urwała już dalszy dialog, mówiąc, że nie będzie wchodzić w szczegóły dotyczące tego, jakich materiałów używano do trenowania Sory, ponownie zaznaczając, że były to publicznie dostępne lub licencjonowane dane. Po wywiadzie Murati potwierdziła dziennikarce, że OpenAI korzystało z narzędzi Shutterstocka.

Trudno powiedzieć, czy Murati faktycznie nie miała takiej wiedzy, czy nie chciała jej mieć podczas wywiadu i był to jeden, wielki i dość dziwny spektakl. Nie było to najlepsze możliwe wystąpienie Murati mając na uwadze spore trzęsienie ziemi w OpenAI w ostatnim czasie, szczególnie mając na uwadze ostatni pozew od Elona Muska dla całej firmy, która — jak twierdzi ekscentryczny miliarder — zdecydowanie zagubiła się w swoich początkowych wartościach.

Źródło: The Wall Street Journal