Sztuczna Inteligencja

Google zamienia tekst w filmy. Zobacz, co potrafi Veo

Patryk Koncewicz
Google zamienia tekst w filmy. Zobacz, co potrafi Veo
Reklama

OpenAI dalej chowa w szafie "rewolucyjną" Sorę. Z tych opóźnień korzysta Google, udostępniając swój nowy model do generowania wideo.

Czasy generowania wideo z tekstowych promptów nachodzą wielkimi krokami. Oburzyła Was świąteczna reklama Coca-Coli, stworzona przy pomocy AI? Szykujcie się na więcej, bo dzięki takim rozwiązaniom jak Veo już niebawem każdy będzie mógł na pstryknięcie palcem tworzyć filmy tak łatwo, jak teraz tworzy się opowiadania przy pomocy ChatGPT.

Reklama

Veo i Imagen 3 – Google rzuca wyzwanie OpenAI

W maju – trzy miesiące po tym, jak OpenAI zaprezentowało Sorę – Google ogłosiło swoje własne oprogramowanie AI do tworzenia filmów. Tym razem jednak Google chce uwinąć się przed największym konkurentem. Już teraz firma udostępnia pierwszym użytkownikom model Veo.

Źródło: Google

Czym jest Veo? Cóż, w dużym skrócie to nic innego jak generator „wysokiej jakości filmów”, tworzący wideo na podstawie tekstowych i obrazkowych promptów. Można więc dokładnie tak jak w przypadku Midjourney czy DALL-E opisać, co chcielibyśmy zobaczyć na wideo, a AI w ciągu kilku chwil zaprezentuje gotowy materiał w rozdzielczości 1080p.

Google inwestuje w swoją technologię AI, wprowadzając nowe modele, takie jak Veo, nasz najbardziej zaawansowany model generowania wideo, oraz Imagen 3, nasz najwyższej jakości model generowania obrazów. Dzisiaj kontynuujemy ten impet w Google Cloud, oferując naszym klientom dostęp do tych zaawansowanych modeli generatywnej mediów na Vertex AI.

Google obiecuje bezpieczne generowanie obrazów

Veo debiutuje na rynku w formie prywatnej wersji testowej, dostępnej na  platformie Vertex AI Google. Oferuje różne style filmowe i wizualne bez ograniczeń czasowych – to nowość, bo majowa odsłona pilotażowa mogła wygenerować filmy o długości maksymalnie jednej minuty.

W związku z przesunięciem rozwoju AI w stronę masowego generowania wideo, środowiska artystyczne coraz mocniej obawiają się łamania praw autorskich. Twórcy Veo twierdzą jednak, że oprogramowanie jest odpowiednio zabezpieczone. Wszystkie treści wygenerowane przez Veo korzystają z technologii SynthID od DeepMind. To oznacza, że w wygenerowanych treściach zaszyty jest niewidoczny znak cyfrowy, który po pierwsze ma zmniejszyć problemy związane z dezinformacją, a po drugie ułatwić identyfikację tych osób, które przy pomocy AI chcą nielegalnie korzystać z cudzej własności intelektualnej.

Poza tym Veo ma też uniemożliwiać generowanie szkodliwych i gorszących treści – choć z takimi obietnicami to bym się jeszcze wstrzymał, bo samozwańczy specjaliści od sztucznej inteligencji nie raz udowodnili, że do ominięcia blokady konieczne jest jedynie odpowiednie sformułowanie promptu.

Kto może skorzystać z Veo? Początkowo tylko wybrani. Google udostępniło model klientom korzystającym z Google Cloud i biznesowym partnerom z branży kreatywnej, którzy teraz zajmą się prawdziwym testowaniem oprogramowania w praktyce. Poniżej możecie zobaczyć reklamę wygenerowaną właśnie przy pomocy Veo.

Reklama

Czy OpenAI ma się czego obawiać? Cóż, i tak i nie. Z jednej strony firma Sama Altmana nie raz udowodniła swoją wyższość nad konkurencją, a sama Sora wydaje się narzędziem bardziej zaawansowanym, ale z drugiej OpenAI wciąż osiąga się z wypuszczeniem Sory, która miała ukazać się jeszcze w 2024 roku. Czasu coraz mniej, a z obozu OpenAI nie płyną póki co informacje odnośnie konkretnej daty premiery. Przypadek Coca-Coli pokazuje, że branża jest już gotowa i tylko czeka, na zielone światło. OpenAI musi się więc streszczać, jeśli nie chce utracić miejsca na podium.

Reklama

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu

Reklama