Sora – nowa generatywna sztuczna inteligencja od twórców ChatGPT

Sora na podstawie krótkich instrukcji tworzy maksymalnie sześćdziesięciosekundowe klipy wideo w rozdzielczości Full HD.

16 lutego 2024 o 23:26

Reklama

Marcin Sikora 16 lutego 2024 o 23:26

Tagi: AI

fot. openai.com/sora

Reklama

OpenAI, czyli firma, która zapoczątkowała rewolucję generatywnej sztucznej inteligencji, dołączyła do klubu twórców generatorów przekładających instrukcje w języku naturalnym na krótkie filmiki. Jak twierdzi OpenAI, Sora może generować złożone sceny z wieloma postaciami, określonymi rodzajami ruchu obiektów i kamery, a także dokładnymi szczegółami obiektu i tła. Narzędzie jest również w stanie tworzyć wiele ujęć w ramach jednego wygenerowanego wideo.

Jak można się spodziewać, wybrane przykłady opublikowane na stronie OpenAI wyglądają całkiem przekonująco. Jest tam zwiastun klimatycznego filmu S-F, z którego kadr możecie zobaczyć powyżej, kobieta idąca ulicą Tokio, historyczny materiał filmowy z czasów kalifornijskiej gorączki złota, corgi wlogujący z plaży i wiele innych. A także krótka galeria błędów.

Sora jest też w stanie pobierać istniejące klipy wideo i rozszerzać je lub uzupełniać brakujące klatki, co także brzmi całkiem interesująco. Może również generować filmy w różnych stylach, takich jak czarno-biały czy animowany.

Na pierwszy rzut oka wygląda to niezwykle imponująco, ale przy bliższym przyjrzeniu się możesz zauważyć charakterystyczne oznaki, że klipy zostały wygenerowane przez sztuczną inteligencję, takie jak sposób, w jaki poruszają się łapy psa lub nienaturalny wygląd twarzy i dłoni, czy ruchy postaci w tle.

OpenAI przyznaje, że obecny model Sory może mieć trudności z niektórymi elementami, w tym z dokładną symulacją fizyki i niezrozumieniem konkretnych przypadków przyczyny i skutku, takich jak ślad po ugryzieniu po zjedzeniu kęsa jedzenia. Może również mylić szczegóły przestrzenne i mieć trudności z precyzyjnym odwzorowaniem wydarzeń dziejących się w czasie, jak np. podążanie za określoną trajektorią kamery.

Bezpieczeństwo jest zawsze dużym problemem w przypadku tego rodzaju technologii. OpenAI twierdzi, że współpracuje z ekspertami aby przetestować model Sora pod względem tworzenia szkodliwych treści, jak choćby dezinformacji i nienawistnej propagandy. Firma tworzy również narzędzia pomagające zidentyfikować wprowadzające w błąd treści i określić, kiedy wideo zostało wygenerowane przez Sora. OpenAI zapowiedziało, że planuje uwzględnić standard C2PA pozwalający umieszczać w tworzonych przez Sora materiałach metadane twórców, gdy narzędzie trafi do szerszego grona odbiorców.

Nasuwają się pytania dotyczące praw autorskich / etycznych dotyczące tego, jakie dane zostały wykorzystane do szkolenia Sory, jak zawsze w przypadku tych technologii. OpenAI nie jest jednak zbyt chętne, aby dzielić się takimi informacjami poza stwierdzeniem, że wykorzystane zostało około 10 000 godzin wideo wysokiej rozdzielczości.

Sora znajduje się obecnie w fazie eksperymentalnej i jest testowana przez wybranych użytkowników; nie jest jeszcze dostępna publicznie ze względu na możliwość niewłaściwego użycia.

Będziemy angażować decydentów, edukatorów i artystów na całym świecie, aby zrozumieć ich obawy i zidentyfikować pozytywne przypadki użycia tej nowej technologii. Pomimo szeroko zakrojonych badań i testów, nie możemy przewidzieć wszystkich użytecznych sposobów korzystania przez ludzi z naszej technologii, ani wszystkich sposobów jej nadużywania. Dlatego uważamy, że uczenie się na podstawie rzeczywistych zastosowań jest kluczowym elementem tworzenia i udostępniania w miarę upływu czasu coraz bezpieczniejszych systemów sztucznej inteligencji.

– napisało OpenAI.

W przeszłości widzieliśmy już generatory tekstu na wideo, w tym Runaway i Google Lumiere. Ciekawe będzie obserwować, jak twórcy ChatGPT/DALL-E radzą sobie z tym zadaniem.

Choć narzędzie nie jest to jeszcze ogólnie dostępne, szef OpenAI Sam Altman poprosił ludzi na Twitterze/X o zasugerowanie pomysłów, które zostaną przekształcone w filmy za pomocą Sora. Niektóre z wyników możecie zobaczyć w tym artykule.

Zobacz także: