Sora – nowa generatywna sztuczna inteligencja od twórców ChatGPT
Sora na podstawie krótkich instrukcji tworzy maksymalnie sześćdziesięciosekundowe klipy wideo w rozdzielczości Full HD.
Sora na podstawie krótkich instrukcji tworzy maksymalnie sześćdziesięciosekundowe klipy wideo w rozdzielczości Full HD.
OpenAI, czyli firma, która zapoczątkowała rewolucję generatywnej sztucznej inteligencji, dołączyła do klubu twórców generatorów przekładających instrukcje w języku naturalnym na krótkie filmiki. Jak twierdzi OpenAI, Sora może generować złożone sceny z wieloma postaciami, określonymi rodzajami ruchu obiektów i kamery, a także dokładnymi szczegółami obiektu i tła. Narzędzie jest również w stanie tworzyć wiele ujęć w ramach jednego wygenerowanego wideo.
Jak można się spodziewać, wybrane przykłady opublikowane na stronie OpenAI wyglądają całkiem przekonująco. Jest tam zwiastun klimatycznego filmu S-F, z którego kadr możecie zobaczyć powyżej, kobieta idąca ulicą Tokio, historyczny materiał filmowy z czasów kalifornijskiej gorączki złota, corgi wlogujący z plaży i wiele innych. A także krótka galeria błędów.
Sora jest też w stanie pobierać istniejące klipy wideo i rozszerzać je lub uzupełniać brakujące klatki, co także brzmi całkiem interesująco. Może również generować filmy w różnych stylach, takich jak czarno-biały czy animowany.
Na pierwszy rzut oka wygląda to niezwykle imponująco, ale przy bliższym przyjrzeniu się możesz zauważyć charakterystyczne oznaki, że klipy zostały wygenerowane przez sztuczną inteligencję, takie jak sposób, w jaki poruszają się łapy psa lub nienaturalny wygląd twarzy i dłoni, czy ruchy postaci w tle.
OpenAI przyznaje, że obecny model Sory może mieć trudności z niektórymi elementami, w tym z dokładną symulacją fizyki i niezrozumieniem konkretnych przypadków przyczyny i skutku, takich jak ślad po ugryzieniu po zjedzeniu kęsa jedzenia. Może również mylić szczegóły przestrzenne i mieć trudności z precyzyjnym odwzorowaniem wydarzeń dziejących się w czasie, jak np. podążanie za określoną trajektorią kamery.
Bezpieczeństwo jest zawsze dużym problemem w przypadku tego rodzaju technologii. OpenAI twierdzi, że współpracuje z ekspertami aby przetestować model Sora pod względem tworzenia szkodliwych treści, jak choćby dezinformacji i nienawistnej propagandy. Firma tworzy również narzędzia pomagające zidentyfikować wprowadzające w błąd treści i określić, kiedy wideo zostało wygenerowane przez Sora. OpenAI zapowiedziało, że planuje uwzględnić standard C2PA pozwalający umieszczać w tworzonych przez Sora materiałach metadane twórców, gdy narzędzie trafi do szerszego grona odbiorców.
Nasuwają się pytania dotyczące praw autorskich / etycznych dotyczące tego, jakie dane zostały wykorzystane do szkolenia Sory, jak zawsze w przypadku tych technologii. OpenAI nie jest jednak zbyt chętne, aby dzielić się takimi informacjami poza stwierdzeniem, że wykorzystane zostało około 10 000 godzin wideo wysokiej rozdzielczości.
Sora znajduje się obecnie w fazie eksperymentalnej i jest testowana przez wybranych użytkowników; nie jest jeszcze dostępna publicznie ze względu na możliwość niewłaściwego użycia.
W przeszłości widzieliśmy już generatory tekstu na wideo, w tym Runaway i Google Lumiere. Ciekawe będzie obserwować, jak twórcy ChatGPT/DALL-E radzą sobie z tym zadaniem.
Choć narzędzie nie jest to jeszcze ogólnie dostępne, szef OpenAI Sam Altman poprosił ludzi na Twitterze/X o zasugerowanie pomysłów, które zostaną przekształcone w filmy za pomocą Sora. Niektóre z wyników możecie zobaczyć w tym artykule.
Źródło: Opracowanie własne/TechSpot
Kalendarz premier seriali
Zobacz wszystkie premieryDzisiaj urodziny obchodzą
ur. 1978, kończy 46 lat
ur. 1971, kończy 53 lat
ur. 1964, kończy 60 lat
ur. 1965, kończy 59 lat
ur. 1974, kończy 50 lat