Sora – nowa generatywna sztuczna inteligencja od twórców ChatGPT
Sora na podstawie krótkich instrukcji tworzy maksymalnie sześćdziesięciosekundowe klipy wideo w rozdzielczości Full HD.
Sora na podstawie krótkich instrukcji tworzy maksymalnie sześćdziesięciosekundowe klipy wideo w rozdzielczości Full HD.
OpenAI, czyli firma, która zapoczątkowała rewolucję generatywnej sztucznej inteligencji, dołączyła do klubu twórców generatorów przekładających instrukcje w języku naturalnym na krótkie filmiki. Jak twierdzi OpenAI, Sora może generować złożone sceny z wieloma postaciami, określonymi rodzajami ruchu obiektów i kamery, a także dokładnymi szczegółami obiektu i tła. Narzędzie jest również w stanie tworzyć wiele ujęć w ramach jednego wygenerowanego wideo.
Jak można się spodziewać, wybrane przykłady opublikowane na stronie OpenAI wyglądają całkiem przekonująco. Jest tam zwiastun klimatycznego filmu S-F, z którego kadr możecie zobaczyć powyżej, kobieta idąca ulicą Tokio, historyczny materiał filmowy z czasów kalifornijskiej gorączki złota, corgi wlogujący z plaży i wiele innych. A także krótka galeria błędów.
Sora jest też w stanie pobierać istniejące klipy wideo i rozszerzać je lub uzupełniać brakujące klatki, co także brzmi całkiem interesująco. Może również generować filmy w różnych stylach, takich jak czarno-biały czy animowany.
Na pierwszy rzut oka wygląda to niezwykle imponująco, ale przy bliższym przyjrzeniu się możesz zauważyć charakterystyczne oznaki, że klipy zostały wygenerowane przez sztuczną inteligencję, takie jak sposób, w jaki poruszają się łapy psa lub nienaturalny wygląd twarzy i dłoni, czy ruchy postaci w tle.
OpenAI przyznaje, że obecny model Sory może mieć trudności z niektórymi elementami, w tym z dokładną symulacją fizyki i niezrozumieniem konkretnych przypadków przyczyny i skutku, takich jak ślad po ugryzieniu po zjedzeniu kęsa jedzenia. Może również mylić szczegóły przestrzenne i mieć trudności z precyzyjnym odwzorowaniem wydarzeń dziejących się w czasie, jak np. podążanie za określoną trajektorią kamery.
Bezpieczeństwo jest zawsze dużym problemem w przypadku tego rodzaju technologii. OpenAI twierdzi, że współpracuje z ekspertami aby przetestować model Sora pod względem tworzenia szkodliwych treści, jak choćby dezinformacji i nienawistnej propagandy. Firma tworzy również narzędzia pomagające zidentyfikować wprowadzające w błąd treści i określić, kiedy wideo zostało wygenerowane przez Sora. OpenAI zapowiedziało, że planuje uwzględnić standard C2PA pozwalający umieszczać w tworzonych przez Sora materiałach metadane twórców, gdy narzędzie trafi do szerszego grona odbiorców.
Nasuwają się pytania dotyczące praw autorskich / etycznych dotyczące tego, jakie dane zostały wykorzystane do szkolenia Sory, jak zawsze w przypadku tych technologii. OpenAI nie jest jednak zbyt chętne, aby dzielić się takimi informacjami poza stwierdzeniem, że wykorzystane zostało około 10 000 godzin wideo wysokiej rozdzielczości.
Sora znajduje się obecnie w fazie eksperymentalnej i jest testowana przez wybranych użytkowników; nie jest jeszcze dostępna publicznie ze względu na możliwość niewłaściwego użycia.
W przeszłości widzieliśmy już generatory tekstu na wideo, w tym Runaway i Google Lumiere. Ciekawe będzie obserwować, jak twórcy ChatGPT/DALL-E radzą sobie z tym zadaniem.
Choć narzędzie nie jest to jeszcze ogólnie dostępne, szef OpenAI Sam Altman poprosił ludzi na Twitterze/X o zasugerowanie pomysłów, które zostaną przekształcone w filmy za pomocą Sora. Niektóre z wyników możecie zobaczyć w tym artykule.
Źródło: Opracowanie własne/TechSpot
Dzisiaj urodziny obchodzą
ur. 1970, kończy 54 lat
ur. 1969, kończy 55 lat
ur. 1964, kończy 60 lat
ur. 1973, kończy 51 lat
ur. 1977, kończy 47 lat