Sztuczne inteligencje wodzą nas za nos. W cieniu deweloperów współtworzą wielkie gry
Mówi się, że nieostrożność w eksperymentach ze sztuczną inteligencją mogą skończyć się zagładą ludzkości. Ale wysoce rozwinięte, wyspecjalizowane sztuczne inteligencje już tu są i doskonale sprawdzają się w roli współtwórców gier.
Gdyby zebrać algorytmy sztucznej inteligencji wyspecjalizowane w najróżniejszych dziedzinach sztuki oraz przetwarzania informacji, a następnie spiąć je w ramach zunifikowanego systemu zarządzania, istniałaby szansa, że stworzą pełnoprawną grę komputerową, którą zachwycą się miliony. W ostatnich latach ten sektor branży technologicznej przeszedł ogromną rewolucję, narzędzia z zakresu uczenia maszynowego poczyniły ogromne kroki na drodze do znalezienia uniwersalnego rozwiązania pozwalającego tworzyć treści, które końcowy odbiorca uzna za wiarygodne.
Dobrym przykładem tej cichej rewolucji, która rozgrywa się na naszych oczach, jest debiut oprogramowania do tworzenia gier Unreal Engine 5, które niemal na każdym kroku wspiera się sztuczną inteligencją. Projektanci tego silnika od wielu miesięcy robili wokół niego mnóstwo szumu, głównie przy okazji premiery dziewiątej generacji konsol. Dziś, po premierze dema technologicznego The Matrix Awakens: An Unreal Engine 5 Experience, wiemy, że nie były to czcze przechwałki.
Powyższy materiał z wizualnego punktu widzenia jest wprost fenomenalny, miejscami tak dobrze imituje realne przedmioty, że mniej spostrzegawczy widz może pomylić render z filmem. I choć zespół grafików w znacznej mierze przyczynił się do sukcesu tej produkcji, bez sztucznej inteligencji materiał nie wyglądałby równie fenomenalnie, a w najlepszym wypadku jego powstanie pochłonęłoby wielokrotnie więcej środków oraz czasu.
Trzeba bowiem uświadomić sobie jedną, niezwykle ważną rzecz – im wierniej gry imitują rzeczywistość, tym łatwiej wpadają w pułapkę doliny niesamowitości.
Pod tym terminem skrywają się wszystkie twory kultury oraz techniki, które na pierwszy rzut oka wyglądają na wskroś rzeczywiście, ale jest w nich drobna niedoskonałość. Skaza psująca wrażenie immersji, przez którą odbiorca odczuwa obrzydzenie i niepokój do zaprezentowanego dzieła.
Zazwyczaj o dolinie niesamowitości wspomina się w kontekście humanoidalnych robotów imitujących wygląd człowieka. Nawet jeśli obleczemy maszynę w syntetyczną skórę doskonale imitującą żywą tkankę, istnieje spora szansa, że pewna niedoskonałość nagle zdradzi nam jej nieludzką tożsamość. Być może zwrócimy uwagę na martwe spojrzenie robota, brak porów na skórze albo zbyt symetrycznie osadzone włosy. Taki detal może w ułamku sekundy wyrwać nas z immersji i sprawić, że coś, co nasz mózg utożsamiał z wyglądem człowieka, nagle stanie się dla nas sztuczne, wynaturzone. W dolinę niesamowitości najłatwiej wpaść podczas oglądania takich maszyn przy pracy, kiedy zaczynają przemawiać z maszynowym wzrokiem albo gdy ich usta poruszają się z gracją Miss Botoksu 2021, nieudolnie imitując mimikę człowieka.
Gracze również mogą wpaść do tej nieprzyjemnej doliny niesamowitości. Współczesne gry coraz silniej dążą do fotorealizmu, przez co ich twórcy prędzej czy później będą musieli zastanowić się nad tym, jak uniknąć pełnego zanurzenia się w jej odmętach. W końcu nie po to projektuje się gry idealni imitujące rzeczywistość, aby gracze czuli wobec nich obrzydzenie, prawda?
I tu na scenę wkraczają sztuczne inteligencje, które na wielu polach wspomagają deweloperów, aby proces projektowania gier z jednej strony przebiegał możliwe jak najsprawniej. Zarówno w kontekście szybkości pracy, jak i wierności końcowego rezultatu.
Demo technologiczne The Matrix Awakens: An Unreal Engine 5 Experience jest pod tym kątem niezwykle wdzięcznym materiałem do analizy, gdyż prezentuje wszystkie bolączki, z którymi trzeba się zmagać podczas kreowania wiarygodnych, otwartych światów.
Na pierwszy plan wybija się narzędzie MetaHuman Creator, czyli sztuczna inteligencja wyspecjalizowana w generowaniu realistycznie wyglądających ludzi. Deweloperzy mogli wykorzystać technologię skanowania trójwymiarowych modeli oraz przechwytywania ruchu do digitalizacji postaci odgrywanych przez Keanu Reevesa oraz Carrie-Anne Moss, to jednak nie wystarczyło do urealnienia ich cyfrowych awatarów. MetaHuman Creator wykorzystuje potencjał uczenia maszynowego do generowania realistycznie wyglądających oraz poruszających się twarzy.
Mimika postaci animowanych przez MetaHuman Creator dalece wykracza poza możliwości standardowych silników graficznych, gdyż napędzana jest przez sztuczną inteligencję, która przeanalizowała tysiące nagrań z prawdziwymi ludźmi. W ten sposób nauczyła się, jak powinny poruszać się poszczególne części twarzy, aby widz odbierał je jak ludzką twarz, a nie produkt zdolnego animatora. MetaHuman Creator eliminuje niuanse, które mogłyby wepchnąć nas o objęcia doliny niesamowitości.
A to tylko jedna składowa sztuczna inteligencja pracująca pod powłoką Unreal Engine 5. Algorytmy uczenia maszynowego działają tu na wielu polach. Analizują, w jaki sposób podzielić świat gry, aby optymalnie zarządzać zasobami komputera. System Chaos Physics symuluje zachowanie pojazdów, ubrań oraz destrukcji otoczenia. Algorytm przetwarza dane wsadowe w czasie rzeczywistym, aby stworzyć możliwie jak najwierniejszą cyfrową reprezentację tych elementów. Sama siatka miasta w The Matrix Awakens: An Unreal Engine 5 Experience również nie jest dziełem człowieka, odpowiada za nią narzędzie Houdini, które na drodze uczenia maszynowego pojęło, jak powinno się konstruować wiarygodnie wyglądającą tkankę miejską.
Inteligentne technologie napędzające Unreal Engine 5:
A wszystko to spinają algorytmy jakościowe, których zadaniem jest poprawa wizualnych aspektów produkcji. Nanite automatycznie zarządza gęstością siatki trójwymiarowych obiektów, a Lumen rozświetla ją przy wykorzystaniu narzędzi śledzenia promieni świetlnych, dzięki czemu obraz z jednej strony zachwyca szczegółowością, z drugiej zaś wiernie oddaje pracę świateł i cieni. Wisienką na torcie jest zaś narzędzie Temporal Super Resolution, czyli algorytm do upscalingu w Unreal Engine 5, który pozwala przetwarzać czterokrotnie więcej danych w odniesieniu do jednego piksela obrazu bez wpływania na framerate produkcji. To z kolei przekłada się na ogólną poprawę jakości wizualnej renderowanych przestrzeni.
Żadna z tych technologii sama w sobie nie jest na tyle wszechstronna i zaawansowana, aby można było nazwać ją samodzielnym twórcom. Jednak razem tworzą kompleksowe narzędzie do zarządzania materiałem wizualnym, wyspecjalizowane w tworzeniu obrazów, które w oczach człowieka wyglądają na wiarygodne.
Na rynku nie brakuje także niezależnych produktów wykorzystujących algorytmy sztucznej inteligencji do interpretowania danych wsadowych i przetwarzania ich na obrazy. Prym w badaniach nad tymi technologiami wiedzie firma NVIDIA, która ma na swoim koncie wiele narzędzi z zakresu twórczej sztucznej inteligencji. Najświeższym z nich jest GauGAN2, algorytm wyszkolony do przetwarzania prostych szkiców opisanych za pomocą słów w fotorealistyczne obrazy:
Oprogramowanie osiągnęło tak wysoki poziom realizmu dzięki 10 milionom wysokiej jakości zdjęć oraz w wyszkoleniu w rozpoznawaniu znaczenia tekstów. Niestety, system ma pewne ograniczenia, gdyż pozwala wyłącznie na generowanie krajobrazów.
Nie oznacza to jednak, że nie funkcjonują dziś w powszechnym obiegu programy, które są zdolne do swobodnej interpretacji danych wsadowych. Dobrym przykładem jest aplikacja WOMNO Dream, która przerabia dowolną frazę o długości do 100 znaków w grafikę stylizowaną na kolekcjonerską karciankę. Wystarczy wpisać interesujący nas tekst, wybrać styl graficzny i poczekać kilka sekund, aby sztuczna inteligencja wykreowała obraz, który jest abstrakcyjną interpretacją naszych słów.
Na obecnym etapie rozwoju algorytmy twórcze wciąż są mocno uzależnione od człowieka, który je obsługuje, ale z biegiem lat będą zyskiwać na znaczeniu. Nawet jeśli nie stworzą samodzielnie tak rozległego i realistycznie wyglądającego świata jak ten z The Matrix Awakens: An Unreal Engine 5 Experience bądź Cyberpunka 2077, pomogą twórcom przeskoczyć przez gamingową dolinę niesamowitości podczas urzeczywistniania ich twórczej wizji.
Na koniec mamy dla was małą zabawę. Aby sprawdzić, czy sztuczne inteligencje faktycznie są w stanie tworzyć obrazy, które wiernie imitują rzeczywiste obiekty, przygotowaliśmy dla was małą zabawę. Sięgnęliśmy po narzędzie WOMNO Dream, zasililiśmy je wyłącznie tytułami gier z najróżniejszych gatunków i sprawdziliśmy, jak je zinterpretowały.
W poniższym quizie zaprezentowaliśmy rezultaty tego eksperymentu. Odpal go i sprawdź, czy będziesz w stanie zgadnąć, jaki tytuł zilustrowała sztuczna inteligencja.