OpenAI zaprezentowało GPT-4o: krok w kierunku naturalnie rozmawiającej sztucznej inteligencji
OpenAI zaprezentowało najnowszą wersję ChatGPT – GPT-4o (o jak Omni), ustanawiając nowy standard naturalnej interakcji z LLM, czyli Dużym Modelem Językowym, znanym powszechnie jako Sztuczna Inteligencja.
OpenAI zaprezentowało najnowszą wersję ChatGPT – GPT-4o (o jak Omni), ustanawiając nowy standard naturalnej interakcji z LLM, czyli Dużym Modelem Językowym, znanym powszechnie jako Sztuczna Inteligencja.
Nowy model zachowuje poziom inteligencji swojego poprzednika GPT-4, ale przynosi przełomowe postępy w integracji multimodalnej i szybkości przetwarzania poleceń. GPT-4o został zaprojektowany do jednoczesnej obsługi danych tekstowych, wizualnych i dźwiękowych, a także z myślą o znaczny zmniejszeniu opóźnień, które trapią obecne technologie sztucznej inteligencji. Według OpenAI, podczas gdy większość systemów sztucznej inteligencji doświadcza opóźnienia wahającego się od sekundy do kilku sekund w zależności od zapytania, GPT-4o prawie całkowicie eliminuje to opóźnienie, umożliwiając płynne rozmowy w czasie rzeczywistym.
Podczas debiutu GPT-4o zademonstrował sprawność, szybko i płynnie reagując na dane wejściowe prezentera – nawet pozwalając na uprzejme przerywanie. Jeśli człowiek zaczynał mówić w trakcie wciąż trwającej odpowiedzi sztucznej inteligencji, GPT-4o zatrzymywał się, zamiast na siłę kończyć swoją kwestię niczym polityk w trakcie debaty.
Mira Murati, CTO w OpenAI, podkreśliła znaczenie tych ulepszeń:
Jedną z najbardziej godnych uwagi funkcji pokazanych podczas demonstracji były możliwości głosowe GPT-4o. SI mówiło on nie tylko swobodnym, konwersacyjnym językiem, ale także stosowało naturalnie brzmiące pauzy, a nawet chichot, dodając ludzkiego akcentu interakcjom. Dobrze radziło też sobie z tłumaczeniem na żywo, które znamy już z rozwiązań stosowanych w smartfonach Samsunga i Google Pixel.
Pomimo skoku technologicznego, niektóre aspekty GPT-4o spotkały się ze sceptycyzmem. Zarówno krytycy, jak i entuzjaści chętnie badają autentyczność tak zaawansowanych interakcji AI, przypominając debaty, które nastąpiły po zaprezentowaniu Duplex przez Google. Aby jeszcze bardziej zademonstrować swoje możliwości, OpenAI zleciło dwóm instancjom GPT-4o rozmowę przez telefon. Chociaż głosy zachowały ludzką jakość, interakcja wydawała się już znaczniej mniej organiczna, ujawniając mechaniczne podstawy sztucznej inteligencji, gdy w interakcji brakuje ludzkiego pierwiastka. Jedną z rzeczy, które wymagają poprawy, jest nadmierna gadatliwość oraz zdecydowanie zbyt entuzjastyczny ton AI.
Oprócz GPT-4o, OpenAI ogłosiło uruchomienie aplikacji ChatGPT dla macOS, a wersja dla Windows ma zostać wydana jeszcze w tym roku. Aplikacja desktopowa jest obecnie dostępna dla płatnych użytkowników, z planami rozszerzenia dostępu do darmowej wersji w późniejszym terminie. Tymczasem dostępna w internecie wersja ChatGPT oferuje już model GPT-4o, który jest również dostępny dla darmowych użytkowników, choć nie bez pewnych ograniczeń.
Najnowszy wersja sztucznej inteligencji od OpenAI nie tylko zwiększa potencjalne zastosowania w codziennym życiu, ale także przygotowuje grunt pod przyszłe innowacje, w których interakcja z komputerami może wreszcie zacząć przypominać rozmowy Tony’ego Starka z F.R.I.D.A.Y.
Źródło: Opracowanie własne/TechSpot
Kalendarz premier seriali
Zobacz wszystkie premieryDzisiaj urodziny obchodzą
ur. 1964, kończy 60 lat
ur. 1949, kończy 75 lat
ur. 1951, kończy 73 lat
ur. 1983, kończy 41 lat
ur. 1970, kończy 54 lat