OpenAI kontynuuje prace związane z wykorzystaniem sztucznej inteligencji, a efekty prac wyglądają naprawdę imponująco. Naukowcy opracowali nowy model zamiany tekstu na wideo - Sora, który potrafi wygenerować niezwykle realistyczne symulacje.

OpenAI zasłynęło z popularnego narzędzia Chat GPT, ale naukowcy nie zamierzają na tym poprzestawać. Niedawno zademonstrowano nowy model zamiany tekstu na wideo. Sora (bo właśnie tak nazywa się nowy model) jak na razie jest dostępny tylko dla testerów, ale potencjał technologii robi ogromne wrażenie.

Sztuczna inteligencja tworzy super realistyczne filmy

Sora to model zamiany tekstu na wideo, który może generować realistyczne filmy (ograniczenie jest takie, że maksymalnie mogą one trwać minutę). Co ważne, model potrafi dopasować się do poleceń użytkownika, a do tego oferuje świetną jakość wizualną.

OpenAI nauczyło sztuczną inteligencję rozumienia i symulowania świata fizycznego w ruchu. Nowy model jest w stanie wygenerować złożone sceny z wieloma postaciami, określonymi rodzajami ruchu, dokładnymi szczegółami obiektów i tła - model zrozumie nie tylko co, o co poprosi go użytkownik, ale też zjawiska występujące w prawdziwym świecie.

Poniżej możecie zobaczyć przykłady wygenerowanych scen z użyciem modelu OpenAI Sora.

Twórcy sami przyznają, że obecny model ma jeszcze słabe strony. Sora może mieć trudności z dokładnym symulowaniem fizyki złożonej sceny i może nie rozumieć konkretnych przypadków przyczyny i skutku. Dodatkowo może ona mylić kierunki przestrzenne.

Poważne zagrożenie przy generowanych treściach

Mimo szeroko zakrojonych badań i testów, naukowcy sami przyznają, że nie są w stanie przewidzieć wszystkich scenariuszy wykorzystania technologii. Tych legalnych, ale też tych nielegalnych. Firma chce współpracować z twórcami, aby lepiej zrozumieć ich obawy, ale też dostrzegać pozytywne przypadki wykorzystania nowej technologii.

Nowy model został udostępniony testerom bezpieczeństwa, którzy sprawdzą go pod kątem niewłaściwego użycia edytora. Głównie chodzi o zweryfikowanie zagrożeń związanych z dezinformacją, nienawiścią i uprzedzeniami.

Generator ma sprawdzać i odrzucać polecenia, które będą naruszać zasady użytkowania np. związane z przemocą, treściami seksualnymi, nienawiścią czy podobiznami znanych osób. OpenAI tworzy także narzędzia, które pomogą wykrywać treści wygenerowane przez nowy model.

Źródło: OpenAI, X @ Borriss