Elon Musk i xAI przyspieszają z Grok Imagine Video 1.5 – nowe standardy w szybkości i jakości!

Elon Musk i xAI przyspieszają z Grok Imagine Video 1.5 – nowe standardy w szybkości i jakości!
AI w pędzie: Video 1.5 od xAI tworzy realistyczne wideo w kilka sekund. Źródło: xAI

Elon Musk i jego zespół z xAI kontynuują grę w „doganiaj OpenAI”, ale robią to we własnym, charakterystycznym tempie — agresywnie i z ambicją na przywództwo. Firma oficjalnie zaprezentowała Grok Imagine Video 1.5, zaktualizowany model generowania wideo z obrazów, który ma na celu zlikwidowanie problemu realizmu i, co ważniejsze, szybkości działania.

Głównym atutem nowej iteracji jest wydajność. Jeśli wcześniej na stworzenie krótkiego filmu użytkownicy potrzebowali ponad 40 sekund, to teraz wersja Video 1.5 Fast zajmuje tylko 25 sekund. Mowa o 6-sekundowych klipach w rozdzielczości 720p. To wciąż nie jest hollywoodzka jakość, ale dla agentów AI, którzy mają działać w czasie rzeczywistym, taki wzrost prędkości jest krytyczny.

Fizyka, dźwięk i anonimowe uznanie

Oprócz szybkości, deweloperzy popracowali nad „mózgiem” modelu. Według xAI, wideo 1.5 otrzymało ulepszoną fizykę ruchu i detalizację obiektów. Oznacza to, że włosy na wietrze mają się poruszać mniej chaotycznie, a przedmioty nie powinny nagle znikać w powietrzu, jak to często bywało w generatywnych sieciach pierwszych generacji. Ponadto model teraz lepiej radzi sobie z całkowitym dźwiękowym wsparciem, co sprawia, że wynik jest mniej podobny do niemych filmów z równoległego wszechświata.

Ciekawe jest, że jeszcze przed oficjalnym pełnowymiarowym wydaniem wersja Preview zdążyła osiągnąć szczyt rankingu Image-to-Video na platformie DesignArena. To taki plac, gdzie są anonimowo porównywane wyniki AI, a społeczność głosuje na najlepsze wizualizacje, nie wiedząc, który model je stworzył. Fakt, że Grok przewyższył konkurencję, świadczy o poważnej pracy nad algorytmami wizualizacji.

Od generatora do „kreatywnego agenta”

Musk nie byłby sobą, gdyby nie próbował zjednoczyć wszystkiego w jednym ekosystemie. Wiosenna aktualizacja Agent Mode przekształciła Grok Imagine z zwykłego narzędzia do tworzenia obrazów w pełnoprawne środowisko pracy. Teraz to „kreatywny agent”, który może towarzyszyć procesowi od pomysłu do finalnego wideo.

Równolegle z tym uruchomiono wersję beta Grok Build — narzędzia dla deweloperów z wierszem poleceń. Według Muska, zespół pracuje bez przerwy, aby uczynić ten zestaw narzędzi jak najbardziej użytecznym dla profesjonalnego użytku. Obecnie Video 1.5 jest już dostępne poprzez Imagine API, a także w wersji webowej i w aplikacjach na iOS i Androida.

Dodajemy funkcje do poprawy twojego kreatywnego procesu w Grok Imagine. To nasze najlepsze modele: ulepszony ruch, ulepszona fizyka, ulepszony dźwięk, a wszystko to z najwyższymi prędkościami.

— xAI

Czy to będzie zabójca Sora od OpenAI? Na razie jest za wcześnie, aby to powiedzieć, ale xAI wyraźnie stawia na dostępność i szybkość teraz i tutaj, podczas gdy rywale trzymają swoje najlepsze osiągnięcia za zamkniętymi drzwiami laboratoriów.

Nawiasem mówiąc, jeśli masz za mało mocy w chmurze, spójrz na Asus Ascent GX10 — ten kieszonkowy superkomputer został zaprojektowany z myślą o tych, którzy chcą uruchamiać własne modele AI lokalnie.

var _paq = window._paq = window._paq || []; _paq.push(['trackPageView']); _paq.push(['enableLinkTracking']); (function() { var u='//mm.magnet.kiev.ua/'; _paq.push(['setTrackerUrl', u+'matomo.php']); _paq.push(['setSiteId', '2']); var d=document, g=d.createElement('script'), s=d.getElementsByTagName('script')[0]; g.async=true; g.src=u+'matomo.js'; s.parentNode.insertBefore(g,s); })();