DeepSeek znów rzuca wyzwanie Dolinie Krzemowej: nowa SI zgłasza parytet z GPT-5 i Gemini-3 Pro

Autor: Russell Thompson | 01.12.2025, 17:07

Chińska firma DeepSeek, która na początku roku głośno zadebiutowała dzięki eksperymentalnemu modelowi, ponownie wchodzi na arenę — i z ambicjami na poziomie „dogoniliśmy liderów”. Startup zaprezentował dwie nowe wersje swojej SI — DeepSeek-V3.2 i DeepSeek-V3.2-Speciale, pozycjonując je jako bezpośrednich konkurentów dla rozwiązań Google i OpenAI.

Co wiadomo

Pierwszy model, DeepSeek-V3.2, zastąpił eksperymentalny V3.2-Exp, wydany kilka tygodni temu. Firma twierdzi, że nowa wersja wykazuje osiągi porównywalne z OpenAI GPT-5, zwłaszcza w testach związanych z zadaniami logicznymi i wieloetapowymi.

Główne nowatorskie rozwiązanie — ściślejsza więź między „myśleniem” modelu a wykorzystaniem narzędzi. DeepSeek wyjaśnia, że V3.2 potrafi nie tylko rozważać, ale także autonomicznie podłączać zewnętrzne środki — wyszukiwarki, kalkulatory, interpretery kodu i inne funkcje. W istocie jest to próba zbliżenia się do systemów agencyjnych, w których SI jest zdolna nie tylko odpowiadać, ale także wykonywać akcje.

Druga wersja — DeepSeek-V3.2-Speciale — skupia się na matematyce, logice formalnej i zadaniach wymagających długich łańcuchów rozumowania. Według twórców, model osiąga poziom Gemini-3 Pro i demonstruje wyniki „złotego medalu” w testach na poziomie Międzynarodowej Olimpiady Matematycznej i Informatycznej.

DeepSeek twierdzi, że opracowała nowe podejście do szkolenia agentów SI, umożliwiające systemom autonomiczną analizę otoczenia, podejmowanie decyzji i pracę bez stałego udziału człowieka. To kontynuacja strategii firmy, która po styczniowym przełomie dąży do umocnienia pozycji w szybko rosnącej chińskiej rywalizacji na duże modele.

Tydzień temu startup już wprowadzał model DeepSeekMath-V2, ukierunkowany na udowadnianie twierdzeń, a teraz rozszerza linię modelami dla zadań wieloetapowych i obliczeniowych.

Firma podkreśla, że DeepSeek-V3.2 „wykazuje wyniki na poziomie GPT-5 i Kimi-k2-myślenie” na wielu benchmarkach rozumowania — twierdzenie, które na pewno przyciągnie uwagę całej branży.

Źródło: DeepSeek