Alibaba zaprezentowała Qwen3-Coder z wsparciem dla agentów AI, zdolnych do podejmowania samodzielnych decyzji

Zespół Qwen oficjalnie zaprezentował Qwen3-Coder — swój najpotężniejszy dotychczas generator kodu z wsparciem „agentalnego” podejścia. Główna gwiazda serii — Qwen3-Coder-480B-A35B-Instruct. To hybrydowy model Mixture-of-Experts z 480 miliardami parametrów (35 miliardów aktywnych jednocześnie), który potrafi pracować z kontekstem do 256 000 tokenów natywnie i do 1 miliona tokenów z ekstrapolacją. W testach pokazuje rekordowe wyniki wśród otwartych modeli w zadaniach agentowego kodowania, używania przeglądarki i korzystania z narzędzi — na poziomie Claude Sonnet 4.
Co to jest „agentalne” kodowanie
Qwen3-Coder został stworzony nie tylko do generowania kodu, ale także do pełnowartościowej pracy jako „agent”, który potrafi planować, używać narzędzi, uzyskiwać informacje zwrotne i podejmować decyzje. W rzeczywistych zadaniach (na przykład, SWE-Bench) wchodzi w interakcję z otoczeniem w kilku krokach, co wymaga skomplikowanego uczenia się z długim horyzontem (Long-Horizon RL). W tym celu zespół Qwen uruchomił skalowalny system z 20 000 równoległymi środowiskami opartymi na Alibaba Cloud.
Możliwości Qwen3-Coder
- Wytrenujony na 7,5 bilionach tokenów, z czego 70% to kod
- Wsparcie dla olbrzymiego kontekstu do 1 miliona tokenów (z YaRN)
- Wykorzystanie uczenia wzmacniającego (Code RL) w realnych zadaniach, aby zwiększyć skuteczność wykonania kodu
- Integracja z narzędziami deweloperskimi — Qwen Code (CLI), Claude Code i nawet OpenAI SDK
- Możliwość działania zarówno przez API, jak i w lokalnym środowisku
Narzędzia i API
Razem z modelem dostępne jest narzędzie CLI Qwen Code, opracowane na podstawie Gemini Code. Umożliwia łatwe korzystanie z Qwen3-Coder w własnych projektach, z wsparciem dla niestandardowych promptów i funkcji. Przewidziano również działanie przez Claude Code oraz bezpośredni dostęp API przez Alibaba Cloud Model Studio.
Po co to wszystko
Qwen3-Coder jest pozycjonowany jako uniwersalny agent do kodowania — od generacji stron internetowych po złożone, wieloetapowe zadania w zakresie rozwoju. Zespół Qwen planuje wydać więcej rozmiarów modeli, aby obniżyć koszty wdrażania, i bada możliwości „samo-ulepszania” agentów.
O Qwen
Qwen to seria dużych modeli językowych i agentowych rozwiązań zespołu Alibaba (Zespół Qwen), stworzona do generowania tekstu, kodu, analizy danych oraz wieloetapowych scenariuszy z wykorzystaniem narzędzi. Ostatnia wersja, Qwen3-Coder, zbudowana na architekturze Mixture-of-Experts z 480 miliardami parametrów (35 miliardów aktywnych), obsługuje do 256 000 tokenów kontekstu natywnie oraz do 1 miliona z ekstrapolacją, i osiąga wyniki na poziomie zamkniętych modeli takich jak Claude Sonnet 4 w zadaniach SWE-Bench, agentowego kodowania, używania przeglądarki oraz korzystania z narzędzi. Model integruje się z OpenAI SDK, narzędziami CLI (Qwen Code, Claude Code), API Alibaba Cloud oraz wspiera ekosystemy GitHub i Hugging Face, wykorzystując uczenie wzmacniające w odniesieniu do rzeczywistych zadań kodowania, aby zwiększyć dokładność i efektywność.
?