Qwen представила Qwen3-Coder-Next — открытую ИИ-модель на 80 млрд параметров

Сохраняется 0 В закладки 0 В закладках 0
Qwen выпустила Qwen3-Coder-Next — открытую языковую модель, ориентированную на кодинг-агентов и локальную разработку. Это не универсальный чат-бот, а инструмент для долгой агентной работы с кодом, инструментами и исполняемыми средами.
Модель уже доступна публично: веса выложены на Hugging Face, лицензия — Apache-2.0. Ограничений по регионам или тарифам нет. Подробности в материале Postium.
Qwen3-Coder-Next — что это и как работает
Нейросеть Qwen3-Coder-Next построена как MoE-модель (Mixture of Experts). Формально у неё 80 млрд параметров, но на каждом токене активны около 3 млрд. Это позволяет сохранять высокую «ёмкость» модели без резкого роста стоимости инференса — ключевой момент для агентных сценариев, где модель делает десятки и сотни шагов подряд.
Контекстное окно — 256K токенов (262 144). Этого хватает для работы с большими репозиториями, логами, диффами и длинной историей выполнения без постоянной потери контекста.
Главная особенность — методика обучения, которую команда называет «агентным масштабированием». Модель тренировали на датасете из 800 тысяч верифицируемых задач в исполняемых средах (executable envs). В процессе обучения нейросеть не просто генерировала текст, а запускала код, проверяла результат и училась на реальных ошибках.
За счёт этого Qwen3-Coder-Next лучше подходит для сценариев, где агент пишет код, запускает его, находит ошибки и сразу исправляет их — то есть работает ближе к поведению разработчика, а не к автодополнению.
По данным публичных обзоров, модель показывает сильные результаты на SWE-Bench Pro и SWE-Bench Verified в агентной связке. Qwen использует это как аргумент: даже с ограниченным числом активных параметров модель способна конкурировать в задачах реального исправления багов и работы с кодовой базой.


SWE-Bench Verified
Почему это важно? MoE-архитектура с 3 млрд активных параметров делает долгую агентную работу заметно дешевле, чем у других моделей схожего класса, при этом без заметной потери качества на сложных бенчмарках.
Qwen последовательно развивает линейку кодинговых моделей в сторону автономных агентов. Ранее компания продвигала Qwen3-Coder как инструмент для сложных задач, а Qwen3-Coder-Next усиливает этот вектор за счёт сверхдлинного контекста, MoE-архитектуры и обучения на исполняемых задачах. Это также укладывается в общий тренд: модели перестают быть «чатами» и превращаются в постоянно работающих агентов.
Итог: Qwen3-Coder-Next — шаг к более дешёвым и устойчивым кодинг-агентам, которые могут долго работать с реальным кодом, а не просто генерировать ответы в чате.
⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: .
Тэги Qwen Нейросети
