Qwen представила Qwen3-Coder-Next — открытую ИИ-модель на 80 млрд параметров

0 0


Qwen представила Qwen3-Coder-Next — открытую ИИ-модель на 80 млрд параметров

Сохраняется 0 В закладки 0 В закладках 0

Qwen выпустила Qwen3-Coder-Next — открытую языковую модель, ориентированную на кодинг-агентов и локальную разработку. Это не универсальный чат-бот, а инструмент для долгой агентной работы с кодом, инструментами и исполняемыми средами.

Модель уже доступна публично: веса выложены на Hugging Face, лицензия — Apache-2.0. Ограничений по регионам или тарифам нет. Подробности в материале Postium.

Qwen3-Coder-Next — что это и как работает

Нейросеть Qwen3-Coder-Next построена как MoE-модель (Mixture of Experts). Формально у неё 80 млрд параметров, но на каждом токене активны около 3 млрд. Это позволяет сохранять высокую «ёмкость» модели без резкого роста стоимости инференса — ключевой момент для агентных сценариев, где модель делает десятки и сотни шагов подряд.

Контекстное окно — 256K токенов (262 144). Этого хватает для работы с большими репозиториями, логами, диффами и длинной историей выполнения без постоянной потери контекста.

Главная особенность — методика обучения, которую команда называет «агентным масштабированием». Модель тренировали на датасете из 800 тысяч верифицируемых задач в исполняемых средах (executable envs). В процессе обучения нейросеть не просто генерировала текст, а запускала код, проверяла результат и училась на реальных ошибках.

За счёт этого Qwen3-Coder-Next лучше подходит для сценариев, где агент пишет код, запускает его, находит ошибки и сразу исправляет их — то есть работает ближе к поведению разработчика, а не к автодополнению.

По данным публичных обзоров, модель показывает сильные результаты на SWE-Bench Pro и SWE-Bench Verified в агентной связке. Qwen использует это как аргумент: даже с ограниченным числом активных параметров модель способна конкурировать в задачах реального исправления багов и работы с кодовой базой.


Qwen представила Qwen3-Coder-Next — открытую ИИ-модель на 80 млрд параметров


Qwen представила Qwen3-Coder-Next — открытую ИИ-модель на 80 млрд параметров

SWE-Bench Verified

Почему это важно? MoE-архитектура с 3 млрд активных параметров делает долгую агентную работу заметно дешевле, чем у других моделей схожего класса, при этом без заметной потери качества на сложных бенчмарках.

Qwen последовательно развивает линейку кодинговых моделей в сторону автономных агентов. Ранее компания продвигала Qwen3-Coder как инструмент для сложных задач, а Qwen3-Coder-Next усиливает этот вектор за счёт сверхдлинного контекста, MoE-архитектуры и обучения на исполняемых задачах. Это также укладывается в общий тренд: модели перестают быть «чатами» и превращаются в постоянно работающих агентов.

Итог: Qwen3-Coder-Next — шаг к более дешёвым и устойчивым кодинг-агентам, которые могут долго работать с реальным кодом, а не просто генерировать ответы в чате.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: .

Тэги Qwen Нейросети

Источник

Оставьте ответ

Ваш электронный адрес не будет опубликован.