Китайская компания Alibaba представила предварительную версию своей новой модели Qwen3-Max-Thinking, которая позиционируется как экспериментальная reasoning-модификация флагманской линейки Qwen3-Max. Разработка ориентирована на сложные задачи, требующие логического мышления и многошаговых рассуждений.
По внутренним данным, Qwen3-Max-Thinking оснащена 1 триллионом параметров и построена на архитектуре Mixture-of-Experts (MoE), где активируется лишь часть параметров при каждом запросе. Такой подход обеспечивает высокое качество вывода при умеренном потреблении ресурсов.
В тестах модель показала 100-процентные результаты на сложных бенчмарках AIME 2025 и HMMT, которые традиционно используются для проверки способности моделей решать задачи с элементами рассуждения и аналитического анализа.
Alibaba отмечает, что Qwen3-Max-Thinking пока находится на этапе активного обучения, но уже демонстрирует потенциал, сравнимый с закрытыми системами уровня GPT-5 и Gemini 2.5. В Qwen Chat пользователи могут попробовать ранний доступ и сравнить результаты reasoning-модели с обычной Qwen3-Max.
Компания также уточнила, что отдельное внимание уделено устойчивости к ложным выводам и способности к самооценке решений, что делает Qwen3-Max-Thinking ближе к моделям класса метакогнитивных ИИ.
API версии уже доступен в Alibaba Cloud, а официальный релиз полной модели ожидается в начале 2026 года.
Это первый публичный показ «thinking»-версии Qwen3, которая делает ставку на многошаговые рассуждения и способность планировать решение сложных задач. Ключевая особенность — это так называемый tool-augmented reasoning. Модель может подключать внешние инструменты, такие как калькулятор, для уточнения промежуточных шагов в процессе рассуждения.
Однако, стоит отметить, что достижение 100% на AIME и HMMT было обеспечено при использовании дополнительных инструментов и увеличенных вычислений. В обычном режиме показатели могут быть ниже, что подчеркивает потенциал новой архитектуры.
Alibaba последовательно развивает линейку Qwen, начиная от базовых моделей и переходя к специализированным версиям, ориентированным на сложные reasoning-задачи. Модель Qwen3-Max-Thinking прямо соперничает с другими «reasoning»-моделями, такими как DeepSeek-R и OpenAI o1.
Таким образом, Qwen3-Max-Thinking представляет собой шаг к созданию ИИ, который не только выдаёт ответы, но и умеет активно размышлять. Пока модель показывает идеальные результаты только в усиленном режиме, но именно такая разработка приближает нейросети к человеческому восприятию и способам рассуждения.
