Вышла Qwen3-Max-Thinking, и модель заслуживает внимания Метрики говорят сами за себя: – HLE 30.2 (примерно уровень Claude-Opus 4.5), с test-time-scaling техниками еще больше – SWE Verified 75.3 (чуть хуже опуса, примерно Gemini 3 Pro) – IMO 83.9 (бьет Gemini 3 Pro) Плюс, обещают прокачанный tool call и хорошее следование инструкциям, даже на длинном контексте. В целом, выглядит очень конкурентоспособно, полноценный frontier уровень. Весов нет (модель все равно гигантская). Попробовать можно тут. Qwen в последнее время радует гораздо больше DeepSeek