Вышла Qwen3-Max-Thinking, и модель заслуживает внимания Метрики говорят сами за себя: – HLE 30.2 (примерно уровень Claude-Opus 4.5), с test-time-scaling техниками еще больше – SWE Verified 75.3 (чуть хуже опуса, примерно Gemini 3 Pro) – IMO 83.9 (бьет Gemini 3 Pro) Плюс, обещают прокачанный tool call и хорошее следование инструкциям, даже на длинном контексте. В целом, выглядит очень конкурентоспособно, полноценный frontier уровень. Весов нет (модель все равно гигантская). Попробовать можно тут. Qwen в последнее время радует гораздо больше DeepSeek
Вышла Qwen3-Max-Thinking, и модель заслуживает внимания Метрики говорят сами за…
Из этого канала
- #8664Мем: Anthropic попросили ClawdBot переименоваться – якобы из-за каких-то…
Мем: Anthropic попросили ClawdBot переименоваться – якобы из-за каких-то проблем с товарным знаком. Теперь ClawdBot – это MoltBot (с англ. molt – линька).
- #8665Дарио Амадеи выкатил большое эссе под названием «Подростковый возраст…
Дарио Амадеи выкатил большое эссе под названием «Подростковый возраст технологий» Предупреждаем, чтиво не из веселых:…
- #8666"""В декабре 2025 возможности агентных LLM пересекли некий порог и вызвали…
"""В декабре 2025 возможности агентных LLM пересекли некий порог и вызвали фазовый сдвиг в разработке ПО"" – Андрей Карпаты В твиттере раскрутился очередной…
- #8659Честно признаемся, кто после утренних новостей про ClawdBot уже задумался о…
Честно признаемся, кто после утренних новостей про ClawdBot уже задумался о покупке Mac Mini?
- #8658В сети вирусится ClawdBot – новый опенсорсный агент, который запускается…
В сети вирусится ClawdBot – новый опенсорсный агент, который запускается локально Работает это буквально как саморазвернутый ассистент: вы поднимаете сервис у…