Artificial Analysis протестили QwQ 32B Модель показала себя очень хорошо для своего размера — местами она отстаёт лишь от o3-mini. К тому же она достаточно маленькая чтобы её захостили Groq — модель у них работает на скорости более чем в 400 токенов в секунду. Очень хороший пример пользы скоростного инференса. @ai_newz