Kimi K2 Thinking Больше всего впечатляет возможность выполнять сотни тулколов последовательно преследуя одну задачу. Моделька крайне эффективна в этом — 44,9% на текстовой части HLE с тулюзом это очень хорошие результаты. Без тулов она выдаёт 23.9%, а с параллельным скейлингом вроде GPT-5 Pro/Gemini Deep Think вообще 51%. Распространяется модель исключительно в int4, все результаты бенчмарков от квантизированной версии модели. Moonshot говорят что потерь качества от квантизации нет, но проверить это не выйдет. Моделька уже доступна на kimi.com (с ограниченным набором тулов, полноценный агентный режим обещают скоро), на 🤗 и в API (пока только официальном). Окно контекста остаётся прежним — 256к, цена тоже остаётся как и у оригинальной K2. Блогпост Веса @ai_newz