Kimi K2 Thinking Больше всего впечатляет возможность выполнять сотни тулколов последовательно преследуя одну задачу. Моделька крайне эффективна в этом — 44,9% на текстовой части HLE с тулюзом это очень хорошие результаты. Без тулов она выдаёт 23.9%, а с параллельным скейлингом вроде GPT-5 Pro/Gemini Deep Think вообще 51%. Распространяется модель исключительно в int4, все результаты бенчмарков от квантизированной версии модели. Moonshot говорят что потерь качества от квантизации нет, но проверить это не выйдет. Моделька уже доступна на kimi.com (с ограниченным набором тулов, полноценный агентный режим обещают скоро), на 🤗 и в API (пока только официальном). Окно контекста остаётся прежним — 256к, цена тоже остаётся как и у оригинальной K2. Блогпост Веса @ai_newz
Kimi K2 Thinking Больше всего впечатляет возможность выполнять сотни тулколов…
Из этого канала
- #4238Прямое включение из Сан Франциско. Погода солнечная, AI тусовка очень плотная.…
Прямое включение из Сан Франциско. Погода солнечная, AI тусовка очень плотная. Раньше я сюда приезжал пообщаться с директорами и VP в Мете, а теперь как…
- #4240"Google Opal — убийца n8n? (еще нет) Google тихо выкатил Opal — свой клон n8n с…
"Google Opal — убийца n8n? (еще нет) Google тихо выкатил Opal — свой клон n8n с визуальным редактором и нодами для автоматизации.
- #4241Разработчики все чаще используют ИИ-агентов — SourceCraft от Yandex B2B Tech за…
Разработчики все чаще используют ИИ-агентов — SourceCraft от Yandex B2B Tech за квартал вырос по активности на 50%.
- #4235Embodied Avatar — пора вспомнить Живую Сталь Unitree показали собственную…
Embodied Avatar — пора вспомнить Живую Сталь Unitree показали собственную систему телеуправления роботами.
- #4234"Нейродайджест за неделю (#92) LLM - Релизнули веса Minimax M2 — Китайский…
"Нейродайджест за неделю (#92) LLM - Релизнули веса Minimax M2 — Китайский SOTA-ризонер среди открытых моделей.