gonzo-обзоры ML статей@gonzo_ML· 24 246 subs

Опенсорсная модель с ризонингом K2-Think (не путать с Kimi K2) от LLM360 имеет…

13 сент. 2025 г.6 393 views96 forwardsОткрыть в Telegram →

Опенсорсная модель с ризонингом K2-Think (не путать с Kimi K2) от LLM360 имеет размер всего 32B (построена на базе Qwen2.5), но бьёт многие более тяжёлые открытые модели. Спасибо фулл-стэк подходу, включающему обучение (SFT+RLVR), тест-тайм скейлинг (планирование и best-of-3) и инференс (спекулятивное декодирование и работу на Cerebras (!)). https://t.me/gonzo_ML_podcasts/823 Термин фулл-стэк приходит в ML :)

Источник

https://t.me/gonzo_ML/4021

Канал gonzo-обзоры ML статей · опубликовано 13 сент. 2025 г.

Из этого канала