gonzo-обзоры ML статей@gonzo_ML· 24 246 subs

Датасет для файнтюнинга агентности... из 78 примеров. LIMI: Less is More for…

27 окт. 2025 г.5 472 views73 forwardsОткрыть в Telegram →

Датасет для файнтюнинга агентности... из 78 примеров. LIMI: Less is More for Agency https://t.me/gonzo_ML_podcasts/1083

Источник

https://t.me/gonzo_ML/4163

Канал gonzo-обзоры ML статей · опубликовано 27 окт. 2025 г.

Из этого канала

#4164Je suis Markov Прикольная работа, как делать долгие цепочки рассуждений, не…
Je suis Markov Прикольная работа, как делать долгие цепочки рассуждений, не растягивая контекст, а постоянно его сбрасывая и храня небольшое состояние.
#4166Психология ризонинга LRM в динамических ситуациях: прерывания с ограничением по…
Психология ризонинга LRM в динамических ситуациях: прерывания с ограничением по времени (требование немедленного ответа или ускорения) и динамический контекст…
#4168Всё дело в волшебных пузырьках! Thoughtbubbles — новая архитектура, которая…
Всё дело в волшебных пузырьках! Thoughtbubbles — новая архитектура, которая содержит ключевое нововведение — механизм, позволяющий модели динамически управлять…
#4157Больше фундаментальных моделей, хороших и разных, и за пределами языка. Две…
Больше фундаментальных моделей, хороших и разных, и за пределами языка. Две недавние работы: Physics Foundation Model (https://t.me/gonzoMLpodcasts/1055) —…
#4155"Ещё про диффузионные LLM, теперь подход Soft Masking. Здесь вместо того, чтобы…
"Ещё про диффузионные LLM, теперь подход Soft Masking. Здесь вместо того, чтобы принимать бинарное решение ""заменить `[MASK]` на реальный токен"" или нет, мы…