gonzo-обзоры ML статей@gonzo_ML· 24 246 subs

Интересная работа про Planned Diffusion: сначала авторегрессионно генерим план…

25 окт. 2025 г.6 025 views46 forwardsОткрыть в Telegram →

Интересная работа про Planned Diffusion: сначала авторегрессионно генерим план ответа, потом диффузионно впараллель заполняем его отдельные части. Всё делает одна модель. https://t.me/gonzo_ML_podcasts/1034

Источник

https://t.me/gonzo_ML/4154

Канал gonzo-обзоры ML статей · опубликовано 25 окт. 2025 г.

Из этого канала

#4155"Ещё про диффузионные LLM, теперь подход Soft Masking. Здесь вместо того, чтобы…
"Ещё про диффузионные LLM, теперь подход Soft Masking. Здесь вместо того, чтобы принимать бинарное решение ""заменить `[MASK]` на реальный токен"" или нет, мы…
#4157Больше фундаментальных моделей, хороших и разных, и за пределами языка. Две…
Больше фундаментальных моделей, хороших и разных, и за пределами языка. Две недавние работы: Physics Foundation Model (https://t.me/gonzoMLpodcasts/1055) —…
#4163Датасет для файнтюнинга агентности... из 78 примеров. LIMI: Less is More for…
Датасет для файнтюнинга агентности... из 78 примеров. LIMI: Less is More for Agency https://t.me/gonzoMLpodcasts/1083
#4153Свободу трансформерам! https://t.me/gonzoMLpodcasts/1020 Добавили к…
Свободу трансформерам! https://t.me/gonzoMLpodcasts/1020 Добавили к авторегрессионной генерации латенты в стиле CVAE и сделали это с почти минимальным…
#4152Отменный самовар получился
Отменный самовар получился