gonzo-обзоры ML статей@gonzo_ML· 24 246 subs

"Ещё про диффузионные LLM, теперь подход Soft Masking. Здесь вместо того, чтобы…

26 окт. 2025 г.5 805 views41 forwardsОткрыть в Telegram →

"Ещё про диффузионные LLM, теперь подход Soft Masking. Здесь вместо того, чтобы принимать бинарное решение ""заменить `[MASK]` на реальный токен"" или нет, мы при сохранении маски смешиваем эмбеддинг токена `[MASK]` с взвешенной по уверенности выпуклой комбинацией эмбеддингов топ-k предсказанных токенов с предыдущего шага. Способствует сохранению важной информации, улучшает обучение. https://t.me/gonzo_ML_podcasts/1043"

Источник

https://t.me/gonzo_ML/4155

Канал gonzo-обзоры ML статей · опубликовано 26 окт. 2025 г.

Из этого канала