Свободу трансформерам! https://t.me/gonzo_ML_podcasts/1020 Добавили к авторегрессионной генерации латенты в стиле CVAE и сделали это с почти минимальным оверхедом.
Свободу трансформерам! https://t.me/gonzoMLpodcasts/1020 Добавили к…
Из этого канала
- #4154Интересная работа про Planned Diffusion: сначала авторегрессионно генерим план…
Интересная работа про Planned Diffusion: сначала авторегрессионно генерим план ответа, потом диффузионно впараллель заполняем его отдельные части.
- #4155"Ещё про диффузионные LLM, теперь подход Soft Masking. Здесь вместо того, чтобы…
"Ещё про диффузионные LLM, теперь подход Soft Masking. Здесь вместо того, чтобы принимать бинарное решение ""заменить `[MASK]` на реальный токен"" или нет, мы…
- #4157Больше фундаментальных моделей, хороших и разных, и за пределами языка. Две…
Больше фундаментальных моделей, хороших и разных, и за пределами языка. Две недавние работы: Physics Foundation Model (https://t.me/gonzoMLpodcasts/1055) —…
- #4152Отменный самовар получился
Отменный самовар получился
- #4151Какая прикольная работа! CaT вместо CoT-SC. Делаем несколько роллаутов, а потом…
Какая прикольная работа! CaT вместо CoT-SC. Делаем несколько роллаутов, а потом не отбираем из них правильный ответ, а синтезируем! Из интересного, CaT может…