gonzo-обзоры ML статей@gonzo_ML· 24 246 subs

В стане RNN пополнение, MesaNet, являющийся дальнейшим развитием Mesa-слоя из…

13 июн. 2025 г.8 191 views59 forwardsОткрыть в Telegram →

В стане RNN пополнение, MesaNet, являющийся дальнейшим развитием Mesa-слоя из работы про мезаоптимизацию (https://t.me/gonzo_ML/1855). В новой работе архитектура и слой проработаны основательно, результаты RNN на синтетических тестах очень хороши, но всё равно показывают интересную особенность: подобно другим RNN, MesaNet работает лучше трансформеров на ранних токенах в последовательности, но трансформеры сохраняют преимущество на поздних токенах. Подробнее: https://t.me/gonzo_ML_podcasts/280

Источник

https://t.me/gonzo_ML/3697

Канал gonzo-обзоры ML статей · опубликовано 13 июн. 2025 г.

Из этого канала