On Surprising Effectiveness of Masking Updates in Adaptive Optimizers https://arxiv.org/abs/2602.15322 https://www.alphaxiv.org/overview/2602.15322
On Surprising Effectiveness of Masking Updates in Adaptive Optimizers…
0 viewsОткрыть в Telegram →
Из этого канала
- #6028This is a package for formally expressing deep learning models based on Neural…
This is a package for formally expressing deep learning models based on Neural Circuit Diagrams, FlashAttention on a Napkin and Spherical Attention.
- #6029кстати у нас кто-нибудь работает активно в космической теме? какие либы лучше…
кстати у нас кто-нибудь работает активно в космической теме? какие либы лучше взять для условно моделирования миссий спутников и прочего? я с orekit работал в…
- #6030А какое там применение ML? Наскок я знаю там и без него спокойно все считается
А какое там применение ML? Наскок я знаю там и без него спокойно все считается
- #6026https://www.reddit.com/r/LocalLLaMA/comments/1r7mscr/itrainedalanguagemodeloncpu…
https://www.reddit.com/r/LocalLLaMA/comments/1r7mscr/itrainedalanguagemodeloncpuin12hours
- #6025Завтра покрутим вендинг-енв мне интересно что получится
Завтра покрутим вендинг-енв мне интересно что получится