This is a package for formally expressing deep learning models based on Neural Circuit Diagrams, FlashAttention on a Napkin and Spherical Attention. The main goal of this package is to provide a simple and intuitive way to define and visualize deep learning models, while also allowing for formal reasoning about their properties. In data_structure, you will find a high-level implementation of the structural aspects of deep learning models. https://github.com/mit-zardini-lab/pyncd
This is a package for formally expressing deep learning models based on Neural…
0 viewsОткрыть в Telegram →
Из этого канала
- #6029кстати у нас кто-нибудь работает активно в космической теме? какие либы лучше…
кстати у нас кто-нибудь работает активно в космической теме? какие либы лучше взять для условно моделирования миссий спутников и прочего? я с orekit работал в…
- #6030А какое там применение ML? Наскок я знаю там и без него спокойно все считается
А какое там применение ML? Наскок я знаю там и без него спокойно все считается
- #6031ну типа любое применение автономное управление или еще чего, планирование…
ну типа любое применение автономное управление или еще чего, планирование миссий я прост хочу енв куда можно было бы агента закинуть и пусть учится чему угодно
- #6027On Surprising Effectiveness of Masking Updates in Adaptive Optimizers…
On Surprising Effectiveness of Masking Updates in Adaptive Optimizers https://arxiv.org/abs/2602.15322 https://www.alphaxiv.org/overview/2602.15322
- #6026https://www.reddit.com/r/LocalLLaMA/comments/1r7mscr/itrainedalanguagemodeloncpu…
https://www.reddit.com/r/LocalLLaMA/comments/1r7mscr/itrainedalanguagemodeloncpuin12hours