https://www.reddit.com/r/LocalLLaMA/comments/1r7mscr/i_trained_a_language_model_on_cpu_in_12_hours
https://www.reddit.com/r/LocalLLaMA/comments/1r7mscr/itrainedalanguagemodeloncpu…
0 viewsОткрыть в Telegram →
Из этого канала
- #6027On Surprising Effectiveness of Masking Updates in Adaptive Optimizers…
On Surprising Effectiveness of Masking Updates in Adaptive Optimizers https://arxiv.org/abs/2602.15322 https://www.alphaxiv.org/overview/2602.15322
- #6028This is a package for formally expressing deep learning models based on Neural…
This is a package for formally expressing deep learning models based on Neural Circuit Diagrams, FlashAttention on a Napkin and Spherical Attention.
- #6029кстати у нас кто-нибудь работает активно в космической теме? какие либы лучше…
кстати у нас кто-нибудь работает активно в космической теме? какие либы лучше взять для условно моделирования миссий спутников и прочего? я с orekit работал в…
- #6025Завтра покрутим вендинг-енв мне интересно что получится
Завтра покрутим вендинг-енв мне интересно что получится
- #6024в https://github.com/researchim-ai/models-at-home обнова заехала с обучающей…
в https://github.com/researchim-ai/models-at-home обнова заехала с обучающей инфой) Скоро будет больше