Извинити. Не знаю автора )
Извинити. Не знаю автора )
Из этого канала
- #5498Про скейлинг PEFT/LoRA на миллионы пользователей гигантских моделей. On the…
Про скейлинг PEFT/LoRA на миллионы пользователей гигантских моделей. On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters Mind Lab:…
- #5502Продолжающиеся поиски бэкпропа в мозге не увенчиваются успехом. Там что-то…
Продолжающиеся поиски бэкпропа в мозге не увенчиваются успехом. Там что-то другое.
- #5507Выкидываем лишние матрицы из трансформеров. Вот, слили K и V. Вообще мне…
Выкидываем лишние матрицы из трансформеров. Вот, слили K и V. Вообще мне кажется, что-то такое уже было...
- #5493"Прикольная работа про то, как выжать больше из ограниченных имеющихся данных и…
"Прикольная работа про то, как выжать больше из ограниченных имеющихся данных и неограниченного компьюта.
- #5489Ян и Рэндал продолжают копать свои темы про JEPA и доказали интересную штуку…
Ян и Рэндал продолжают копать свои темы про JEPA и доказали интересную штуку про латенты такой модели — они с точностью до поворота восстанавливают истинные…