А еще вдогоночку неделю назад работа вышла по 1.58bit Flux (флакс щас лучшая генерилка картинок) где обещают в ~5 раз экономию памяти на инференсе https://chenglin-yang.github.io/1.58bit.flux.github.io/ 1.58-bit FLUX https://arxiv.org/abs/2412.18653v1 Код и веса обещают скоро зарелизить https://github.com/Chenglin-Yang/1.58bit.flux
А еще вдогоночку неделю назад работа вышла по 1.58bit Flux (флакс щас лучшая…
Из этого канала
- #896В прошлом году ребята из Physical Intelligence рассказывали про модель Pi0…
В прошлом году ребята из Physical Intelligence рассказывали про модель Pi0 https://www.physicalintelligence.company/blog/pi0 - что это фаундейшен моделька для…
- #897Тул для командной строки, который собирает код из укзанной директории в большой…
Тул для командной строки, который собирает код из укзанной директории в большой промт для ЛЛМки (для анализа кода, изменения или чего вам нужно).
- #898Получается 31 декабря Дед Мороз приносил обзорку по Low Rank Adaptation и…
Получается 31 декабря Дед Мороз приносил обзорку по Low Rank Adaptation и фоундейшен моделькам.
- #894Эксперимент на тему обучения нейронок в 1.58 бит. Веса модели представляются в…
Эксперимент на тему обучения нейронок в 1.58 бит. Веса модели представляются в тернарном виде (т.е.