Bonsai Image 4B — чудеса квантизации Стартап PrismML, специализирующийся на экстремальном сжатии моделек, сделал квантизированную до одного бита FLUX.2 Klein 4B, вышло на удивление достойно. С таким уровнем квантизации Diffusion Transformer занимает всего лишь 930 мегабайт в 1-битном варианте и 1.2 гигабайта в тернарном варианте. Текстовый энкодер настолько же сильно ужать не удалось, поэтому весь комплект весит ~3.5 гига. Такая квантизация позволяет запускать модель прямо в браузере и на телефонах, используя лишь 2 гигабайта оперативки. На генерацию 512x512 картинки на iPhone 17 Pro Max с такой моделью уходит 9.4 секунды при 4 шагах, что неплохо если учитывать факт офлоадинга. Ждём моделек побольше, для локального деплоймента. Инференс в браузере Веса @ai_newz
Bonsai Image 4B — чудеса квантизации Стартап PrismML, специализирующийся на…
Из этого канала
- #4594На Хабре вышел подробный разбор ~~массивного ~~whitepaper от Сбера «AI-Disrupt…
На Хабре вышел подробный разбор ~~массивного ~~whitepaper от Сбера «AI-Disrupt PDLC».
- #4595Вышел Claude Opus 4.8 Модель стала заметно умнее на токен, новый low иногда…
Вышел Claude Opus 4.8 Модель стала заметно умнее на токен, новый low иногда обгоняет старый max.
- #4596MiniMax выпустили M3 Миллион токенов контекста и мультимодальность, веса скоро…
MiniMax выпустили M3 Миллион токенов контекста и мультимодальность, веса скоро можно будет скачать. Попробовать можно бесплатно в OpenCode.
- #4590Нейродайджест за ~~неделю~~ (#117) Аж за 3 недели 4.05 - 24.05. LLM -…
Нейродайджест за ~~неделю~~ (#117) Аж за 3 недели 4.05 - 24.05. LLM - Обновление GPT Instant 5.5 — Модель поумнела, а в ChatGPT обновили интерфейс памяти,…
- #4589"Эвалы здорового человека Все мы знаем этот классический флоу разработки…
"Эвалы здорового человека Все мы знаем этот классический флоу разработки LLM-фич — ""потыкал промпт, вроде работает"", и радостно катим всё это дело в прод.