Microsoft выпустила веса BitNet модели (спустя год) Я уже писал о BitNet — методе тренировки моделей сразу квантизированными до 1.58 бит, но тогда авторы выложили лишь пару сниппетов кода, без весов. Их новая 2B модель примерно равна Qwen 2.5 1.5B на бенчах, но в два раза быстрее и использует в 12 раз меньше энергии. Натренировали её всего на 4 триллионах токенов, что хоть и мало для моделей побольше, но нормально в такой весовой категории — ту же Gemma 3 1B натренировали на лишь двух триллионах токенов, а 4B на 4. Но есть здесь и ложка дёгтя — так как модель от Microsoft, то вероятно что модели тренировали на датасетах от Phi моделей, а у них скверная репутация. Как модель себя ведёт на самом деле — покажет лишь опыт использования. Если хотите попробовать — для инференса рекомендуют использовать майкрософтовский bitnet.cpp, остальной софт для инференса BitNet модели не поддерживает. Веса @ai_newz
Microsoft выпустила веса BitNet модели (спустя год) Я уже писал о BitNet —…
Из этого канала
- #3838Anthropic запустили бету своего Deep Research В отличии от конкурентов, он…
Anthropic запустили бету своего Deep Research В отличии от конкурентов, он может искать не только по интернету, но и по персональным данным — этому помогают…
- #3839Трамп, конечно, рыночек хорошо колбасит. С такими тарифами американский проект…
Трамп, конечно, рыночек хорошо колбасит. С такими тарифами американский проект Stargate может тоже под вопрос стать. @ainewz
- #3840💥Итак, эта тёмная лошадка Mogao оказалась новой text2image моделью Seedream 3.0…
💥Итак, эта тёмная лошадка Mogao оказалась новой text2image моделью Seedream 3.0 от ByteDance На лидерборде она делит первое место с GPT-4o – разрыв в 1 ELO…
- #3836Яндекс запускает бета-тест YandexGPT 5 с reasoning-режимом Яндекс начал…
Яндекс запускает бета-тест YandexGPT 5 с reasoning-режимом Яндекс начал публичное бета-тестирование YandexGPT 5 с reasoning (режим рассуждений).
- #3832OpenAI показали GPT-4.1 Идёт в трёх размерах — GPT 4.1, GPT 4.1 Mini и GPT 4.1…
OpenAI показали GPT-4.1 Идёт в трёх размерах — GPT 4.1, GPT 4.1 Mini и GPT 4.1 Nano.