DiffusionGemma Google релизнули дифузионную версию геммы 26BA4B. Модель в 4 раза быстрее при таком же количестве параметров — на H100 она выдаёт 1000 токенов в секунду, а на RTX 5090 очень неплохие 700. Качество падает по сравнению с авторегрессионной моделью, но тренировать текстовую диффузию всё ещё учатся, это не удивительно. Приятно видеть что работа над диффузией для ллм не останавливается, а то демка Gemini Diffusion год назад в релиз так и не ушла. Веса Блогпост @ai_newz
DiffusionGemma Google релизнули дифузионную версию геммы 26BA4B. Модель в 4…
Из этого канала
- #4607Самое ценное в современном ML это возможность поделиться своими наработками и…
Самое ценное в современном ML это возможность поделиться своими наработками и подглядеть, а что там у других.
- #4606"Самая неприятная деталь релиза Fable — модель резко тупеет при ""использовании…
"Самая неприятная деталь релиза Fable — модель резко тупеет при ""использовании для разработки фронтирных моделей"".
- #4605Вышел Claude 5 Fable Это общедоступная версия Mythos, в которую засунули…
Вышел Claude 5 Fable Это общедоступная версия Mythos, в которую засунули дополнительные сейфгарды которых нет в полноценной модели.