Google выпустили открытую диффузионную языковую модель DiffusionGemma Год назад они релизили Gemini Diffusion, но тогда попробовать необычную модель можно было только по запросу. Сейчас же – совсем другое дело, копайтесь на здоровье кто угодно. Лицензия Apache 2.0. Фишка модели в том, что вместо генерации токенов один за одним, как абсолютно во всех других LLM, здесь они генерируются в произвольном порядке целыми блоками. Модель начинает с шума и итеративно уточняет весь текст параллельно. Другими словами, расшумляет, как в диффузионных генераторах картинок: отсюда и название. Во-первых, для многих доменов это теоретически более правильный подход. Например, написание кода – вещь нелинейная. А тут внутри двунаправленный механизм внимания, и кусочки последовательности можно генерировать в логическом порядке, а не просто слева направо. К тому же модель способна итеративно корректировать сама себя прямо во время генерации. Во-вторых, за счет параллельной генерации модель обеспечивает существенное ускорение. Google пишут об x4 на стандартных видеокартах: моделька летит 1000+ токенов в секунду на одной NVIDIA H100. По наполнению это MoE 26B c активными 3.8B, должна помещаться в 18GB VRAM с квантованием. – Блогпост – Веса – Гайд для разработчиков
Google выпустили открытую диффузионную языковую модель DiffusionGemma Год назад…
Из этого канала
- #9367"AI-рисерчеры настолько зашеймили Anthropic за скрытые ограничения Fable, что…
"AI-рисерчеры настолько зашеймили Anthropic за скрытые ограничения Fable, что стартап поменял политику менее чем за 48 часов после релиза После выхода модели…
- #9369"Как научиться понимать, что AI-продукт действительно стал лучше? Когда новый…
"Как научиться понимать, что AI-продукт действительно стал лучше? Когда новый промпт показывает хорошие результаты на нескольких примерах, или после смены…
- #9370Аналитики из SemiAnalysis посчитали, сколько действительно костов заложено в…
Аналитики из SemiAnalysis посчитали, сколько действительно костов заложено в подписки на ИИ Они взяли каждую из подписок OpenAI и Anthropic (за 20$, за 100 и…
- #9361AWS решили ультануть и выдали, что вайбкодинг замедляет команды Больше кода,…
AWS решили ультануть и выдали, что вайбкодинг замедляет команды Больше кода, созданного с помощью ИИ, не делает вашу команду быстрее.
- #9360Что мешает внедрению AI в бизнесе Внедрение AI в бизнес-процессы упирается не…
Что мешает внедрению AI в бизнесе Внедрение AI в бизнес-процессы упирается не только в модели и железо. Часто проблема в качестве, структуре и смысле данных.