"🔥Gemma 3 - новый лидер (второе место) в опен-сорсе Перфоманс: - Топ2 среди опенсорса в human preference evaluations на LLM арене, то есть, генерит тексты, которые людям нравятся больше! - Уделывает и Qwen-2.5-Max и o3-mini, приземлились где-то по середине между DeepSeek-V3 и DeepSeek-R1 - По перфомансу она сравнима (где-то лушче, где-то хуже) с Gemini 1.5 Flash, только зато теперь открытая! Характеристики - Контекст 128к токенов. - 4 размера: 1B, 4B, 12B, 27B. - Завезли мультимодальность в модели размерах 4-27B. Тут используют SigLIP (это сота CLIP на данный момент) в качестве картиночного энкодера. - Мультиязычность на стероидах: Поддерживает 140 языков. Гораздо лучше GPT-4o на русском. - Function Calling & Structured Output: - 27B влезает в одну H100/A100 GPU в bf16 - и это очень удобно! Ее специально под это оптимизировали. - На демо показали, что bf16 инференс съедает 20GB VRAM на A100. - Уже завезли в Ollama и есть официальные квантованные версии. Моя критика: - Мультимодальность пока под вопросам. По некоторым бенчам Гемму-27B бьет даже Qwen-2.5-VL-7B, не говоря уже об InternVL-38B-MPO. - Поговорил с человеком, который делал multimodal pre-training. Внятного ответа не получил. Был ответ в стиле ""китайцы и мистраль накручивают бенчи"". - Ждем полноценного появления на VLM лидерборде. И нужно тестить на своих задачах. __В любом случае я рад появлению еще одной сильной модельки в опенсорсе, приближая нас к умному ассистенту у нас в кармане/под столом.__ Tech Report Бесплатное демо онлайн Hugging Face GitHub @ai_newz"