"🔥Gemma 3 - новый лидер (второе место) в опен-сорсе Перфоманс: - Топ2 среди опенсорса в human preference evaluations на LLM арене, то есть, генерит тексты, которые людям нравятся больше! - Уделывает и Qwen-2.5-Max и o3-mini, приземлились где-то по середине между DeepSeek-V3 и DeepSeek-R1 - По перфомансу она сравнима (где-то лушче, где-то хуже) с Gemini 1.5 Flash, только зато теперь открытая! Характеристики - Контекст 128к токенов. - 4 размера: 1B, 4B, 12B, 27B. - Завезли мультимодальность в модели размерах 4-27B. Тут используют SigLIP (это сота CLIP на данный момент) в качестве картиночного энкодера. - Мультиязычность на стероидах: Поддерживает 140 языков. Гораздо лучше GPT-4o на русском. - Function Calling & Structured Output: - 27B влезает в одну H100/A100 GPU в bf16 - и это очень удобно! Ее специально под это оптимизировали. - На демо показали, что bf16 инференс съедает 20GB VRAM на A100. - Уже завезли в Ollama и есть официальные квантованные версии. Моя критика: - Мультимодальность пока под вопросам. По некоторым бенчам Гемму-27B бьет даже Qwen-2.5-VL-7B, не говоря уже об InternVL-38B-MPO. - Поговорил с человеком, который делал multimodal pre-training. Внятного ответа не получил. Был ответ в стиле ""китайцы и мистраль накручивают бенчи"". - Ждем полноценного появления на VLM лидерборде. И нужно тестить на своих задачах. __В любом случае я рад появлению еще одной сильной модельки в опенсорсе, приближая нас к умному ассистенту у нас в кармане/под столом.__ Tech Report Бесплатное демо онлайн Hugging Face GitHub @ai_newz"
"🔥Gemma 3 - новый лидер (второе место) в опен-сорсе Перфоманс: - Топ2 среди…
Из этого канала
- #3732Опубликовали техрепорт о претрейне рускоязычных LLM T-lite и T-pro. Вышел…
Опубликовали техрепорт о претрейне рускоязычных LLM T-lite и T-pro. Вышел подробный технический отчет о процессе создания русскоязычных моделей T-lite и T-pro…
- #3733LanDiff – гибридный видеогенератор из LLM и Диффузии Китайцы не спят, а…
LanDiff – гибридный видеогенератор из LLM и Диффузии Китайцы не спят, а клепают видеомодели. Этот проект интересен своим необычным подходом и результатами.
- #3740RIP Photoshop (нет) Потестил я мультимодальную Gemini Flash 2.0 (Image…
RIP Photoshop (нет) Потестил я мультимодальную Gemini Flash 2.0 (Image Generation) Experimental.
- #3728Новые тулы для агентов от OpenAI 🔎 Специальные версии GPT 4o/4o-mini в API…
Новые тулы для агентов от OpenAI 🔎 Специальные версии GPT 4o/4o-mini в API теперь могут использовать поиск, прямо как ChatGPT .
- #3727Через пять минут у OpenAI начинается очередной стрим Обещают показать что-то…
Через пять минут у OpenAI начинается очередной стрим Обещают показать что-то новое для агентов в API. https://www.youtube.com/watch?v=hciNKcLwSes @ainewz