Прогресс по VLM В то время как LLM бенчи насыщаются довольно быстро, прогресс по VLM, которые требует мультимодального ризонинга (то есть нужно понимать что-то по картинке) идет не так бодро. На графике приведен бенчмарк MMMU (Massive Multi-Discipline Multimodal Understanding and Reasoning Benchmark) — это тест для оценки знаний и логического мышления на уровне младших курсов бакалавриата в шести ключевых дисциплинах. Он проверяет, насколько хорошо система понимает и анализирует информацию из разных областей, используя текст, изображения и другие форматы данных (таблицы, например). Тест измеряет не просто запоминание фактов, а способность делать выводы и решать сложные задачи. Китайцы и тут хорошо колбасят в опенсорс! Из открытых моделей, на этом бенче в лидерах сейчас как раз китайцы: InternVL2.5-78B (ее на графике нет) и QVQ-72B-Preview / Qwen2.5-VL-72B (этой тоже на графике нет). @ai_newz
Прогресс по VLM В то время как LLM бенчи насыщаются довольно быстро, прогресс…
Из этого канала
- #3679Бесплатный Deep Research от Perplexity Без подписки дают 5 запросов в день,…
Бесплатный Deep Research от Perplexity Без подписки дают 5 запросов в день, подписчикам - 500 запросов в день.
- #3680"Grok 3 релизнется во вторник утром По словам Маска, это будет ""самый умный ИИ…
"Grok 3 релизнется во вторник утром По словам Маска, это будет ""самый умный ИИ на планете"".
- #3681Нейродайджест за неделю (#56) Finance - Ответ Stargate — французы вложат 109…
Нейродайджест за неделю (#56) Finance - Ответ Stargate — французы вложат 109 миллиардов евро в AI. Mistral питаются от счастья.
- #3677Европа уже какой день подряд говорит про АИ на самом верхнем уровне – последнее…
Европа уже какой день подряд говорит про АИ на самом верхнем уровне – последнее выступление Урсулы фон дер Ляйен от сегодня уже с конкретными шагами, включая…
- #3676Маск продолжает вставлять палки в колёса OpenAI Группа инвесторов, во главе с…
Маск продолжает вставлять палки в колёса OpenAI Группа инвесторов, во главе с Илоном, предложила 97,4 миллиарда долларов за OpenAI.