Google релизнули фичу Agentic Vision для Gemini 3 Flash По сути, она превращает анализ изображений из статического процесса в динамический. То есть вместо «посмотри на изображение и ответь» модель теперь делает «посмотри на изображение, поработай с ним и ответь». Конкретнее, отрабатывает цикл «Think-Act-Observe», то есть модель (1) анализирует изображение, думает и составляет план; (2) выполняет какой-то код для обработки изображения, всяких расчетов, детекции и тд; (3) обрабатывает результаты и добавляет в контекст новую информацию, которую использует для ответа. Например, есть задача посчитать пальцы на руке. Модель не просто смотрит и отвечает «5», а детектит каждый палец (прямо с рамками), считает прямоугольнички и выдает ответ. Пример упрощенный, но передает суть: модель тут работает с картинкой, как бы делая из нее визуальный черновик для рассуждений. Лучше всего фича показывает себя, конечно, на всяких сложных таблицах и при работе с мелкими деталями. Прирост к метрикам относительно ванильной Gemini 3 Flash – в среднем примерно 5-10%. Попробовать уже можно и в API, и в AI Studio blog.google/innovation-and-ai/technology/developers-tools/agentic-vision-gemini-3-flash/
Google релизнули фичу Agentic Vision для Gemini 3 Flash По сути, она…
Из этого канала
- #8670Там на сцене появился новый амбициозный ИИ-стартап Flapping Airplanes Его…
Там на сцене появился новый амбициозный ИИ-стартап Flapping Airplanes Его основали братья Спекторы и Эйдан Смит.
- #8671DeepMind выпустили сгенерированный мультик Его представили на кинофестивале…
DeepMind выпустили сгенерированный мультик Его представили на кинофестивале Sundance (и надеемся, скоро выпустят в общий доступ).
- #8672Инженеры AI VK построили Discovery-платформу – единую инфраструктуру для…
Инженеры AI VK построили Discovery-платформу – единую инфраструктуру для рекомендаций, поиска и рекламы в десятках продуктов VK.
- #8668Hugging Face отказались от 500 миллионов долларов от Nvidia, чтобы сохранить…
Hugging Face отказались от 500 миллионов долларов от Nvidia, чтобы сохранить независимость Пару месяцев назад Nvidia предложила стартапу инвестиции в размере…
- #8667OpenAI релизнули Prism – Overleaf на ИИ-спидах Это единая среда для написания…
OpenAI релизнули Prism – Overleaf на ИИ-спидах Это единая среда для написания научных (и не только) работ.