⚪️ Agentic Vision Вот и зрение у моделей уже не простое, а агентное. Модель… — @deksden_notes

⚪️ Agentic Vision Вот и зрение у моделей уже не простое, а агентное. Модель пишет код, и итеративно им исследует изображение. В блоге примеры! 🔗 https://blog.google/innovation-and-ai/technology/developers-tools/agentic-vision-gemini-3-flash Следующий шаг, из очевидных - swarm vision, видимо. Но как проактивные агентные техники развились то? RAG трещит под напором агентного поиска. И тут - буст 5-10% в бенчах зрения. Для табличек и прочей регулярной информации, с которой агенты справлялись плохо - вообще будет мощный плюс! А если рассматривать картинку не просто внутри thinking блока одного запроса, а действительно агентный цикл зафигачить? Еще и свармом для скорости? чтобы сегментировало, рассматривало в отдельности , кропало, трансформировало, улучшало, и прочее?.. Интересная штука, конечно. ▶️ Upd 1: А вы же обратили внимание, что это Флеш3, а не Про? ) Что характерно @deksden_notes

Из этого канала