🥺 пока я разбираю предыдущую статью DeepSeek, они выпускают новую — наконец-то про работу с изображениями! Обновлений не было кажется с декабря 2024-го! Статья: PDF на GitHub Thinking with Visual Primitives, как следует из названия, обучает модели и думать, и выявлять объекты (примитивы). Вместо 100 слов — 5 картинок-примеров из статьи, от «посчитай людей на картинке» до «пройди лабиринт». На выбранном наборе бенчмарков обходят GPT-5.4 и Gemini 3 Flash, при этом используя гораздо меньше токенов в контексте (=дешевле и быстрее для пользователя)