⚪️ Gemini 3 Flash #ddeval #feb2026eval2 Пока листал просторы интернета, наткнулся на челов, которые используют Гемини для кодинга. Да, какая то секта, видимо. Но они юзают Флеш вместо Про! И, конечно, мне пришла в голову мысл заюзать флеш на эвале! Долго ли - коротко ли, заюзалось. Ран в @12 семплов пробежал довольно шустро, потратив примерно 30% дневной квоты AI Pro аккаунта. Тайминги - от 120 секунд до 400, в основном около 250-300. Расходы токенов - от 1.1m до 9.5m А вот далее меня ждал большой сюрприз Найдено 77 issues, 75 верифицировано (56 verified/19 partial)- неплохой рейт в целом 🔥 А вот раскладка по приоритетам: p0 : 1 / 0 p1 : 10 / 3 p2 : 21 / 4 p3 : 20 / 12 p4 : 4 / 0 Напомню, это ФЛЕШ. Результаты более чем достойные. Я весьма удивлен. ▶️ Вывод: с кодом флеш работает неплохо, на данной задаче заметно ЛУЧШЕ чем Про версия! Однозначно Флеш проходит на этап конкурса кодеров. Это прям большое удивление и недопонимание! Пытали током что ли модель больше?.. Старшая модель заметно умнее и эрудированнее, но против цифр не попрешь. Надо думать - почему так)) (ц) omfg @deksden_notes