"Codex-5.1-Max тест Кто то смотрел на мой #DeksdenFlow (про него подробнее есть по нештегу) - решил я затестить новый Макс на предмет агентности. Был заинтригован тейком про некие ""long running tasks"". Сделал вариацию флоу, упрощенную, назвал mini-protocol: когда делаем план в текущей ветке main, план пишем в один файл, но также идем по шагам (группа задач) и делаем сохранение контекста/лога/коммитим после каждого шага. В общем, небольшой протокол из 3х шагов, в каждом 5-6 задач. Сказал - сделать весь протокол за раз, без остановок! Итоги: шаги 1 и 2 сделал ваншотом, но после 01 шага забыл сделать коммит, сделал после 02 шага и остановился. Работал 22 минуты на -max-medium (топовый нейминг, да?). Шаг 03 доделал нормально, с соблюдением протокола. ▶️ В общем - неплохо, но не АГИ и не вау."