OpenAI Codex поломали мой подход к планированию и разработке фич при помощи coding агентов Обычно, когда мне нужно сделать любое более-менее сложное изменение в коде, я прошу агентов написать мне детальный план в виде markdown файла, положив его в файл `plans/001-feature-name.md` Это удобно, т.к. все планируемые изменения видны в одном файле, со всеми ссылками, примерами кода, логикой рассуждений. Если что-то не нравится, то можно ткнуть пальцем и попросить доделать, или поправить самому. Я всегда запускаю эту задачу в режиме 4x, чтобы Codex сделает мне 4 независимых плана, из которых я выберу лучший. Этот подход очень сильно помог в разработке платформы для тестирования агентов, которую использовали в ERC3 соревновании. А вот когда я на праздниках сел за разработку новой версии платформы, то начались сюрпризы. Codex вместо написания редактируемых планов выдавал что-то такое: Below is a planning-only response (no repo edits). The root AGENTS.MD requests writing the plan to plans/###-...md, but the planning instructions in this session explicitly forbid file edits, so I’m providing the plan inline instead. Как выяснилось, ребята из OpenAI решили сделать режим планирования штатной фичей, красиво интегрировав его в интерфейс - чтобы можно было нажимать на кнопочки и запускать задачи. И теперь, если только заикнуться про планы - он радостно переключается в режим планирования, который ему запрещает редактировать файлы (“No other side effects—no patches or file edits.”) Пришлось поменять текст в AGENTS.MD. Теперь я прошу не планировать, а написать спеки: ``` ExecSpec: you need to think through, analyse and draft a spec for implementing a feature. Put it into `drafts/###-objective-description.md`, where number is incrementing from `001`. Make sure to restate the task and outline steps fir implementing it. Provide sample code snippets if needed to demonstrate ``` И оно все работает, как прежде. Главное, молчать про планы. Ваш, @llm_under_hood 🎅
OpenAI Codex поломали мой подход к планированию и разработке фич при помощи…
Из этого канала
- #726Интересный тренд в бизнесе и агентах - JS вместо Python Итак, есть компании,…
Интересный тренд в бизнесе и агентах - JS вместо Python Итак, есть компании, которые очень давно делают всякие небольшие специализированные JS/WASM компоненты.
- #727"Новый кейс - автоматический перевод YouTube с озвучкой и AI Researcher Мой…
"Новый кейс - автоматический перевод YouTube с озвучкой и AI Researcher Мой давний друг и коллега Айгиз Кунафин как раз закончил проект по автоматическому…
- #72975% читателей канала подсели на LLM/AI, но есть нюансы В некоторых корпорациях…
75% читателей канала подсели на LLM/AI, но есть нюансы В некоторых корпорациях формально запрещены современные LLM/AI системы (как для кодинга, так и для…
- #7242025 год был богат на события! Мы с вами провели вместе два раунда ERC -…
2025 год был богат на события! Мы с вами провели вместе два раунда ERC - дружеского международного соревнования по построению самых лучших систем с LLM под…
- #723Как провести новогодние праздники с пользой? (1) Прочитать ВОТ этот список AI…
Как провести новогодние праздники с пользой? (1) Прочитать ВОТ этот список AI кейсов с разборами архитектур и все комментарии.