Я пару дней пользовался OpenAI Codex. Это не панацея, но при этом прорывная в… — @llm_under_hood

Я пару дней пользовался OpenAI Codex. Это не панацея, но при этом прорывная в своем роде штука. Codex - это среда для AI + Coding. Сразу предупрежу, что качество работы с кодом примерно сравнимо с тем, что уже можно получить с Cursor + Gemini Pro 2.5. Тут нет ничего нового. Есть один нюанс. Разработку в Cursor + Gemini Pro 2.5 или Aider надо вести самостоятельно, выдавая задачи, отслеживая проблемы и проверяя результаты. За один раз можно вести один проект. Есть еще альтернативный подход к разработке - запускать агентов, которые сами будут что-то планировать и копошиться в папке с проектом. Но, __как я писал, иногда агенты только создают иллюзию работы, растягивая на 30-120 минут задачи, которые __можно решить одним промптом в чате__.__ __ __ А что нового предложил OpenAI Codex? Они сделали все красиво и удобно. Можно к своему аккаунту подключить несколько github repositories и запускать задачи текстом (примеры ниже). Это похоже на работу DeepResearch, но с кодом. Поставил задачу и пошел по своим делам, а reasoning планировщик от OpenAI проследит за выполнением работы. Он заберет код, прочитает инструкции, сам найдет нужные файлы, попробует изменить их, прогонит тесты итп. А в итоге упакует все изменения в Pull Requests, который можно будет по отдельности просмотреть и принять либо отклонить. И тут есть две фишки. Во-первых, планировщик OpenAI работает достаточно хорошо. Примерно треть его Pull Requests можно отправлять прямо в код (половину, если проект простой). __А ведь еще можно допилить проект, чтобы Codex-у было удобнее работать. Докинуть ____AGENTS.MD____ с инструкциями, добавить хорошие тесты, модульную архитектуру и комментарии. Все фишки оформления проектов для работы с AI+Coding, про которые мы говорили на вебинарах в прошлом году - тут как раз применимы.__ И это все работает стабильно потому, что OpenAI выбрали всего несколько инструментов для своего “агента”, очень хорошо протестировали и отладили все. Это было возможно потому, что у Codex нет кучи инструментов - только консоль и работа с файлами. __Хотя, казалось бы, дай кодексу возможность работать с любыми MCP серверами, как это нынче сделала Microsoft, и получится продукт-бомба. Но OpenAI хорошо понимает, что в таком случае ни о каком покрытии тестами нельзя вести речь. А значит и прощай стабильность и привет галлюцинации. __ Во-вторых, в Codex можно запускать одновременно несколько задач. Каждая из них будет запущена в отдельном контейнере. И вот это как раз кардинально меняет весь подход. Можно, скажем, сказать: (1) добавь мне шифрование паролей с bcrypt (2) перепиши доступ к БД с sqlite3 на синхронный better-sqlite3 (3) отладь вот эту ошибку в тестах и сразу в другом проекте, который совершенно не относится к первому: (4) напиши тесты к wifi_manager component (5) сделай, чтобы система переподключалась при проблемах с wifi или websocket и идти пить кофе. А потом вернуться, посмотреть отчеты с Pull Requests и задать новые задачи. Получился очень классный продукт для разработки. Это как несколько очень усидчивых Джунов, которые могут помогать разрабатывать несколько проектов одновременно. Понятно, что есть пара нюансов: (1) OpenAI Codex - не панацея, он дополняет опытных разработчиков, не заменяет (2) Среда очень ограниченная, и там есть нюансы (например, e2e browser testing я так пока там не смог запустить) (3) нужна практика, чтобы освоить инструмент и научиться так формировать проекты, что Codex будет с ними хорошо работать. Ну и самое главное, OpenAI наглядно показали, что агенты могут работать очень хорошо, если собрать правильный продукт, докинуть туда хорошую reasoning модель и обеспечить приемлемое качество. И тут хорошо выстреливает модель - выдал задания и ушел по своим делам/пить кофе. Теперь осталось подождать, пока другие компании воспользуются этим примером! Особенно будет интересно увидеть подобные решения не в кодинге, а в бизнес-задачах. Ваш, @llm_under_hood 🤗 PS: Хотите запустить локально без красивого UI? См OpenAI Codex CLI

Из этого канала