"OpenAI Codex Что в итоге представили на стриме Codex Предварительная… — @etechlead

"OpenAI Codex Что в итоге представили на стриме Codex Предварительная исследовательская версия облачного агента для разработки. Он интегрирован в UI ChatGPT, оттуда его можно вызывать и давать ему задачи. Каждая задача выполняется в собственной ""песочнице""-контейнере с предварительно загруженным в него GitHub-репозиторием. Занимает от 1 до 30 минут, в зависимости от сложности, и можно отслеживать прогресс в режиме реального времени. А вот вмешиваться в процесс выполнения пока что нельзя. По завершению Codex коммитит свои изменения, а в процессе ведет лог того, что делал, и можно потом посмотреть, чем он занимался. Дальше можно попросить поменять что-то еще, сделать PR в GitHub или перетащить код к себе. Во время выполнения задачи доступ контейнера в Интернет отключен, и агент работает исключительно с кодом, предоставленным через GitHub и предварительно установленными зависимостями, настроенными через установочный скрипт. __По описанию реально очень похоже на Cursor Background Agent или на то, как работает Devin. Вопрос только в полноте фич, стабильности и удобстве, это уже надо пробовать. __ codex-1 Это новая модель, версия o3, оптимизированная для разработки, и с упором не только на работу с кодом, но и с агентскими сценариями: запуск тестов, линтера, работа с git, оформление PR и т.д. По сравнению с o3, codex-1 производит более чистые патчи, уже готовые к проверке человеком и их интеграции в рабочие процессы. И выпустили ещё модель попроще, codex-mini, на основе o4-mini. Доступность Codex как фича и codex-1 как модель пока что доступны для ChatGPT Pro/Enterprise/Team, позже обещают добавить для Plus. codex-mini-latest доступна в API, так что в теории её и в Cursor добавят. __В своё время, кстати, Codex было названием первой модели, на которой работал GitHub Copilot в далёком 2023м, и базировался он на GPT-3. OpenAI от сомнительного нейминга перешли к переиспользованию названий ~~переменных~~ продуктов :) __ Сценарии использования Codex От самих OpenAI и тех компаний, кому дали заранее попробовать: ● четко выделенные задачи: рефакторинг, написание тестов, правка ошибок, интеграция компонентов, составление документации; ● разбор инцидентов во время дежурств (__немного неожиданно, конечно, но интересно__); ● планирование задач в начале дня; ● передача фоновой работы, чтобы не отвлекаться от основных задач и избегать переключения контекста; ● внесение мелких правок в проекты нетехническими специалистами (с проверкой инженерами); ● исследование существующих кодовых баз. Своё мнение В текущем релизе, насколько я могу судить по анонсу, нет ничего прорывного. В том или ином виде это уже существует в других продуктах, с большей интеграцией в рабочие процессы, и с возможностью расширения под свои задачи (MCP). Посмотрим, как оно будет на практике, но, кажется, это пока что для довольно мелких/муторных задач, которые можно и в условном Cursor решить. Качество базовой модели тоже сильно будет влиять, но по codex-1 нам дали буквально 2 бенча (один из которых внутренний), на которых он показал небольшой рост в сравнении с o3. Что бы хотелось видеть от подобного рода систем: ● бесшовную интеграцию с IDE, чтобы прям из нее можно было поставить асинхронную задачу (возможно, прям из существующего чата) и продолжить работать. В теории таким обещает стать Cursor Background Agent; ● кооперативную работу агентов, которые вместе решают какую-то большую задачу по кускам, в параллель или последовательно; ● интерактивность в решении задач, чтобы агент останавливался и задавал уместные вопросы по тому, как двигаться дальше; ● сбор контекста по задаче не только из кода, но и из Jira/Slack/Google Docs/etc; ● улучшение базовых моделей - длины контекста, качества работы с ним, ризонинга, актуальности датасета. И именно в такой последовательности. Но даже в виде исследовательской версии Codex попробовать, конечно, будет интересно. Осталось договориться с жабой или дождаться, когда он станет доступен в Plus-подписке :) #news"

Из этого канала