OpenAI выпустили новую GPT-5 😑 ...заточенную на программистов, GPT-5 Codex. Эта модель заменит o3 в Codex в веб-клиенте (наконец-то) и уже доступна в локальном Codex CLI / плагине для вашей IDE. Если вы ещё не пробовали — обязательно попробуйте! Это бесплатно, если вы подписаны на любой тир ChatGPT. В комментариях многие отмечали, что им нравится больше, чем Claude Code, и модель работает лучше. GPT-5 Codex дотренировали на новых сложных реальных задач, создании проектов с нуля, добавлении функций и тестов, отладке, проведении масштабных рефакторингов и ревью кода. По стандартному бенчмарку SWE-bench Verified разница не особо заметна, 74.5% против старых 72.8%. Однако на внутреннем бенчмарке OpenAI на задачах рефакторинга модель стала гораздо лучше: прыжок с 33.9% до 51.3%! Но и это не всё: модель стала писать меньше бесполезных или ошибочных комментариев, лучше ловить баги в коде, и... думать меньше, когда это не надо. OpenAI взяли запросы от сотрудников внутри компании и сравнили количество токенов в ответах двух моделей. Там, где ответы были короткими, они стали ещё короче, а там, где цепочки рассуждений и сгенерированный код были длиннее — стало больше. Со слов OpenAI, во время они наблюдали, как GPT‑5-Codex работал автономно более 7 часов подряд над большими и сложными задачами, выполняя итерации по внедрению, исправляя ошибки тестирования и в конечном итоге обеспечивая успешное решение задачи. Codex CLI и Codex Web получили кучу обновлений за последний месяц, но про них писать не буду. В API модель появится скоро, очень ждём, пока замеряют качество и на других бенчмарках. В системной карточке модели указали лишь один — по решению многоступенчатых задачек по кибер-взлому (с соревнований CTF). Модель наконец-то статистически значимо обгоняет o3! Жаль, не замерили другие бенчмарки (вроде PaperBench).
OpenAI выпустили новую GPT-5 😑 ...заточенную на программистов, GPT-5 Codex. Эта…
Из этого канала
- #248"Codex + GPT-5 (1/2) Вскоре после выхода GPT-5 я писал в обзоре на эту модель:…
"Codex + GPT-5 (1/2) Вскоре после выхода GPT-5 я писал в обзоре на эту модель: Чего остро не хватает? Развитого тулинга. ...
- #249"Codex + GPT-5 (2/2) А в чем подвох? 🔴 Всё ещё незрелый тулинг Команда Codex…
"Codex + GPT-5 (2/2) А в чем подвох? 🔴 Всё ещё незрелый тулинг Команда Codex очень шустро двигается - фактически, агент был переделан с нуля после выхода…
- #251"Онлайн: Разбираемся с Gemini CLI, Claude Code и Codex CLI на продвинутом…
"Онлайн: Разбираемся с Gemini CLI, Claude Code и Codex CLI на продвинутом уровне вместе с экспертами Сегодня, в среду, в 17:00 по МСК, 16:00 по CEST и в 19:00…
- #243И правда, доколе?! Скорее бы уже кто-то один победил или хотя бы выработался…
И правда, доколе?! Скорее бы уже кто-то один победил или хотя бы выработался единый стандарт. Хотя скорее всего будет как в известном комиксе xkcd :) #fun #ai
- #242"Qoder = Cursor + Kiro + Augment (2/2) Стандартные фичи ● чат в сайдбаре с 2…
"Qoder = Cursor + Kiro + Augment (2/2) Стандартные фичи ● чат в сайдбаре с 2 режимами - Agent и Ask ● дополнение кода по tab ● inline-чат, MCP, диффы, правила…