"codex (cli и cloud). Я обещал, а раз обещал – наконец начал пробовать ""новый"" codex. При том в обоих форматах – cli и облачный асинхронный. tldl; __Ну... ничего особенного не замечено. __ Не плохого, ни восхищенно хорошего сказать не могу. Облачный codex был и до этого хорош, стал ли он лучше? Ну мое имхо такое – кардинально __еще лучше__ он станет когда появится возможность: - А) Собирать свои контейнеры в которых будет запускаться агенты - B) Появится возможность добавить принудительный тул-хук который будет вызываться всегда перед тем как завершать задачу Сейчас есть возможность указать скрипт/команды которые будут выполняться на старте, и на прогреве закешированного контейнера. Конечно, можно приказать в AGENTS.md – ""всегда всегда выполняй make check && make format && make type_check && make test!!!"", но много лучше было бы тут добавить некоторого детерминизма :) * Ладно, позитивное – я не воткнулся в лимиты пока вот вообще (обычный ChatGPT Plus), хотя и мучал codex большую часть дня. Поэтому будем считать это промежуточным фидбеком ✋ Мое мнение тут конечно крайне субъективное, я не гоняю никаких своих или чужих бенчмарков вроде one-shot ""Сделай мне 3D игру на Godot"", как некоторые ребята на ютубе. Скорее наоборот, чисто эмпирическое имхо в рабочих задачах, среди которых подавляющее большинство это или разработка бэкенда (с LLM и без), DevOps (yaml senior development), и ворочания проектными данными туда сюда для системного проектирования и концептуального рефакторинга. и это мое имхо пока такое, что особой разницы я с sonnet 4.5 или GLM 4.6 не вижу вообще. (__ну с sonnet уж точно__) А то что GPT-5-codex очень уж имеет сильный биас к тому чтобы вместо unix тулов все делать на Питоне я отношусь пока __со смутными сомнениями.__** p.s. А вы помните как прикольно работалось с sonnet 3.5? Не помните? Может потому что мега-кардинально ничего не поменялось, и сейчас ассистенты круче просто потому что тулинг вырос вокруг и тд? :) @neuralstack"
"codex (cli и cloud). Я обещал, а раз обещал – наконец начал пробовать…
336 viewsОткрыть в Telegram →
Из этого канала
- #413"ai workslop чать 1. Начинаем безжалостный концептуальный рефакторинг…
"ai workslop чать 1. Начинаем безжалостный концептуальный рефакторинг ""Внедрения AI"".
- #415"что там происходит у Гугла 🙂 Во-первых, похоже (хочется верить) что совсем…
"что там происходит у Гугла 🙂 Во-первых, похоже (хочется верить) что совсем вот-вот должна выйти Gemini 3.0.
- #416"техническое поражение в AI кодинг битве засчитываю облачному codex 😠 Решил я,…
"техническое поражение в AI кодинг битве засчитываю облачному codex 😠 Решил я, значит, устроить дуель между Jules и Codex Cloud. Остороно – Юмористическое.
- #409"evaluation тесты. Eval тесты можно ненавидеть, eval тесты можно любить. Eval…
"evaluation тесты. Eval тесты можно ненавидеть, eval тесты можно любить. Eval тесты можно не понимать.
- #407"crush агента. Вчера у меня резко перестал работать opencode, и я наконец нашел…
"crush агента. Вчера у меня резко перестал работать opencode, и я наконец нашел причину попробовать crush Проблема, кстати, была смешная – один из mcp серверов…