Осенью Andrej Karpathy, ко-фаундер OpenAI, Director of AI в Tesla и человек, на Стенфордских курсах которого выросли многие специалисты, ходил на подкаст, где рассказал про свой опыт работы с кодинг агнетами. Он говорил, что вот в его задачах шаг влево шаг вправо — и работает плохо, делает не то, что хочет автор, а то, как это делают обычно. Скептики (к которым на тот момент наверное можно было отнести и самого Karpathy?) сразу же пользовались этим как примером того, что ни в какой реальной работе никакие агенты не помогают, что это всё слоп, и ни для чего серьёзного не годится. Прошло 3 месяца, вышли GPT-5.2 и Opus 4.5, и... дед Andrej развернулся на 180 градусов 😏 описав свой опыт в длинном твиттер посте. Весь пост переводить не буду, тезисно: — Возможности LLM-агентов (особенно Claude и Codex) примерно в декабре 2025 года перешагнули некий порог возможностей, вызвав фазовый сдвиг в разработке ПО и смежных сферах. — Учитывая этот скачок, я, как и многие другие, стремительно перешел от режима «80% ручного кода и 20% агентов» в ноябре к «80% кода от агентов и 20% правок и доработок» в декабре. То есть теперь я действительно программирую преимущественно на английском языке. — Это, безусловно, самое масштабное изменение в моем базовом рабочем процессе за ~20 лет программирования, и произошло оно всего за несколько недель. Полагаю, что нечто подобное происходит уже у значительной части инженеров (двузначный процент), в то время как осведомленность широкой публики об этом явлении находится где-то на уровне малых единиц процентов. — Самая распространенная категория ошибок агентов заключается в том, что модели делают за вас неверные допущения и просто продолжают работать на их основе, ничего не перепроверяя и не уточняя у вас. — Несмотря на все проблемы, в сухом остатке это колоссальный шаг вперед, и очень трудно представить себе возвращение к ручному написанию кода. — Очень интересно наблюдать, как агент упорно работает над задачей. Они никогда не устают, не падают духом, они просто продолжают перебирать варианты там, где человек уже давно бы сдался, отложив проблему на завтра. Наблюдать, как агент долгое время бьется над чем-то и спустя 30 минут выходит победителем — это тот самый момент, когда «чувствуешь присутствие AGI». — Непонятно, как измерить «ускорение» от помощи LLM. Безусловно, я чувствую, что справляюсь с запланированными задачами намного быстрее, но главный эффект заключается в том, что я делаю гораздо больше, чем собирался. Во-первых, я могу реализовать множество вещей, на которые раньше просто не стоило тратить время, а во-вторых, я могу браться за код, к которому раньше не мог подступиться из-за нехватки знаний или навыков. — Написание кода с помощью LLM разделит инженеров на тех, кто больше любил сам процесс кодинга, и тех, кому больше нравилось создавать (строить) продукты. — Я уже заметил, что моя способность писать код вручную начинает потихоньку атрофироваться. — Что станет с понятием «10-кратного инженера» (соотношением продуктивности между средним и топовым специалистом)? Вполне возможно, что этот разрыв СИЛЬНО увеличится. — Как будет ощущаться программирование с LLM в будущем? Как игра в StarCraft? Как игра в Factorio? Или как исполнение музыки?
Осенью Andrej Karpathy, ко-фаундер OpenAI, Director of AI в Tesla и человек, на…
Из этого канала
- #3327«Да лан, чё мелочиться?» — подумали в Epoch.AI и вместо FrontierMath Tier 5…
«Да лан, чё мелочиться?» — подумали в Epoch.AI и вместо FrontierMath Tier 5 выпустили FrontierMath OpenProblems.
- #3328Так получается старик-то был почти прав? Немного месяца мб попутал, но прав?
Так получается старик-то был почти прав? Немного месяца мб попутал, но прав?
- #3329"Подумал, что в миграции я relate (прямой перевод ""относить/связывать себя с""…
"Подумал, что в миграции я relate (прямой перевод ""относить/связывать себя с"" не кажется аналогичным по смыслу) к комикам, мигрировавшим из РФ в США и…
- #3325Dario Amodei, CEO Anthropic, выпустил новое длинное эссе: The Adolescence of…
Dario Amodei, CEO Anthropic, выпустил новое длинное эссе: The Adolescence of Technology https://www.darioamodei.com/essay/the-adolescence-of-technology…
- #3320В ближайший месяц нас ждёт много обновлений Codex — серьёзного конкурента…
В ближайший месяц нас ждёт много обновлений Codex — серьёзного конкурента Claude Code. Пока никакой конкретики нет, так что будем гадать сами.