"Карпатый про автомойку, AI, и совет фаундерам Современный тест на ~~тупость~~ ограниченность моделей: - Я хочу помыть машину. В 50ти метрах есть автомойка. Мне поехать или дойти до нее пешком? - Пешком. Ехать 50 метров на мойку — это как заказывать такси, чтобы пересечь улицу. Плюс машину всё равно помоют, так что состояние ""до мойки"" не имеет значения. — кейс из выступления Карпатого на AI Ascent 2026 Очередной год и очередная AI Ascent от Sequoai (писал про прошлые евенты тут и тут). Прикольно наблюдать, как эволюционируют нарративы: что остается, а что появляется. Давайте сначала разберем на выступлении Карпатого, но еще будут посты по мотивам других выступлений. Ключевые мысли от Андрея: 1) Software 3.0 - новая поверхность для программирования: контекст. То, что прогал Карпатый вчера - помните MenuGen с YC Summer School - теперь может быть сделано одним промптом в Gemini 2) Неоднородность интеллекта моделей - как в примере выше, в некоторых, казалось бы, простых ситуациях модель жутко тупит, а иногда - может написать C компилятор. По мнению Карпатого, дело не только в том, верифицируема ли эта задача и достаточно ли данных для тренировки, но и какие приоритеты у ведущих лаб по автоматизации таких задач. Вот уж точно incentives matter :) 3) Инжиниринг агентов (agentic engineering) > вайбкодинг - да, почти любой традиционный софт сейчас можно завайбкодить. Но ключевая сложность - как при этом поддержать тот же уровень качества, что и у традиционного софта? Именно здесь и альфа для билдеров. 4) Какие скиллы людей останутся важны - планирование и контроль, вкус (что такое хорошо и плохо), и понимание. ""You can outsource your thinking, but you cannot outsource your understanding"" - твит, который Карпатый часто цитирует в последние пару недель; кстати, перекликается с этим постом Совет фаундерам (как я его понял, потому что Андрей ушел от ответа): в принципе, любая область может быть описана как верифицируемая в той или иной степени, вопрос лишь в том насколько сложно собрать данные и построить тренинг для них и - см пункт 2 - приоритетов лабораторий. Поэтому ""слепые зоны"" лабораторий (в части данных и инсентивов) - первые кандидаты. Ну а если сравнить с мыслями Андрея на этом же евенте 2 года назад: 1) Конечно, 2 года назад он - да и мы все - не представляли как быстро будут эволюционировать модели и идеи, что софт это кусок промпта/контекста, скопированного модели, даже близко не было 2) Но вот LLM as OS идея, имхо, до сих пор жива в его голове - особенного, как в нынешнем токе он говорит про модель как компьютер. 3) Про open source и экосистему почти все упоминания исчезли В общем, рекомендую как его ток, так и все в этой серии. P.S. Если хотите больше про агентный инжиниринг - вам сюда"
"Карпатый про автомойку, AI, и совет фаундерам Современный тест на ~~тупость~~…
Из этого канала
- #1738"Почему вам не стоит апгрейдиться до Opus 4.7 Недавно обсуждал с дружбаном…
"Почему вам не стоит апгрейдиться до Opus 4.7 Недавно обсуждал с дружбаном потерянную сделку: пояснил контекст, пошерил переписку, в конце которой я решаю не…
- #1740"NEVER FUCKING GUESS или Что Stanford нашёл в 6 000 вайбкодинг сессиях ""NEVER…
"NEVER FUCKING GUESS или Что Stanford нашёл в 6 000 вайбкодинг сессиях ""NEVER FUCKING GUESS!"" - именно такую инструкцию Jer Crane (фаундер PocketOS, софт для…
- #1741Отрывок из 1й встречи 4го потока AI Product Engineer:…
Отрывок из 1й встречи 4го потока AI Product Engineer: https://youtu.be/j4oZaFRrEYM Это отрывок первой встречи четвёртого потока курса AI Product Engineer.
- #1735Семь раз Haiku, один раз - Opus Сегодня обсуждали графики METR (это бенчмарк,…
Семь раз Haiku, один раз - Opus Сегодня обсуждали графики METR (это бенчмарк, где меряют, какой длительности задачу программиста модель может решать…
- #1734"Что AI забирает у нас на самом деле? Разберем ситуацию: Компания внедряет AI…
"Что AI забирает у нас на самом деле? Разберем ситуацию: Компания внедряет AI чатбота в саппорт → Среднее время обработки тикета падает с 4 часов до 45 минут.