"ГОНКА ЗА ВСЕМОГУЩЕСТВОМ С НЕЗАВЯЗАННЫМИ ШНУРКАМИ Странное происходит: всего за 2 года модели вроде GPT научились писать код, сдавать экзамены, находить уязвимости в безопасности, сочинять пристойные сказки и даже управлять компьютером. Это как если бы школьника, который вчера решал задачки по учебнику, внезапно отправили на хакатон - а он взял и победил. Кажется, ещё чуть-чуть - и ИИ заменит половину людей в офисе. Но вот только люди продолжают в лучшем случае делать презентации, а не запускать новые компании, опираясь на агентов. Почему? ☝️ Дело в том, что мы научили модель отвечать на вопросы — но не научили её задаваться целями. Потому что, откровенно говоря, сами не очень хорошо это умеем. 🫴 ИНСАЙТ 1: КАК В ШКОЛЕ Первый этап ИИ-революции - это натаскивание. Мы даем моделям задачи как тесты в ЕГЭ: вот задачка, а вот правильный ответ, молодец, проходишь дальше. ИИ учился как старшеклассник, при этом постоянно переключаясь между ролями, когда один навык = одна задача. Кодировать - одно. Писать стихи - другое. Давать советы - третье. А потом оказалось, что если дать модели простую структуру рассуждения и немного поощрения - она справляется со всем сразу. Типа как если ты научился жонглировать яблоками, и вдруг тебя просят ""а теперь запусти стартап"" - и ты такой: ""а почему нет?"". Прямо на наших глазах разворачивается новая форма мышления. Но она всё ещё не делает главное - не отвечает на вопрос “ну и зачем всё это?”. 🫴 ИНСАЙТ 2: ЛАБОРАТОРИЯ Теперь фокус смещается на ""что вообще нужно считать решением?"". ИИ больше не ученик - он в одном шаге от того, чтобы становиться исполнителем, проектировщиком, исследователем. Например, SWE-Lancer от OpenAI - первая, очень робкая ласточка новой эпохи. Модель не просто сдает тест, а зарабатывает виртуальные деньги, действуя из роли инженера-фрилансера. Здесь метрика успеха - не точность, а полезность, в фокусе - не одна задача, а навигация в пространстве задач. Такой формат показывает: может ли модель работать, а не просто ""отвечать"". 🫴 ИНСАЙТ 3: А ЧТО С НАМИ? Мы ведь сами толком не умеем определять внятные цели. Как можно научить этому железку, у которой нет личной мотивации? Не так давно исследователь OpenAI по имени Shunyu Yao опубликовал эссе ""Вторая половина"" https://ysymyth.github.io/The-Second-Half/ В нем он пишет, что ИИ нужно учить “как людей”. Но мое мнение, что мы и людей-то не научились нормально учить! Где те самые «тепличные» проекты, где студент может: - ошибаться без страха - получать обратную связь в реальном времени - делать что-то полезное для мира Даже в лучших университетах большинство учится по принципу: «вот задачи, реши и сдай». Парадокс в том, что проблема у нас одна - и у людей, и у ИИ: мы всё ещё строим систему, в которой важен правильный ответ, а не правильный процесс (и очень редко ценится баланс). Вот что мы можем делать иначе с теми, кого учим (неважно, из какого материала они сделаны): 💪 ИНСАЙТ 4.1: ПОГРУЖЕНИЕ В КОНТЕКСТ ЧЕРЕЗ ИТЕРАЦИИ Представьте модель, которая пишет бизнес-план: она делает это не за один проход, а сначала собирает данные, потом пишет драфт, показывает, получает обратную связь, меняет стратегию, снова прогоняет. Это уже не просто задача, это работа, с которой, будем честны, не каждый человек справляется. 💪 ИНСАЙТ 4.2: ОЦЕНИВАТЬ ПО ЭФФЕКТУ Не ""насколько красиво оформлена презентация"", а ""стала ли она понятнее тем, кому она адресована"". 💪 ИНСАЙТ 4.3. ОБУЧАТЬ НЕ НА СРЕЗАХ, А НА СВЯЗКАХ Реальная компетенция - это не ""решение задачи #14"" из списка. Это умение пройти 13 задач подряд, не запутавшись, не сбившись и не бросив 14-ю. 💪 ИНСАЙТ 4.4: ЗАДАВАТЬ НЕ ЗАДАЧКИ, А РОЛИ Вы скажете: но ведь мы так и работаем с ИИ, задавая ему роли: ""действуй как эксперт в такой-то области"". Чего не хватает? 👇Продолжение"
"ГОНКА ЗА ВСЕМОГУЩЕСТВОМ С НЕЗАВЯЗАННЫМИ ШНУРКАМИ Странное происходит: всего за…
Из этого канала
- #504"РОЛЬ ≠ Действие Дело в том, что одной роли недостаточно, потому что сама по…
"РОЛЬ ≠ Действие Дело в том, что одной роли недостаточно, потому что сама по себе она не даёт ни среды, ни цели, ни последствий.
- #506"Это не просто код. Это люди. Я думаю, многим здесь знакомо это чувство, когда…
"Это не просто код. Это люди. Я думаю, многим здесь знакомо это чувство, когда вы месяцами живёте одной большой идеей, когда споры у флипчарта с маркерами…
- #510"Сказ о том, как я тестировал один промпт, десять нейросетей и сложную задачу:…
"Сказ о том, как я тестировал один промпт, десять нейросетей и сложную задачу: краш-тест AI на генерации BPMN 2.0 Как инженер, я постоянно использую LLM-модели…
- #502"Тут я добавлю, что у всех волн есть очевидно общие черты: - Низкий входной…
"Тут я добавлю, что у всех волн есть очевидно общие черты: - Низкий входной порог, когда один фреймворк покрывает 80 % задач.
- #501"Справедливости ради надо отметить, что ""эра фулстаков"" всплывает уже не…
"Справедливости ради надо отметить, что ""эра фулстаков"" всплывает уже не первый раз.