Закон Мура для эпохи ИИ: новая метрика прогресса Мы перевели свежую лекцию профессора Стэнфорда Эндрю Ына о карьере в области ИИ. В ней меня заинтересовал график, который, возможно, лучше всего объясняет, что происходит с индустрией прямо сейчас. Многие привыкли оценивать модели по «размеру контекстного окна» (сколько текста в нее влезает) или объёму параметров, зашитых в LLM. Но этот график предлагает более важную метрику - длительность задачи, которую ИИ способен выполнить автономно, не теряя нить рассуждений. По сути, это новый закон Мура: Способность ИИ удерживать контекст задачи удваивается каждые 7 месяцев. Как читать этот график: Ось Y - это время, которое обычно требуется компетентному человеку для решения задачи. Ось X: • 2019 (Уровень «Секунды»): Эпоха GPT-2. Задача: «Ответь на вопрос» или «Закончи предложение». Это уровень рефлекса. ИИ не «думал», он просто мгновенно реагировал. • 2022–2023 (Уровень «Минуты»): Эпоха GPT-3.5 и ранних версий GPT-4. Задача: «Найти факт в документе», «Написать емейл», «Кратко пересказать статью». Здесь ИИ уже мог удерживать внимание на короткой дистанции, как стажер, которому дали очень простое поручение. • 2024–2025 (Уровень «Часы»): Недавние модели (o1, Sonnet 3.7). Задача: На графике это обозначено как «обучение классификатора», но на языке бизнеса это означает решение комплексной проблемы. Представьте задачу, которую программист или аналитик делает полдня: Напиши скрипт для сбора данных с сайта, протестируй его, исправь ошибки, которые возникнут при запуске, и сохрани результат в Excel Раньше модель терялась на втором шаге. Теперь она способна пройти весь цикл, который у человека занимает до 4 часов работы. Важное примечание про код: Внизу графика есть деталь: для задач по программированию удвоение происходит еще быстрее - каждые ~70 дней. Это объясняет, почему именно в разработке мы чувствуем влияние ИИ острее всего. Если раньше мы сравнивали ИИ с энциклопедией, то теперь корректнее сравнивать его с сотрудником, чей горизонт планирования стремительно растет.
Закон Мура для эпохи ИИ: новая метрика прогресса Мы перевели свежую лекцию…
Источник
https://t.me/egoshin_kedprof/525Канал Егошин | Кеды профессора · опубликовано 9 февр. 2026 г.
Из этого канала
- #526OpenClaw: кривой прототип будущего Вы точно слышали про AI-агента OpenClaw. Он…
OpenClaw: кривой прототип будущего Вы точно слышали про AI-агента OpenClaw. Он бьет все рекорды по росту популярности в ИИ-мире.
- #527Я интересный тест на интеллект моделей придумал. Взял вопрос диванного…
Я интересный тест на интеллект моделей придумал. Взял вопрос диванного инвестора про инвестиции через семейную ипотеку (увидел в каком-то ТГ канале).
- #528Конец монополии на неявные знания. Как ИИ забирает главную суперсилу «белых…
Конец монополии на неявные знания. Как ИИ забирает главную суперсилу «белых воротничков» В январе на Всемирном экономическом форуме в Давосе Сатья Наделла (CEO…
- #524"«Палантиризация» всего: как построить бизнес-империю на стыке McKinsey и IBM В…
"«Палантиризация» всего: как построить бизнес-империю на стыке McKinsey и IBM В Кремниевой долине новый тренд - стартапы массово отказываются от простой…
- #523GTA на максималках К вопросу ЛеКуна о том, когда ИИ научится понимать реальные…
GTA на максималках К вопросу ЛеКуна о том, когда ИИ научится понимать реальные миры и физику Сегодня Google DeepMind анонсировали новый движок Genie.