100 триллионов токенов не врут: вся правда о состоянии AI Вышло фундаментальное исследование того, что люди пишут в нейросети. Ребята из OpenRouter (главный мировой хаб интеграций с нейросетями) и a16z (главный инвест-фонд в ИИ-стартапы) проанализировали 100 триллионов токенов реальных запросов к моделям. Для понимания объема: весь API OpenAI за октябрь обработал 8,6 трлн токенов. То есть выборка более чем здоровая. Главное из исследования: – Эра «думающих» моделей: после выхода OpenAI o1 в декабре 2024 рынок прошел точку невозврата. Индустрия мигрировала от простой генерации текста к моделям, способным рассуждать. На такие модели сейчас приходится более 50% всего мирового трафика. – Кризис маленьких моделей: сегмент компактных моделей (<15B параметров) умирает. Рынок консолидировался вокруг «среднего класса» (15-70B), где лидируют решения вроде Qwen2.5 Coder 32B. Именно они обеспечивают оптимальный продукт маркет фит. – Взрывной рост памяти и контекста: в задачах разработки средний размер промпта превысил 20 000 токенов (это примерно 30–40 страниц печатного текста А4). Разработчики больше не отправляют фрагменты кода — в контекст загружаются целиком репозитории и техническая документация. – Нишевое доминирование Open Source: открытые модели уверенно держат первенство благодаря эффективности. a16z особенно выделяют DeepSeek R1 и Kimi K2 - эти модели становятся главными альтернативами проприетарным гигантам в задачах кодинга и аналитики. – Агенты вместо чат-ботов: «Агентский инференс» - самый быстрорастущий сценарий использования. Модели перестают быть собеседниками и становятся функциональными узлами, которые сами планируют шаги и используют внешние инструменты (tool use). – Китай наступает: более 50% трафика генерируется за пределами США. Китайские модели демонстрируют агрессивный рост, зачастую превосходя западные аналоги в задачах перевода и кодинга. – Эффект «Хрустальной туфельки»: выявлен устойчивый поведенческий паттерн. Если пользователь находит модель, идеально решающую его специфическую задачу, он показывает высокий retention и игнорирует выход новых, более распиаренных моделей. Итого: рынок повзрослел. Период экспериментов закончился. Наступила эра глубокой интеграции: сейчас востребованы надежность, способность переваривать огромные объемы данных и сложное многоступенчатое планирование. Источники: тут и тут. Егошин | Кеды профессора
100 триллионов токенов не врут: вся правда о состоянии AI Вышло фундаментальное…
Источник
https://t.me/egoshin_kedprof/483Канал Егошин | Кеды профессора · опубликовано 8 дек. 2025 г.
Из этого канала
- #484"Отец Рунета: как создать свой Яндекс в эпоху ИИ и почему мы обречены любить…
"Отец Рунета: как создать свой Яндекс в эпоху ИИ и почему мы обречены любить киборгов Новый выпуск подкаста 🥳 У меня в гостях Алексей Королюк - визионер,…
- #485Anthropic: ИИ может удвоить рост производительности труда в экономике Команда…
Anthropic: ИИ может удвоить рост производительности труда в экономике Команда Anthropic выпустила интересное исследование, в котором попыталась оценить…
- #486"Нейрофонд 2.0. Историческое обновление. Мы всей командой долго искали ответ на…
"Нейрофонд 2.0. Историческое обновление. Мы всей командой долго искали ответ на вопрос: каким должен быть идеальный сервис с нейросетями в России? Мы поняли,…
- #482"Sequoia: Каким будет ИИ в 2026 году? «Повесть о двух ИИ» Вышел свежий прогноз…
"Sequoia: Каким будет ИИ в 2026 году? «Повесть о двух ИИ» Вышел свежий прогноз от Sequoia Capital - главного венчурного фонда Кремниевой долины (инвесторы…
- #481Эволюция рынка ИИ: от хайпа к реальным продуктам Помните, полгода назад я…
Эволюция рынка ИИ: от хайпа к реальным продуктам Помните, полгода назад я разбирал первую карту российского ИИ? Тогда главной ценностью было то, что…