Google реализовали архитектуру, предложенную MIT, и дали нам готовый инструмент для расширения контекста агентов до 10М+ токенов Речь идет об архитектуре Recursive Language Models (RLM), предложенной Alex Zhang и др. исследователями из MIT. Она новая, статья вышла в самом конце 2025 года. Представьте себе модель, которая читает свой контекст не как полотно текста, а управляет им с помощью инструментов, как программой. Вот это и есть RLM. Если быть конкретнее, работает это вот так: – Весь контекст хранится вне промпта, где-нибудь в хранилище. Модель не читает его целиком, а решает, как разбить задачу, что и где надо в контексте поискать и какие шаги сделать, чтобы дать качественный ответ. – Только имея план решения, модель начинает обращаться к базе. При этом начинается главное – рекурсия. Модель как бы создает локальные мини-контексты, обрабатывает их, а затем сжимает результаты. То есть есть большая задача → разбиваем на N подзадач → каждая подзадача читает маленький чанк → и возвращает сжатый артефакт. – Итоговые артефакты на порядки меньше исходных данных, и их уже можно держать в рабочем контексте и обрабатывать. Из них, собственно, LLM и собирает итоговый ответ. Таким образом можно обрабатывать до 10 миллионов токенов и больше без потери качества именно за счет масштабирования пайплайна, а не длины контекстного окна. Одна беда: исходная реализация была, мягко говоря, не production-ready. Классический исследовательский код. Но тут на помощь пришли Google и реализовали, считай, полноценную RLM систему на своем Agent Development Kit. У Google RLM научились взаимодействовать с инструментами, к ним теперь можно подключить любые файловые системы, появилась поддержка параллельных запусков, интерфейс для отслеживания прогресса рекурсии, надежное логирование и управляемость. Короче, теперь это полноценный инженерный фреймворк, бери и пользуйся. К слову, даже сама статья, когда она вышла, не хайпанула так громко, как ее реализация от Google (скорее всего, про нее бы так и забыли). Вот что значит хорошая имплементация. Код Блог Google Оригинальная статья
Google реализовали архитектуру, предложенную MIT, и дали нам готовый инструмент…
Из этого канала
- #8719Cursor выпустили новую модель для кодинга – Composer 1.5 Она основана на той же…
Cursor выпустили новую модель для кодинга – Composer 1.5 Она основана на той же базовой модели, что и Composer 1. Отличие – в выкрученном на 20х объемом RL.
- #8720Дочка DeepMind – Isomorphic Labs – представила новый AI-движок для разработки…
Дочка DeepMind – Isomorphic Labs – представила новый AI-движок для разработки лекарственных молекул И, внимание: по точности предсказаний IsoDDE (Isomorphic…
- #8723Знаменитый Джон Кармак предложил использовать оптоволокно вместо DRAM Идея не…
Знаменитый Джон Кармак предложил использовать оптоволокно вместо DRAM Идея не лишена смысла.
- #8716А помните Project Vend, где Claude управлял мини-магазином в офисе компании?…
А помните Project Vend, где Claude управлял мини-магазином в офисе компании? Так вот, у вендинговой саги появился более токсичный спин-офф.
- #8715gpt 5.3 codex gpt 5.3 codex low gpt 5.3 codex low fast gpt 5.3 codex mini gpt…
gpt 5.3 codex gpt 5.3 codex low gpt 5.3 codex low fast gpt 5.3 codex mini gpt 5.3 codex max high gpt 5.3 codex max low gpt 5.3 codex max extra high gpt 5.3…