Это нельзя не запостить прямо щас. Чуваки проанализировали и разобрали утекший код Клод кода и анализируют как устроен агент такого рода. Интересное чтиво. Харнесс, всюду харнесс. Больше 98% кода это оркестрационная обвязка вокруг интеллекта. Dive into Claude Code: The Design Space of Today’s and Future AI Agent Systems __Jiacheng Liu, Xiaohan Zhao, Xinyi Shang, Zhiqiang Shen__ Статья: https://arxiv.org/abs/2604.14228v1 Репа: https://github.com/VILA-Lab/Dive-into-Claude-Code Ревью: https://arxiviq.substack.com/p/dive-into-claude-code-the-design # TL;DR ЧТО сделали: Авторы провели реверс-инжиниринг исходного кода на TypeScript агента Claude Code (v2.1.88) от Anthropic. Цель — разобрать архитектурный дизайн промышленных AI-агентов для написания кода. Исследователи вытащили наружу базовые механизмы системы и показали сложную инфраструктуру из семи компонентов, которая жёстко отделяет способности LLM к рассуждению от операционной обвязки, отвечающей за безопасность, контекст и память. ПОЧЕМУ это важно: Работа эмпирически доказывает: по мере того как базовые способности фундаментальных моделей выравниваются, главным конкурентным преимуществом надёжных автономных систем становится именно детерминированная инженерная обвязка вокруг модели. Оказалось, что 98.4% кодовой базы промышленного агента — это операционная инфраструктура, а не логика принятия решений ИИ. Это заставляет переосмыслить подход к разработке и уйти от хрупкой оркестрации на базе промптов в сторону надёжных архитектур, напоминающих операционные системы. Для практиков: Для техлидов и ИИ-исследователей этот анализ служит детальным чертежом того, как топовые лаборатории разворачивают автономные инструменты в продакшене. Статья подробно разбирает, как Claude Code справляется с давлением бесконечно растущего контекста через пятиуровневый пайплайн сжатия и обеспечивает безопасность с помощью жёсткого гейта разрешений (deny-first). Важно отметить, что работа подсвечивает и структурные трейды: хотя мощная инфраструктура ускоряет разработку в моменте, ограниченное окно контекста и изолированные субагенты создают риск того, что со временем общая связность кодовой базы и понимание проекта человеком будут деградировать. Погружаться сюда: https://t.me/gonzo_ML_podcasts/3260 Удобнее наверно читать в виде страницы, где картинки вставлены к месту: https://arxiviq.substack.com/p/dive-into-claude-code-the-design
Это нельзя не запостить прямо щас. Чуваки проанализировали и разобрали утекший…
Из этого канала
- #5219"И ещё про развитие ветки Universal Transformer (см.вчерашнее…
"И ещё про развитие ветки Universal Transformer (см.вчерашнее https://t.me/gonzoML/5206).
- #5224Давно мы про табличный ML не писали! Selecting Feature Interactions for…
Давно мы про табличный ML не писали! Selecting Feature Interactions for Generalized Additive Models by Distilling Foundation Models Jingyun Jia, Chandan Singh,…
- #5228Прикольный подход к оценке моделей через тензорные разложения. Для 3D тензора…
Прикольный подход к оценке моделей через тензорные разложения. Для 3D тензора <навык модели> <сложность промпта> <особенности оценщика> мы сначала выучиваем…
- #5206Дело Universal Transformer (а на самом деле Adaptive Computation Time) живёт и…
Дело Universal Transformer (а на самом деле Adaptive Computation Time) живёт и побеждает! A Mechanistic Analysis of Looped Reasoning Language Models Hugh…
- #5205Начало холивара детектед! 😁 https://x.com/fchollet/status/2045524796298101077
Начало холивара детектед! 😁 https://x.com/fchollet/status/2045524796298101077