Лекун и ко предлагают архитектуру для автономного ИИ с тремя системами A, B, М. Why AI systems don't learn and what to do about it: Lessons on autonomous learning from cognitive science __Emmanuel Dupoux, Yann LeCun, Jitendra Malik__ Статья: https://arxiv.org/abs/2603.15381 Ревью: https://arxiviq.substack.com/p/why-ai-systems-dont-learn-and-what # TL;DR ЧТО сделали: Авторы (среди которых Ян ЛеКун) предлагают масштабный концептуальный чертёж архитектуры для автономного обучения, отказываясь от статических пайплайнов. Они формализуют трёхкомпонентную систему, состоящую из Системы A (обучение через наблюдение), Системы B (обучение через действие) и жёстко закодированной Системы M (мета-контроллер). Весь комплекс оптимизируется через двухуровневый эволюционно-онтогенетический (Evo/Devo) фреймворк. ПОЧЕМУ это важно: Современные фундаментальные модели сталкиваются с убывающей отдачей от масштабирования текстовых данных и оказываются невероятно хрупкими при сдвиге домена в физическом мире. Создание агентов, способных к автономному непрерывному обучению, становится критической необходимостью. Этот фреймворк даёт теоретически обоснованную дорожную карту, как вырваться из жёстких рамок ручного MLOps и строить системы, адаптирующиеся без вмешательства человека. Для практиков: Работа смещает фокус с ручного курирования датасетов на дизайн богатых симуляционных сред для curriculum learning. Для реализации таких A-B-M архитектур потребуются сверхбыстрые алгоритмы внутреннего цикла (inner-loop learners) и новые безградиентные стратегии оптимизации для работы в процедурно генерируемых мирах. Делай А, делай Б, делай М здесь: https://t.me/gonzo_ML_podcasts/2909
Лекун и ко предлагают архитектуру для автономного ИИ с тремя системами A, B, М.…
Из этого канала
- #5042Про свою работу о Гиперагентах Таня уже написала, но не пропадать же картинке!…
Про свою работу о Гиперагентах Таня уже написала, но не пропадать же картинке! HyperAgents Jenny Zhang, Bingchen Zhao, Wannan Yang, Jakob Foerster, Jeff Clune,…
- #5045"Всё больше работ про непрерывную адаптацию агентов в проде. Было извлечение…
"Всё больше работ про непрерывную адаптацию агентов в проде. Было извлечение реворда из текущих взаимодействий с OpenClaw-RL. Будет завтра про Memento-Skills.
- #5050Продолжаем тему с постоянной адаптацией агентов. Сегодня обещанная эволюция…
Продолжаем тему с постоянной адаптацией агентов. Сегодня обещанная эволюция скиллов.
- #5036Безопасно ли это? Совершенно нет! Но весело Можно добавлять метрики и бенчмарки…
Безопасно ли это? Совершенно нет! Но весело Можно добавлять метрики и бенчмарки AI Safety прямо в multi-task objective, чтобы агент оптимизировался исходя из…
- #5032🌸ГиперАгенты, или вперед к Open-Ended Exploration🌸 #nlp #nlppapers Что будет,…
🌸ГиперАгенты, или вперед к Open-Ended Exploration🌸 #nlp #nlppapers Что будет, если дать агентам полную свободу модифицировать самих себя? Наконец-то выпускаю…