"GitHub для агентов или Как Карпатый ответил на мой вопрос 2 месяца назад я задал вопрос на reddit: Как выглядит GitHub в эру AI? Там на меня норм так налетели. Но на этой неделе Карпатый, кажется, дал начало ответа. autoresearch (24.5K звезд за 5 дней): это автономный ресерчер, который перебирает параметры и улучшает результаты, пока ты спишь. Но меня зацепил не сам факт автоматизации, а то, как Андрей построил guardrails вокруг нее, чтобы максимизировать успех: 1) Вся ""оркестрация"" — markdown-файл Три файла: prepare.py (подготовка данных, константы, оценка результатов и тп - агенту нельзя его трогать), train.py (агент может менять что угодно), program.md (инструкции на человеческом языке, меняется человеком). Агент читает инструкции и следует им, больше ничего. из program.md: The idea is that you are a completely autonomous researcher trying things out. If they work, keep. If they don't, discard. And you're advancing the branch so that you can iterate. If you feel like you're getting stuck in some way, you can rewind but you should probably do this very very sparingly (if ever). Ключевой ход: агент может менять ВСЁ в тренировке - архитектуру, оптимизатор, гиперпараметры - НО не может менять, как его оценивают. Помните ""агент падает до уровня своего harness-а"" - тут вот это возведено в идеал имхо. 2) NEVER STOP Инструкция прямо говорит: ""Не останавливайся спрашивать 'продолжать ли?'. Человек спит. Работай, пока тебя не остановят."" NEVER STOP: Once the experiment loop has begun (after the initial setup), do NOT pause to ask the human if you should continue. Do NOT ask ""should I keep going?"" or ""is this a good stopping point?"". The human might be asleep, or gone from a computer and expects you to continue working indefinitely until you are manually stopped. You are autonomous. If you run out of ideas, think harder — read papers referenced in the code, re-read the in-scope files for new angles, try combining previous near-misses, try more radical architectural changes. The loop runs until the human interrupts you, period. Это ограничение не против ошибок, а против ""социальных привычек"" самого агента. Модели обучены спрашивать разрешение, и здесь это явно переопределяется. Вот что Карпатый написал по этому поводу: sadly the agents do not want to loop forever. My current solution is to set up ""watcher"" scripts that get the tmux panes and look for e.g. ""esc to interrupt"", and send keys to whip if not present. Need an e.g.: /fullauto you must continue your research! (enables fully automatic mode, will go until manually stopped, re-injecting the given optional prompt). 3) Git как state машина. Каждый эксперимент = коммит. Если успешен, то ветка двигается вперед, если нет - откат. Но неудачные эксперименты тоже записываются в специальный журнал. === Теперь про GitHub для агентов: Сначала Карпатый сделал отдельный репозиторий agenthub - там прямо на старте было написано (см. аттач): ""GitHub is for humans. Agenthub is for agents."" Де-факто это какая-то помесь github и moltbook, где агенты обмениваются друг с другом результатами и достижениями, давая другим пищу для размышления и экспериментирования. Потом, правда, он удалил его, и теперь это ветка в autoresearch. === На выходных попробую «адаптировать» autoresearch для более приземленных задач - поиск наилучшей стратегии поиска (сорри за каламбур) идеальных клиентов, оптимизационные задачи для рекламы и тп. Обязательно напишу, если получится что интересного P.S. в agenthub, как видно на скрине, всего 2 контрибьтора - угадайте второго? 🤖"