"Нашёл ещё интересный паттерн для отладки инструкций агентам: Он раньше времени решил что задача невозможная. Я ему написал: А как должно звучать правило в autonomous work чтобы когда тебе клодкод говорит ""не получилось"" ты не принимал это на веру, а искал новые способы решить задачу? И как мы можем протестировать формулировку правила, чтобы убедиться что правило реально сработает? (смоделировать запуск субагента со всеми корневыми файлами которые получает такой ответ от клодкода и посмотреть что он будет делать при одной, второй, третьей формулировке пока не найдем ту которая реально работает)"" Он реально погонял субагентов и вот что выдал: Симуляция показала главное: V1/V2/V3 все ловят текущий баг, но лучшая база — V3 + конкретика из V2. Результат симуляций Все три subagent’а на кейсе “Claude Code сказал: нашёл 4/20, 20 не reachable” ответили правильно: MARK PARTIAL + RELAUNCH То есть правило в принципе работает: агент не принимает “не получилось” как истину. Но: • V1 слишком чекбоксный: “3 метода” можно формально нарисовать. • V2 хороший, но расплывчатый: “coverage estimate” и “genuinely different methods” не определены. • V3 лучше всего ловит именно наш баг: нельзя превращать недобор по количественной цели в вывод о мире. Лучшая формулировка правила Я бы добавил в AUTONOMOUS-WORK.md примерно так: Quantitative target miss is not impossibility. If the goal was “find/build/prove N” and a worker returns fewer than N, the default supervisor status is PARTIAL, not DONE. A worker’s “not found”, “not possible”, “not reachable”, or “not worth continuing” is only a method-exhaustion claim, never evidence of impossibility by itself. Before accepting such a claim, the supervisor must require: 1. the original target restated exactly; 2. the actual count achieved vs target; 3. the methods tried, with evidence/output for each; 4. the estimated search/solution space covered; 5. the major untried method classes; 6. a proposed next method that changes source class, query strategy, seed set, data provider, language/community, tool, or evidence standard. Unless at least three genuinely different method classes have failed, or a hard blocker prevents all safe methods, the next action is mark PARTIAL + launch a different-method slice. A strategic pivot may be added as a useful branch, but it must not replace the original target silently. The original target remains PARTIAL until satisfied, explicitly revised by Seva, or blocked with evidence. — Попробуйте у себя в следующий раз при отладке инструкций."
"Нашёл ещё интересный паттерн для отладки инструкций агентам: Он раньше времени…
Источник
https://t.me/vsevolodustinovchannel/3019Канал Всеволод Устинов (канал: ai, стартапы, пост-ирония) · опубликовано 1 июн. 2026 г.
Из этого канала
- #3020Dave Waiser - фаундер Gett (exit), фаундер accumulator - запускает свой новый…
Dave Waiser - фаундер Gett (exit), фаундер accumulator - запускает свой новый продукт про автоматизацию мэтчинга фаундеров и инвесторов.
- #3021Банда, today is THE day. Fundraisly на Product Hunt - и мне нужна ваша…
Банда, today is THE day. Fundraisly на Product Hunt - и мне нужна ваша поддержка: https://www.producthunt.com/products/fundraisly Фандрейз ненавидят почти все…
- #3023Иду на Health Sprint от AI Mindset Это двухнедельная программа про то, как…
Иду на Health Sprint от AI Mindset Это двухнедельная программа про то, как собрать себе персональный health-протокол с помощью AI. План: 1.
- #3018Только в СФ: водитель убера клодит в коде пока Тесла сама едет.
Только в СФ: водитель убера клодит в коде пока Тесла сама едет.
- #3015R-Founders Camp в Ереване 11-14 июня Я в R-Founders когда-то был самым первым…
R-Founders Camp в Ереване 11-14 июня Я в R-Founders когда-то был самым первым участником.