"Нашёл ещё интересный паттерн для отладки инструкций агентам: Он раньше времени… — @vsevolodustinovchannel

"Нашёл ещё интересный паттерн для отладки инструкций агентам: Он раньше времени решил что задача невозможная. Я ему написал: А как должно звучать правило в autonomous work чтобы когда тебе клодкод говорит ""не получилось"" ты не принимал это на веру, а искал новые способы решить задачу? И как мы можем протестировать формулировку правила, чтобы убедиться что правило реально сработает? (смоделировать запуск субагента со всеми корневыми файлами которые получает такой ответ от клодкода и посмотреть что он будет делать при одной, второй, третьей формулировке пока не найдем ту которая реально работает)"" Он реально погонял субагентов и вот что выдал: Симуляция показала главное: V1/V2/V3 все ловят текущий баг, но лучшая база — V3 + конкретика из V2. Результат симуляций Все три subagent’а на кейсе “Claude Code сказал: нашёл 4/20, 20 не reachable” ответили правильно: MARK PARTIAL + RELAUNCH То есть правило в принципе работает: агент не принимает “не получилось” как истину. Но: • V1 слишком чекбоксный: “3 метода” можно формально нарисовать. • V2 хороший, но расплывчатый: “coverage estimate” и “genuinely different methods” не определены. • V3 лучше всего ловит именно наш баг: нельзя превращать недобор по количественной цели в вывод о мире. Лучшая формулировка правила Я бы добавил в AUTONOMOUS-WORK.md примерно так: Quantitative target miss is not impossibility. If the goal was “find/build/prove N” and a worker returns fewer than N, the default supervisor status is PARTIAL, not DONE. A worker’s “not found”, “not possible”, “not reachable”, or “not worth continuing” is only a method-exhaustion claim, never evidence of impossibility by itself. Before accepting such a claim, the supervisor must require: 1. the original target restated exactly; 2. the actual count achieved vs target; 3. the methods tried, with evidence/output for each; 4. the estimated search/solution space covered; 5. the major untried method classes; 6. a proposed next method that changes source class, query strategy, seed set, data provider, language/community, tool, or evidence standard. Unless at least three genuinely different method classes have failed, or a hard blocker prevents all safe methods, the next action is mark PARTIAL + launch a different-method slice. A strategic pivot may be added as a useful branch, but it must not replace the original target silently. The original target remains PARTIAL until satisfied, explicitly revised by Seva, or blocked with evidence. — Попробуйте у себя в следующий раз при отладке инструкций."

Из этого канала