⚪️ Доработка плана свармом (plan swarming) Несколько слов о том, почему я в последнее время перестраиваю свой флоу в том числе на использование свармов (термин тут поясняется - https://t.me/deksden_notes/269). В общем, пишу я тут планы с агентом. Примерно два-три часа диалога на предмет чего там и как, снимаем gaps, дорабатыаем, все вопросы отвечаем, прописываем. ок - наконец то вкатываем. меморибанк планируемый апдейт: пучкок ADR, Specs с разным (границы сущностей, контракты, протоколы взаимодействия), фичи, интеграционный протокол доработки. Немаленькая штука получается. Агенту все нравися (кодекс 5.4 high). 👉 Тут я и решил экспериментик провести. 1️⃣ Натравил на оригинальный контекст свой промпт на рефлексию/ревью плана (довольно простой, в плане исследования разное по аспектам указано: от С4 структурирования до ui). Для эксперимента это не так важно. Поработав, оно выдает мне 12 (!!!) high/medium risk недоработок по плану! omfg. Читаю - да, там контракты разъехались, тут миграция недопрописана, - в общем, вполне реальные источники багов. И я понимаю что рефакторинг я затеял не по зубам бюджету внимания. Что делать? Отказываться от габарита задачи и резать на блоки? Ну что за пораженчество, - нет конечно, появился перкрасный повод для эксперимента!)) Правильно подумали - ударим свармом по дефициту внимания! Пускай компьют зальет недостаток голов внимания. ▶️ Запускаем тот же самый промпт, только делаем его сварм-ориентированным: указываем что 5 субагентов на основании письменного задания проводят исследование (каждый смотрит по всему плану ревью), формируют итоговые отчеты, а оркестратор интегрирует их в свой отчет. ‼️ Цель эксперимента: показать что мультисамплинг частично компенсирует недостаток внимания. Замечу, мы это запускаем после того как разок уже полирнули и устранили 12 важных недостатков. Итоги эксперимента? Еще 11 issues с которыми согласен оркестратор (а он, между прочим, делал этот план), и из них 5 high приорити. Опять недотянутые контракты, непройденные до конца сценарии. ▶️ Продолжаем. Теперь мы ьерем ТОТ ЖЕ промпт, но просим нарезать план ревью на фокусные аспекты, и по каждому из фокусов запустить отдельного субагента. Обмен - тоже через файлы, конечно. ‼️ Цель эксперимента: показать что фокусировка сильно улучшает качество работы - это все таки значительное сужение габарита задачи Результат: напомню, что в документации уже ВСЕ выявленные ранее изменения, это мы выкапываем то, что не заметили ранее. Нашли еще 7 недостатков, в том числе один high. Негативные сценарии недоработаны, сценарии доказательств недотянуты, двусмысленности, границы и формализация процессов. Применяем выявленные исправления. Уже скромнее, да. ▶️ Да, мы не остановимся: теперь мы будем на каждый фокус запускать5 субагентов. Всё то же самое, но 5 раз по каждому фокусу с интеграцией в единый отчет. Сумеем ли мы вытянуть что то существенное? ‼️ Цель эксперимента: показать что мультисемплинг - мощь, которой можно усилить фокусировку. Результат: получилось 5 фокусов, и 5 семплов, итого 25 запусков субагентов. большей частью уже medium/low, значит что могли почти все нашли. 1-2 high важности, но я не все бы так оценивал. Кстати, оркестратор их и не взял за high по итогу. Но находки вполне полезные - детали стыковок протоколов взаимодействия, контрактов. Применяем. Уф. Скромнее, но все равно нашли чего то важное! Неплохо. Главное - убедились что модель уже ничего доработать существенного не может, значит точно все что можно нашли. (...) продолжение: https://t.me/deksden_notes/666 @deksden_notes
⚪️ Доработка плана свармом (plan swarming) Несколько слов о том, почему я в…
Из этого канала
- #666"⚪️ Доработка плана свармом (plan swarming) ч2 (...) начало тут:…
"⚪️ Доработка плана свармом (plan swarming) ч2 (...) начало тут: https://t.me/deksdennotes/665 Даже не спрашивайте сколько токенов ушло! Времени - час…
- #667⚪️ Gemini CLI ← Subagents Тут не прошло и года как в Gemini CLI завозят…
⚪️ Gemini CLI ← Subagents Тут не прошло и года как в Gemini CLI завозят субгентов! Они оч долго держались - видимо, мнение что с контекстом 1m им это зачем? Но…
- #668⚪️ Gemini App День гугла на нашем канале какой то! Но они выпустили нативный…
⚪️ Gemini App День гугла на нашем канале какой то! Но они выпустили нативный Gemini App для мака. Кстати, неплохой.
- #662⚪️ DESIGN.md Не знаю, отслеживаете ли вы тренды в UI deign tools, но я…
⚪️ DESIGN.md Не знаю, отслеживаете ли вы тренды в UI deign tools, но я посматриваю, благо иногда такое надо.
- #661"⚪️ Как вы разрабатываете свои флоу? Сейчас все кто работает в AI Dev уже…
"⚪️ Как вы разрабатываете свои флоу? Сейчас все кто работает в AI Dev уже волей-неволей наработали свой флоу, свой подход к решению задач.