"Тестирование в эпоху AI агентов ч1/3 Попробую изложить имеющиеся соображения по тестированию и подходов к нему в некотором преломлении к агентам. Может быть покапитанствую местами - но куда ж без этого) Сначала о термине ""тестирование"". Это огромная тема, весьма многогранная, посему вначале нужно выровниться (как говаривает кодекс) по терминологии. Я буду про тестирование, которое автоматические тесты, которые мы запускаем через какой то раннер, и которые чего то ожидают (Expectations), чего то делают, чего там в итоге проверяют как оно вышло (Assertions). Методики типа TDD нам выходят ортогонально - из этой же темы, но другое направление, и их мы пропустим. ▶️ Тесты я поделю так: - юнит тесты - полу- и интеграционные тесты, бизнес-процессы - специализированные тесты: ui, компонентные - ну и хватит, этого уже достаточно 1️⃣ Юнит тесты: самые простые тесты для кусочков кода. Они тестируют базовые алгоритмы в коде и делаются изолированно - если в алгоритме используем внешние зависимости, то всегда их мокаем - делаем имитацию внешней зависимости с предопределенным поведением. 2️⃣ Все варианты e2e тестов (e2e = end-to-end, интеграционные тесты): это когда наши зависимости уже не мокаются (тогда интеграционные), или не полностью мокаются (может стаб используем для части тестов, или мок - но часть зависимостей ""боевая""). Когда несколько кусков вашего кода взаимодействуют мы можем проверить как оно работает вместе. Бизнес-процессы- это такие ""сквозные"" интеграционные тесты, которые используют фичи приложения в приближенной к ""боевой"" среде, представляя собой некий сценарий использования системы пользователем, проверяя как система в целом работает. 3️⃣ Специализированные тесты: тут можно тестировать какой то интерфейс, дергая его через инструменты наподобие Playwright / Selenium - причем как алгоритмически так и агентами через соответственный MCP. В эту же группу запишем компонентные тесты, когда у нас дергается специфический сложный компонент и проверяется как он себя ведет в разных режимах. ▶️ Пару слов о раннерах - это софт, который позволяет описать тесты и запускать их, учитывая чего там у нас упало, брать логи и прочее. Примеры: Vitest, Jest, Playwright Test, всякие xUnit, и еще миллион разныш штук для разных языков / стеков / технологий. ..."
"Тестирование в эпоху AI агентов ч1/3 Попробую изложить имеющиеся соображения…
Из этого канала
- #250"Тестирование в эпоху AI агентов ч2/3 ... Теперь к некоторым техникам. Хочу…
"Тестирование в эпоху AI агентов ч2/3 ... Теперь к некоторым техникам. Хочу поделится парой моментов.
- #251"Тестирование в эпоху AI агентов ч3/3 ... ‼️ Агентный раннер. Всегда гоняю…
"Тестирование в эпоху AI агентов ч3/3 ... ‼️ Агентный раннер. Всегда гоняю тесты ""под агентом"". Чем сложнее тесты, тем выгоднее гонять агентами.
- #252Затестим Kimi Slides vs Nano Banana Контент - цикл #deksdenFlow (сами посты по…
Затестим Kimi Slides vs Nano Banana Контент - цикл #deksdenFlow (сами посты по тегу)
- #248"Agents по антропиковски, ч2 ... Продолжим с разбором самой статейки. ▶️…
"Agents по антропиковски, ч2 ... Продолжим с разбором самой статейки. ▶️ Вначале рассказывают почему ваншоты сложных штук не взлетают, спотыкаясь о контекст.
- #247"Agents по антропиковски Анты тут бросили интересную статейку прочитать…
"Agents по антропиковски Анты тут бросили интересную статейку прочитать Effective harnesses for long-running agents 🔗…