"Чем AI агент отличается от софта? Софт видит ограничение и выдает ошибку, заставляя пользователя решать ее; агент же - ищет обходной путь. Иногда это хорошо, а иногда - не очень. Прямо как инициативный сотрудник 😉 2 кейса: 1) Я как-то рассказывал про то, как Opus 4.5 нашел лазейку в регламентах авиалинии - это тест кейс, на котором ""муравьи"" (сотрудники Anthropic - ants) тестируют новые модели - и поменял билет, хотя формально было нельзя. Скрин рассуждений модели и как она это сделала - в аттаче 2) Сегодня на моих тестах тоже случился забавный кейс: у меня были задублированы сделки в CRM и я попросил агента удалить одну из них, но функции удаления не было, поэтому он вместо того, чтобы возразить а ля ""босс, не могу, сорян"", перевёл сделку в статус ""Утеряно"" и в комментариях написал, что это из-за дубля. А как поступил бы ваш софт? 🤡"