Пока на стриме хвастаются тем, как за один промпт можно делать приложения и сайты, я читаю системную карточку. В ней очень много внимания уделяется «сдерживанию» модели, чтобы она не обманывала, не вела себя неправильно, не галлюцинировала то, что не использовала итд. Возможно — и это заметно с моделями Anthropic — с большими умными моделями делать это всё сложнее и сложнее, и сил положено много. Модель будет куда реже удалять ваши тесты, если у неё что-то не получается сделать :)