"В комментариях, в твиттере, на реддите и вообще везде люди постоянно пишут: — модель стала глупее! — я вот раньше мог за полчаса полугодовой проект сделать а сейчас модель не может функцию написать! — да понятно они просто срезают косты и делают модели тупее... Это продолжается больше 2 лет. Самое смешное, что я ни разу не видел, как люди показывали поведение «тогда» и «сейчас» на том же самом промпте. Вот ни разу не было ""смотрите тот же самый промпт 3 недели назад и сейчас!"" (но даже если бы показали — один промпт особо ничего не покажет). Сам таким грешу, и редко перепрогоняю одни и те же запросы 3-4 раза на разных моделях в разные моменты времени. По моей версии, никакого оглупления не происходит (по крайней мере у OpenAI — 80%+ моих запросов улетают им), просто люди а) не делают прям одинаковые запросы б) имеют маленькие выборки в) плохо понимают границу работоспособности (написать один и тот же код на двух разных фреймворках одного языка — крайне разные задачи). Так вот — недавно Anthropic (весьма скрытно и без огласки) написали, что Opus на несколько дней и вправду отупел! «С 17:30 UTC 25 августа до 02:00 UTC 28 августа в Claude Opus 4.1 наблюдалось снижение качества ответа на некоторые запросы. Пользователи могли столкнуться с более низким перформансом, некорректными ответами или проблемами с вызовом инструментов в Claude Code». Причина: «Это было вызвано выкткой нового кода для инференса, который мы с тех пор откатили для Claude Opus 4.1. Хотя мы часто вносим изменения, направленные на повышение эффективности и производительности наших моделей, мы стремимся всегда сохранять неизменное качество отклика модели. Мы также обнаружили, что Claude Opus 4.0 подвержен той же проблеме, и сейчас решаем её.» Ждём чистосердечного от OpenAI, где они признают, что вместо GPT-5 людям отвечает ChatGPT из 2022-го года (ведь она им ТАК нравилась)."