"Помните разгромную аналитику от директора по ИИ в AMD, в которой она показала, что Claude Code стал работать хуже в марте? Anthropic только что признали, что это правда. Они действительно нашли целых три бага aka неудачных обновления, из-за которых агент тупил. 1. 4 марта режим reasoning по умолчанию был переключен с high на medium, чтобы ""убрать чрезмерно долгие задержки"". В итоге изменение откатили: жалоб от пользователей стало слишком много. 2. Позже в в системный промпт добавили инструкцию: между вызовами инструментов – не более 25 слов, в финальных ответах – не более 100 слов. Откуда были взяты такие числа, не очень понятно, но в итоге оказалось, что это снижает качество кода на 3% (сюрприз-сюрприз). Это изменение тоже откатили. 3. Ну и финалочка: в марте Anthropic катнули оптимизацию: если сессия простаивала больше часа, старые блоки thinking должны были очищаться один раз при ее возобновлении. Но в итоге из-за бага очистка происходила на каждом шаге до конца сессии (то есть Claude буквально каждый раз чистил контекст). Понятно, что в итоге агент начинал путаться, повторяться и противоречить себе. Это также приводило к промахам кэша и ускоренному расходу лимитов. Исправили баг только 10 апреля. Все эти неприятности отлавливались относительно долго, потому что затрагивали разные сегменты трафика. А еще фишка в том, что сами сотрудники стартапа пользуются другой сборкой агента, иначе почти наверняка замечали бы проблемы раньше :) Есть и положительная сторона: сейчас все (найденные) баги исправили, а всем пользователям сбросили лимиты использования. Пируем ☕️ www.anthropic.com/engineering/april-23-postmortem"
"Помните разгромную аналитику от директора по ИИ в AMD, в которой она показала,…
Из этого канала
- #9108Google вложит до 40 миллиардов долларов в Anthropic 10 миллиардов они заплатят…
Google вложит до 40 миллиардов долларов в Anthropic 10 миллиардов они заплатят сразу, и еще 30 – в будущем, при условии достижения определенных целей…
- #9109~5% запросов к Алисе обрабатываются с ошибками распознавания речи По статистике…
~5% запросов к Алисе обрабатываются с ошибками распознавания речи По статистике это небольшой процент.
- #9110Project Deal: Anthropic сделали внутренний маркетплейс, где все сделки от имени…
Project Deal: Anthropic сделали внутренний маркетплейс, где все сделки от имени людей совершали Claude-агенты Ранее они уже проводили эксперимент Project Vend,…
- #9104SakanaAI выпускают систему оркестрации агентов Sakana Fugu Это будет первый…
SakanaAI выпускают систему оркестрации агентов Sakana Fugu Это будет первый коммерческий пользовательский продукт стартапа.
- #9103DS Lab: что нового в нашей облачной IDE Продуктовая команда Data Secrets…
DS Lab: что нового в нашей облачной IDE Продуктовая команда Data Secrets продолжает активно развивать DS Lab и делать ее еще удобнее для гибкой аренды…