Вот так выглядит на SWE-bench Pro Обратите внимание, что в Claude Code по…

28 мая 2026 г.12 068 views112 forwardsОткрыть в Telegram →

Вот так выглядит на SWE-bench Pro Обратите внимание, что в Claude Code по умолчанию стоит high, а не x-high или max.

Источник

https://t.me/seeallochnaya/3661

Канал Сиолошная · опубликовано 28 мая 2026 г.

Из этого канала

#3662Anthropic ещё сказали про сущий пустяк — привлекли 65 миллиардов долларов при…
Anthropic ещё сказали про сущий пустяк — привлекли 65 миллиардов долларов при оценке 900, и ARR вышел на невероятные 47 миллиардов долларов (выручка за год,…
#3663Кроме новой модели и раунда инвестиций Anthropic представили можно сказать…
Кроме новой модели и раунда инвестиций Anthropic представили можно сказать следующий шаг в агентской разработке — dynamic workflows.
#3664Пример того как выглядит workflow можно посмотреть вот в этом PR для Bun. По…
Пример того как выглядит workflow можно посмотреть вот в этом PR для Bun. По сути это большой набор автосгенерированных .js-файлов, в которых просто хранится…
#3660Новый опус: https://www.anthropic.com/news/claude-opus-4-8 1) цена та же 2)…
Новый опус: https://www.anthropic.com/news/claude-opus-4-8 1) цена та же 2) сделали гранулярную разбивку длины рассуждений, как у ChatGPT 3) fast режим,…
#3655DeepSWE — новый бенчмарк для оценки агентов в имплементации функциональности.…
DeepSWE — новый бенчмарк для оценки агентов в имплементации функциональности. Бенчмарк новый, а по сути уже устаревший — GPT-5.5 выбивает 70% 👨‍🦳Структурно во…