Вот так выглядит на SWE-bench Pro Обратите внимание, что в Claude Code по умолчанию стоит high, а не x-high или max.
Вот так выглядит на SWE-bench Pro Обратите внимание, что в Claude Code по…
Из этого канала
- #3662Anthropic ещё сказали про сущий пустяк — привлекли 65 миллиардов долларов при…
Anthropic ещё сказали про сущий пустяк — привлекли 65 миллиардов долларов при оценке 900, и ARR вышел на невероятные 47 миллиардов долларов (выручка за год,…
- #3663Кроме новой модели и раунда инвестиций Anthropic представили можно сказать…
Кроме новой модели и раунда инвестиций Anthropic представили можно сказать следующий шаг в агентской разработке — dynamic workflows.
- #3664Пример того как выглядит workflow можно посмотреть вот в этом PR для Bun. По…
Пример того как выглядит workflow можно посмотреть вот в этом PR для Bun. По сути это большой набор автосгенерированных .js-файлов, в которых просто хранится…
- #3660Новый опус: https://www.anthropic.com/news/claude-opus-4-8 1) цена та же 2)…
Новый опус: https://www.anthropic.com/news/claude-opus-4-8 1) цена та же 2) сделали гранулярную разбивку длины рассуждений, как у ChatGPT 3) fast режим,…
- #3655DeepSWE — новый бенчмарк для оценки агентов в имплементации функциональности.…
DeepSWE — новый бенчмарк для оценки агентов в имплементации функциональности. Бенчмарк новый, а по сути уже устаревший — GPT-5.5 выбивает 70% 👨🦳Структурно во…