https://www.anthropic.com/news/claude-opus-4-5 Claude Opus 4.5 таки смог взять 80% на SWE-bench Verified! Бонусом в модель добавили effort control — прямо как у OpenAI: high, medium, low, дольше думает = лучше решает. На бенчмарках... ВНЕЗАПНО ждём, потому что цена упала до $5/$25 за миллион токенов (в 3 раза).
https://www.anthropic.com/news/claude-opus-4-5 Claude Opus 4.5 таки смог взять…
Из этого канала
- #3132Вместе с моделью добавили 3 новые фичи: — инструмент поиска инструментов —…
Вместе с моделью добавили 3 новые фичи: — инструмент поиска инструментов — программный вызов инструментов — примеры для инструментов Последние два менее…
- #3133Ииии вот из-под крыла Белого Дома выходит анонс THE GENESIS MISSION —…
Ииии вот из-под крыла Белого Дома выходит анонс THE GENESIS MISSION — инициативы, направленной на использование AI в науке.
- #3134Forecasting AI Time Horizon Under Compute Slowdowns В начале года METR…
Forecasting AI Time Horizon Under Compute Slowdowns В начале года METR представили свою работу по AI Time Horizon — оценку того, как долго агент может…
- #3130Совсем недавно я рассуждал про мощности, необходимые для тренировки Agent 0 и…
Совсем недавно я рассуждал про мощности, необходимые для тренировки Agent 0 и Agent 1 из работы AI-2027, и пришёл к выводу, что немного отстаём от обозначенных…
- #3129В 2024-м Apple объявили о том, что будут делать Private Cloud Compute —…
В 2024-м Apple объявили о том, что будут делать Private Cloud Compute — технологию, позволяющую запускать нейросети на сервере на ваших данных без риска их…