Anthropic представила Claude Opus 4.5 Да, это очередная новая модель, которая стала еще умнее, чем предшественницы, еще лучше кодит, размышляет, взаимодействует с агентами и так далее. На картинке к посту — данные ключевых бенчмарков, где видно, насколько Claude Opus 4.5 хорош, хотя и уступает в некоторых категориях конкурентам. В чем он точно их превосходит — так это в безопасности: он намного менее склонен к «вызывающему опасения» поведению, чем ChatGPT и Gemini, и лучше защищен от промпт-инъекций. В общем, все как всегда — это все пишут в каждом пресс-релизе, когда выходит новая модель. Из оригинального: 🔵Opus 4.5 оказался слишком умен для некоторых бенчмарков. В τ²-Bench он нашел новое и при этом рабочее решение, которые не было предусмотрено авторами. Из-за этого тест он завалил, но Anthrpoic все равно им гордятся. 🔵У того, что модель получилась такая сообразительная, есть практическая польза для конечного потребителя: она намного эффективнее расходует токены. Opus 4.5 превосходит Sonnet 4.5 и при этом тратит на 76% меньше токенов на те же задачи. 🔵Ну и самое главное — использование Opus 4.5 через Claude API обойдется в $5/$25 за миллион токенов. В общем, новая модель Anthrpoic стала не только умнее, но и доступнее. Ждем теперь, когда очередную новинку, рвущую все бенчмарки, выкатит OpenAI.