Anthropic выпускают новую суперсильную модель Claude Mythos, но доступ к ней есть только по закрытой программе поиска уязвимостей Итак, это не учебная тревога: в Anthropic разработали новую мощнейшую модель. Вот здесь лежит системная карта с бенчмарками: https://www-cdn.anthropic.com/53566bf5440a10affd749724787c8913a2ae0841.pdf. В скринах выше табличка с главными метриками. – На SWE-bench Verified модель выбивает 93.9% против 80.8% у Claude Opus 4.6 – На SWE-bench Pro – 77.8% против 53.4% у Opus 4.6 и 57.7% у предыдущей соты GPT-5.4 Цифры просто невероятные, скачок потрясающий. НО это не релиз для пользователей. Anthropic решили, что модель слишком сильна и опасна, чтобы сразу выпускать ее на широкую аудиторию. Вместо этого они открыли проект Project Glasswing, чтобы защитить основной софт человечества от будущих ИИ-атак, которые может спровоцировать Claude Mythos. В проект вошли Amazon, Microsoft, Apple, Google, Nvidia и еще 40+ организаций. Всем им предоставляют специальный доступ к пайплайну обнаружения уязвимостей на основе Claude Mythos. Anthropic утверждают, что модель способна находить уязвимости на уровне, превосходящем даже лучших человеческих специалистов, за редким исключением. Сообщается, что на данный момент она уже обнаружила тысячи критических уязвимостей, в том числе в массово используемых ОС и браузерах. Некоторые из этих дыр по 10-20 лет лежали незамеченными. Когда модель выпустят для всех – неизвестно, но, по ощущениям, не скоро.
Anthropic выпускают новую суперсильную модель Claude Mythos, но доступ к ней…
Из этого канала
- #9001Дьявол, как всегда, кроется в деталях. В нашем случае – в системной карте.…
Дьявол, как всегда, кроется в деталях. В нашем случае – в системной карте. TL;DR: в рамках тестирования Claude Mythos смог «сбежать из лаборатории» ✌️…
- #9002О, Андрей Карпаты навайбкодил собственный Твиттер https://karpathytalk.com…
О, Андрей Карпаты навайбкодил собственный Твиттер https://karpathytalk.com Андрей заявил, что разочарован в X/Twitter, Threads и Substack, потому что качество…
- #9003Почему омни-модели — это больше про инфраструктуру, чем про архитектуру…
Почему омни-модели — это больше про инфраструктуру, чем про архитектуру Последние пару лет вся индустрия пытается склеить модели: текст с изображениями, речь с…
- #8998"The New Yorker выпустили огромное расследование о Сэме Альтмане и его…
"The New Yorker выпустили огромное расследование о Сэме Альтмане и его увольнении осенью 2023 Казалось бы, это поле уже сто раз перепахано журналистами, но…
- #8997Новость дня – опенсорс от Милы Йовович 🤔 github.com/milla-jovovich/mempalace К…
Новость дня – опенсорс от Милы Йовович 🤔 github.com/milla-jovovich/mempalace К такому вас жизнь однозначно не готовила, но да: это ссылка на проект Милы…