...и вы не поверите товарищ майор, как только я дописал пост и открыл твиттер, так тут же новый пост от AISI. Они говорят, что получили доступ к более свежему чекпоинту Mythos 👨🦳 и там уже видно отрыв от GPT-5.5 (даже -Cyber, версии модели, заточенной на кибербез). Новый Mythos совершает сложную многоступенчатую атаку в 6 попытках из 10 (предыдущая модель 3/10, GPT-5.5 2/10). На другой задаче, которую ещё ни одна модель не решала (тоже длинная цепочка взлома корпоративной сети), новый Mythos справился 3 раза из 10 🤒 ...обе задачи AISI впервые анонсировали в марте 2026-го года. Наверное не думали, что за 2 месяца их решат))))))))) интересно, что дальше делать будут
...и вы не поверите товарищ майор, как только я дописал пост и открыл твиттер,…
Из этого канала
- #3627Произошёл додеп — Anthropic теперь расширили и недельный лимит на 50% (до 13-го…
Произошёл додеп — Anthropic теперь расширили и недельный лимит на 50% (до 13-го июля, на 2 месяца). Это в дополнение к недавнему удвоению 5-часовых лимитов.
- #3628Ещё сегодня вышла свежая статистика от Ramp, компании для менеджмента…
Ещё сегодня вышла свежая статистика от Ramp, компании для менеджмента корпоративных трат и выпуска карт и (например, для сотрудников в командировке).
- #3630Апдейт: сегодня закончились слушания свидетелей и экспертов, завтра будет…
Апдейт: сегодня закончились слушания свидетелей и экспертов, завтра будет выступление адвокатов перед присяжными (каждое не менее 2 часов).
- #3621"Появляется всё больше и больше историй от компаний, работающих и тестирующих…
"Появляется всё больше и больше историй от компаний, работающих и тестирующих Mythos.
- #3620😭 на прогоны бенчмарков скоро придётся привлекать венчурные деньги — директор…
😭 на прогоны бенчмарков скоро придётся привлекать венчурные деньги — директор Epoch.AI уже кинул клич, что им необходимо $600k или хотя бы $100k, чтобы…