"Как ИИ взломал блокчейн контрактов на $4,6 млн: новое исследование Anthropic Сразу дисклеймер: ничьи кошельки не пострадали, все тесты проводили в симуляции. Anthropic red team (ну просто на всякий случай 😐 ) решили проверить, сколько денег современный ИИ способен ""украсть"", если дать ему такую задачу. Они взяли 405 настоящих смарт-контрактов, которые реально взламывали в 2020–2025 годах (такие данные открыты) и сделали из этого бенчмарк SCONE-bench. Суть в том, что агента помещают в изолированный блокчейн-симулятор, который четко отражает состояние сети перед реальным взломом, и просят «Найти уязвимость и написать эксплойт, который увеличит баланс атакующего». Итог: всего модели смогли написать рабочие эксплойты на сумму 550,1 миллион долларов в переводе на современный курс. Но вы сейчас скажете: ""Это просто зубрежка датасета"", – и будете, в целом, правы. Только Anthropic тоже об этом подумали, и потому провели дополнительный эксперимент. Они выбрали из всего датасета 34 контракта, взломанных после марта 2025 года (то есть после knowledge cutoff у моделей) и прогнали по ним Opus 4.5, Sonnet 4.5 и GPT-5. Относительный результат почти не ухудшился: суммарная виртуальная добыча оказалась равна $4,6 млн, лучший результат – у Opus 4.5. Вот в такое время живем."
"Как ИИ взломал блокчейн контрактов на $4,6 млн: новое исследование Anthropic…
Из этого канала
- #8428🥳 Google Colab теперь доступен в Cursor, Windsurf и Antigravity Напоминаем, что…
🥳 Google Colab теперь доступен в Cursor, Windsurf и Antigravity Напоминаем, что совсем недавно они выкатились в VSCode: там стало возможным подключать…
- #8429Для тех, кому обычные визуализации работы трансформера уже приелись: ребята из…
Для тех, кому обычные визуализации работы трансформера уже приелись: ребята из alphaXiv сделали красивейший интерактивный RL Visualizer На примере игрушечной…
- #8430Исследователи Яндекса представили RATE — новую систему оценки нейропереводов…
Исследователи Яндекса представили RATE — новую систему оценки нейропереводов RATE (Refined Assessment for Translation Evaluation) опирается на критерии…
- #8426Легенда Юнгер Шмидхубер опять поясняет за плагиат: на этот раз он доказывает,…
Легенда Юнгер Шмидхубер опять поясняет за плагиат: на этот раз он доказывает, что CNN изобрел не Лекун Напоминаем, что Шмидхубер – это тот самый ученый,…
- #8425"Как работает распознавание звука в Алисе На прошлой неделе в Москве прошла…
"Как работает распознавание звука в Алисе На прошлой неделе в Москве прошла большая встреча ML-комьюнити Data Dojo от Яндекса.