SWE-bench Verified и Terminal-Bench могут быть на 100% взломаны с помощью простого хака Ученые из Беркли доказали это, сделав агента, который проходит тесты на 100%, при этом не решив по-настоящему ни одной задачки. При этом эксплойты, которые ломают бенчмарки, простые до смешного. Для SWE bench агент просто добавлял в репозиторий 10-строчный скрипт, который всегда возвращал «passed» для всех тестов, и система этому верила. Итог: 0 пофикшенных багов и 100% на 500 задачах в SWE Verified и 731 задаче в SWE Pro. Получается, SOTA ☕️ В Terminal-Bench то же самое – агент просто подменил curl, перехватил установку зависимостей, подсунул зараженный бинарник и сам записал «правильный» результат: 89/89. При том что ни одна задача реально не была решена. Авторы проверили еще 5 бенчмарков, и в каждом нашли подобные уязвимости. Почти никакие бенчи не защищены от reward hacking, а современные модельки уже достаточно умные, чтобы их находить. Выводы делайте сами 🫠
SWE-bench Verified и Terminal-Bench могут быть на 100% взломаны с помощью…
Из этого канала
- #9037В дом Сэма Альтмана бросили коктейль Молотова. Он считает, что это произошло…
В дом Сэма Альтмана бросили коктейль Молотова. Он считает, что это произошло из-за недавней статьи The New Yorker Прошлой ночью на дом Сэма в Сан-Франциско…
- #9038Как быстро смотреть интервью и лекции и не терять суть Сейчас выходит просто…
Как быстро смотреть интервью и лекции и не терять суть Сейчас выходит просто масса интересных интервью и докладов.
- #9039Акции Cloudflare упали на 13% из-за выпуска Claude Mythos Последние дни…
Акции Cloudflare упали на 13% из-за выпуска Claude Mythos Последние дни инвесторы активно распродают акции компаний, которые занимаются софтом и кибербезом.
- #9035"Как перейти от ИИ-экспериментов к рабочим системам Рассказываем, где узнать…
"Как перейти от ИИ-экспериментов к рабочим системам Рассказываем, где узнать реальный опыт тех, кто встроил искусственный интеллект в ключевые процессы…
- #9034Стало известно, что Anthropic собирается разрабатывать собственные ИИ-чипы…
Стало известно, что Anthropic собирается разрабатывать собственные ИИ-чипы Сейчас они используют смесь из GPU Nvidia, TPU от Google и чипов Amazon.