Бенчмарки! Новый митап про DeepSWE, SWE-rebench v2 и др Друзья, вы все еще верите бенчмаркам? Я вот все меньше. Наверняка уже все видели DeepSWE бенчмарк - пожалуй, наиболее противоречивый бенчмарк за последнее время, причем с полярными мнениями: для одних это единственный объективный бенчмарк, для других он абсолютно не имеет отношения к реальности. В общем, я подумал, что будет интересно разобраться глубже в современных бенчмарках - обсудить их достоинства и недостатки, чтобы понимать есть ли вообще смысл обращать внимание на SWE бенчмарки в 2026-м. Отдельно разберем обновленный SWE-rebench v2. На митап мы позвали, вероятно, наиболее подкованного человека из русскоязычного пространства - Ибрагима Бадертдинова, он один из ключевых авторов бенчмарка SWE-rebench, который как раз недавно обновили. А еще, Ибрагим автор канала @c0mmit. А неудобные вопросы будет задавать горячо любимый друг нашего канала Максим Этихлид (@etechlead). Будем обсуждать важность harness, утечки, бенчхакинг, важность флоу проекта (AGENTS.md, верификации и т. д.) и, конечно, методологии. Дата и время: 9 июня 14:00 по МСК, 16:00 по Алматы, 13:00 CET, 12:00 по Лондону. Ссылка на регистрацию на встречу. Готовьте свои коварные вопросы, ведь будет уникальная возможность задать их Ибрагиму - автору одного из топовых бенчмарков. — Кстати, у нас было интервью с Ибрагимом, в котором мы разбирали подробно бенчмарк SWE-rebench, поэтому рекомендую к просмотру всем AI-энтузиастам и в качестве подготовки к нашему новому стриму: https://youtu.be/a5jf-kyV12Y @ai_driven | AI-Driven Development: Родион Мостовой.
Бенчмарки! Новый митап про DeepSWE, SWE-rebench v2 и др Друзья, вы все еще…
Источник
https://t.me/ai_driven/217Канал AI-Driven Development. Родион Мостовой · опубликовано 8 июн. 2026 г.
Из этого канала
- #216"[2/2] Пример промпта для кодинг агента на Июнь 2026 ``Давай добавим нового…
"[2/2] Пример промпта для кодинг агента на Июнь 2026 ```Давай добавим нового агента для супер глубокого и скрупулезного исследования контекста и назовем его…
- #215[1/2] Пример промпта для кодинг агента на Июнь 2026 Для контекста Мы доделали…
[1/2] Пример промпта для кодинг агента на Июнь 2026 Для контекста Мы доделали новый бенчмарк QA по кодовой базе для CodeAlive, и в нем у нашего context…
- #210OS Deep Cleaner + Health Checker: новый кейс с кодагентами С чего бы это в…
OS Deep Cleaner + Health Checker: новый кейс с кодагентами С чего бы это в канале про AI кодинг я рассказываю об очистке мака и поддержании его в здоровом…