Последние пару месяцев я плотно работал над этим релизом, и наконец-то мы выкатываем его в опенсорс! 📟 Встречайте SWE-rebench-V2: самый большой открытый, мультиязычный датасет для обучения кодовых агентов! Вместе с командой Nebius AI R&D мы построили пайплайн для масштабного сбора задач из реальных GitHub репозиториев и теперь делимся всем с комьюнити. На текущий момент это самый большой и разнообразный открытый датасет подобных задач в мире. Что внутри: > 32 000+ задач — на базе реальных issue + готовый Docker-образ. > 20 языков программирования. Некоторые языки (например, Lua или Clojure) вообще никогда раньше не были покрыты! > 120 000+ дополнительных задач, собранных на базе реальных PR. > Качество — задачи отфильтрованы и размечены с помощью ансамбля LLM. Также мы обогатили их метаданными и добавили интерфейсы, которые проверяются в тестах. Вместе с датасетом мы дропаем техрепорт со всеми деталями нашего пайплайна и прогонами моделей. 📄 Статья и датасет 👾 Наш Discord (мы там онлайн, залетайте с фидбеком и вопросами). ✉️ Пост в X Если есть любые мысли, идеи, предложения - приходите! 🔁 Буду благодарен за репост и пересылку!
Последние пару месяцев я плотно работал над этим релизом, и наконец-то мы…
Из этого канала
- #3443Пока одна половина обсуждает дополнения к контракту OpenAI с Минобороны (в…
Пока одна половина обсуждает дополнения к контракту OpenAI с Минобороны (в котором теперь в явном виде запретили работу с NSA, про которую рассказывал…
- #3444Пока CEO Anthropic продолжает вести переговоры про формулировки в контрактах с…
Пока CEO Anthropic продолжает вести переговоры про формулировки в контрактах с Пентагоном, стало известно, что компания существенно нарастила выручку буквально…
- #3445Если 2 дня назад вышла GPT-5.3, то сегодня, значит, не стоит ожидать 5.4? 🆒 А…
Если 2 дня назад вышла GPT-5.3, то сегодня, значит, не стоит ожидать 5.4? 🆒 А вот и она: https://openai.com/index/introducing-gpt-5-4/ (плюс есть Pro-версия)…
- #3440"Помните несостоявшуюся рекламу наушников от OpenAI? Которая вроде как и не их,…
"Помните несостоявшуюся рекламу наушников от OpenAI? Которая вроде как и не их, но с высоким уровнем продакшена, и за продвижение которой кто-то даже заплатил?…
- #3438OpenAI опубликовали детали договорённостей к Минобороны и часть контракта.…
OpenAI опубликовали детали договорённостей к Минобороны и часть контракта. Последнее оставим на разбор юристам, которые оценят размеры дыр в законах.