🎄 Релизим 67 074 траектории Qwen3-Coder с OpenHands + 2 RFT чекпоинта. > Мы выкладываем: 67 000+ траекторий по 3 800 решенным задачам в 1 800+ Python репозиториях. > Примерно в 3 раза больше успешных траекторий и в 1.5 раза больше репозиториев, чем в нашем прошлом датасете. > Траектории длинные: в среднем 64 шага, до 100 шагов и контекст до 131k токенов. > RFT на этих данных, SWE-bench Verified: Qwen3-30B-Instruct: 25.7% → 50.3% Pass@1. Qwen3-235B-Instruct: 46.2% → 61.7% Pass@1. Также сильный рост на SWE-rebench September (цифры в блог посте) > Мы сделали много эвалов. прогнали OpenHands с лимитом 100 и 500 шагов. Запускаем на SWE-bench Verified и сентябрьском SWE-rebench. > Мы отдельно проверяем тесты, которые пишет модель. Считаем, как часто тесты корректны. Проверяем, как часто финальный патч модели проходит ее собственные тесты. В итоге получаем пул данных в том числе для обучения верифаеров. Полностью Permissive License Датасет и модели: https://huggingface.co/collections/nebius/openhands-trajectories Подробный блогпост: https://nebius.com/blog/posts/openhands-trajectories-with-qwen3-coder-480b Пост в x: https://x.com/ibragim_bad/status/2003423706861936856 P.S. Прошу поддержать пост в x, если у вас есть аккаунт!
🎄 Релизим 67 074 траектории Qwen3-Coder с OpenHands + 2 RFT чекпоинта. > Мы…
Из этого канала
- #1264Сумбурных домашних апдейтов: - добавлена возможность продолжать трен с…
Сумбурных домашних апдейтов: - добавлена возможность продолжать трен с последнего чекпоинта если он был остановлен; - добавлены датасеты которые можно выкачать…
- #1267С Новым Годом ребятки! Всего только хорошего! 🥰🥳🥰 Чтобы чисто кайфовали весь…
С Новым Годом ребятки! Всего только хорошего! 🥰🥳🥰 Чтобы чисто кайфовали весь следующий год и дальше :)
- #1268Автор собрал и описал в одном посте все улучшайки GRPO…
Автор собрал и описал в одном посте все улучшайки GRPO https://cameronrwolfe.substack.com/p/grpo-tricks
- #1262день сменяется ночью новый проект в ресечим…
день сменяется ночью новый проект в ресечим https://github.com/researchim-ai/models-at-home выходят новые модельки от ОпенАИ, от Гугла Настало время и своей…
- #1261снова слышен стук колес чучух-чучух... что привезли нам на этот раз? ресеч по…
снова слышен стук колес чучух-чучух... что привезли нам на этот раз? ресеч по ии в формальной математике и доказательстве теорем…