третий апдейт по Open R1 https://huggingface.co/blog/open-r1/update-3 Чем… — @AGI_and_RL

третий апдейт по Open R1 https://huggingface.co/blog/open-r1/update-3 Чем занимались Созданием CodeForces-CoTs: датасетом, содержащим почти 100 тысяч высококачественных примеров, полученных в результате дистилляции R1 для генерации решений на C++ и Python. https://huggingface.co/datasets/open-r1/codeforces - задачи https://huggingface.co/datasets/open-r1/codeforces-cots - решения с трейсами от R1 IOI-бенчмарком: новым набором сложных задач с Международной олимпиады по информатике 2024 года https://huggingface.co/datasets/open-r1/ioi задачи IOI’2020 - IOI’2024 https://huggingface.co/datasets/open-r1/ioi-cots - трейсы решений с R1 (еще много дополнительного в статье) OlympicCoder: двумя дообученными моделями кода (7B и 32B), которые превосходят закрытые передовые модели, такие как Claude 3.7 Sonnet, при решении задач IOI https://huggingface.co/open-r1/OlympicCoder-7B https://huggingface.co/open-r1/OlympicCoder-32B Уже было бы прикольно увидеть сам Open R1, но ребята еще только учатся тренить ризонинг модельки и пишут в посте подробности! В том числе рассказывают что выяснили пока делали OlympicCoder PS собираем полезное по ллмам тут https://t.me/researchim

Из этого канала