Ребята из Open-R1 продолжают рассказывать о том, что сейчас делают. https://huggingface.co/blog/open-r1/update-2 Нагенерили датасетов (трейсы с R1 к решению мат задачек из https://huggingface.co/datasets/AI-MO/NuminaMath-1.5). По 2-4 трейса на задачу. Ну и рассказывают как собирали и чистили. почищенные 220к задач с решениями: https://huggingface.co/datasets/open-r1/OpenR1-Math-220k нефильтрованные 516,499 задач и 1,209,403 решений: https://huggingface.co/datasets/open-r1/OpenR1-Math-Raw - PS покайфу собираем все что с мл/ии связано в группе https://t.me/researchim
Ребята из Open-R1 продолжают рассказывать о том, что сейчас делают.…
Из этого канала
- #963Кстати, Сэм Альтман проводил опрос, чего бы опенсурснуть следующим - модельку…
Кстати, Сэм Альтман проводил опрос, чего бы опенсурснуть следующим - модельку типа o3-mini (небольшую рассуждалку) или вообще мелкую модельку которую можно…
- #964Qwen2.5-7B-Instruct-Tool-Planning-v0.1 Первый vikhr обученный на Function…
Qwen2.5-7B-Instruct-Tool-Planning-v0.1 Первый vikhr обученный на Function Calling а так же Tool planing! Модель обучена преимущественно на английском и это…
- #965HuggingFace 🤗 выложили The Ultra-Scale Playbook: Training LLMs on GPU Clusters…
HuggingFace 🤗 выложили The Ultra-Scale Playbook: Training LLMs on GPU Clusters https://huggingface.co/spaces/nanotron/ultrascale-playbook - это интерактивный…
- #961Вот и 1.5B с RL на русском) Молодцы ребята, RL любят
Вот и 1.5B с RL на русском) Молодцы ребята, RL любят
- #960⚡️ QVikhr-2.5-1.5B-Instruct-r — Наша новая компактная llm теперь еще и с GRPO…
⚡️ QVikhr-2.5-1.5B-Instruct-r — Наша новая компактная llm теперь еще и с GRPO этапом.