Ммм, там датасетик на 250к семплов под RL над LLMками и __ризонинге__ подвезли. Все по матеше конечное Это сборка из других открытых датасетов (на скринах) + 47к своих новых (назвали Big-Math-Reformulated). Мол в открытых датасетах не всегда прям качественные данные, поэтому вот авторы хорошее пособирали и своего долили. Big-Math-RL-Verified https://huggingface.co/datasets/SynthLabsAI/Big-Math-RL-Verified Как все это дело компилировали читаем здесь: Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models https://arxiv.org/abs/2502.17387 PS собираемся и cобираем все крутое по нейронкам тут: https://t.me/researchim