Агенты ИИ | AGI_and_RL@AGI_and_RL· 5 852 subs

Ммм, там датасетик на 250к семплов под RL над LLMками и ризонинге подвезли. Все…

25 февр. 2025 г.2 124 views43 forwardsОткрыть в Telegram →

Ммм, там датасетик на 250к семплов под RL над LLMками и __ризонинге__ подвезли. Все по матеше конечное Это сборка из других открытых датасетов (на скринах) + 47к своих новых (назвали Big-Math-Reformulated). Мол в открытых датасетах не всегда прям качественные данные, поэтому вот авторы хорошее пособирали и своего долили. Big-Math-RL-Verified https://huggingface.co/datasets/SynthLabsAI/Big-Math-RL-Verified Как все это дело компилировали читаем здесь: Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models https://arxiv.org/abs/2502.17387 PS собираемся и cобираем все крутое по нейронкам тут: https://t.me/researchim

Источник

https://t.me/AGI_and_RL/972

Канал Агенты ИИ | AGI_and_RL · опубликовано 25 февр. 2025 г.

Из этого канала