Я правда сейчас просто SFT семплы генерю в ноутбуке в re-rl а потом перекидываю в datasets в models-at-home и гружу в SFT