Ребятки ну оно что-то заапроксимировало) после ~ 100к семплов SFT на арифметику разной длины конкретно такого семпла точно не было нерабочий 150м калькулятор у себя дома. кайф же
Ребятки ну оно что-то заапроксимировало) после ~ 100к семплов SFT на арифметику…
0 viewsОткрыть в Telegram →
Из этого канала
- #5840В re-rl скоро мб приедет генка multiturn математики
В re-rl скоро мб приедет генка multiturn математики
- #5841Я правда сейчас просто SFT семплы генерю в ноутбуке в re-rl а потом перекидываю…
Я правда сейчас просто SFT семплы генерю в ноутбуке в re-rl а потом перекидываю в datasets в models-at-home и гружу в SFT
- #5842я своей работой доволен максимально
я своей работой доволен максимально
- #5837еще может 1 на 1 умножить AGI
еще может 1 на 1 умножить AGI
- #5836тут кста апдейтик сегодня будет. добавил чтобы можно было генерить как без…
тут кста апдейтик сегодня будет. добавил чтобы можно было генерить как без ризонинговых тегов данные так и с ними <think> <answer>