ресечим/делаем (c) AI@researchim· 1 565 subs

ну разное у меня щас с искуственными данными больше упор на sft и чтобы иметь…

2 февр. 2026 г.0 viewsОткрыть в Telegram →

ну разное у меня щас с искуственными данными больше упор на sft и чтобы иметь возможность претренить свои модельки а чел тут через grpo пытается модельку чисто обучить. причем 4б у него фейл полный и он переключился на a3b-30b квен и все у него поехало я кстати слышал что для моделек условно < 15B стоит делать полный sft всегда а для > 15B всегда rl

Источник

https://t.me/researchim/5890

Канал ресечим/делаем (c) AI · опубликовано 2 февр. 2026 г.

Из этого канала