кстати у нас в студию для трена моделек дома в веб-интерфейсе заезжают новые фичи https://github.com/researchim-ai/models-at-home Это приложение для тех кто с наимаеньшими усилиями хотел бы начать тюнить модельки. Таков замысел Нужен правда поставить docker и git Сейчас можно делать претрен, sft и грпо небольших моделек. Кстати grpo поддерживает lora и это довольно экономично выходит по памяти. 1.5b моделька в sdpo (grpo с модификациями из одной новой статьи) с лорой ~12bg vram (там 2 экземпляра модельки грузится) на 2к контекста на gsm8k-ru. на вид обучается быстрее обычного grpo вполне можно потестить скоро еще больше обновлений. хочу затащить страничку для работы с данными и генережкой семплов из https://github.com/researchim-ai/re-rl и другие енвайроменты ну и пока что там страничка с ллмами только. в дальнейшем планирую разделы из других областей для/мля с возможностью тюнинга моделек или трена с 0 под разные задачи а следить за проектами и за ИИнформацией можно в https://t.me/researchim