Ребятки, у нас промежуточный апдейт мейна! https://github.com/researchim-ai/models-at-home заехал анслот) чтобы активировать надо в GRPO вкладке выбрать Training Backend: Unsloth и lora/qlora завтра буду еще полировать и инфы забью и прочего и багов мб пофикшу каких) unsloth это для тех особенно у кого ну ресурсов немного в single-gpu режиме он мощней всего Но я с ним пока незакончил. я все же хочу его нормально в DDP с vllm поднять