unsloth пока будет доступен только в GRPO. и только с lora/qlora multigpu очень медленный с ним, т.к. по-нормальному запустить его с vllm пока не выходит. только в single gpu + vllmом классно и быстро работает (ну как во всех их примерах) ну и намучался я с ним) full-тюнинг будет только на обычном бекенде с flash attention и liger kernels