Unsloth отгружает 4бита кванты и GGUFы (для llama.cpp) Оперативно конечно https://huggingface.co/collections/unsloth/qwen3-680edabfb790c8c34a242f95