unsloth завезли ноутбук с рлем для gpt-oss моделек В примере учат ллмку рлем писать более оптимизированные CUDA-кернелы https://docs.unsloth.ai/new/gpt-oss-reinforcement-learning