а вот это прикольное применение опенклав Most RL-for-LLM systems assume centralized, batch-mode training with pre-collected datasets. OpenClaw-RL takes a fundamentally different approach: it wraps your self-hosted model in OpenClaw as an OpenAI-compatible API, intercepts live multi-turn conversations, and continuously optimizes the policy in the background — all without interrupting your usage. https://github.com/Gen-Verse/OpenClaw-RL напомню что у нас есть штука для тех кто хотел бы сам тюнить модельки https://github.com/researchim-ai/models-at-home достаточно докера и можно тюнить ллмки небольшие у себя от претрена до грпо)