Кстати. Вопрос инференса в целом большой. У нас студия для трена моделек в первую очередь. Но возможно отдельную страничку можно выделить под то чтобы инференсить и запускать модели допустим с vllm/sglang на своих мощностях