Создание быстрых и точных агентов с помощью Prime-RL Post Training Ramp Labs рассказывают, как обучили специализированного RL-субагента для навигации по электронным таблицам, который превзошёл Claude Opus 4.6 по точности на 4 процентных пункта, работая при этом на скорости Haiku. Читать статью