Тем временем исследователи из University of Massachusetts Amherst и University of Michigan научили робопса кататься на скейте. Хотя, конечно, главная цель была не в трюках ради лайков. Они решили одну из ключевых задач в робототехнике — научили робота самому понимать, когда и как переключаться между разными режимами движения. Без заранее прописанных сценариев, разметки траекторий и прочих нудных штук. Например, в случае со скейтом — когда именно надо балансировать, когда отталкиваться лапами, а когда просто держать равновесие, пока доска катится. Это всё называется __гибридной динамикой__, когда у робота есть плавные движения, и резкие переключения между ними. Для этого исследователи придумали подход DHAL — Discrete-time Hybrid Automata Learning. По сути, это такая обучающая схема на основе обучения с подкреплением, которая позволяет роботу самому находить моменты смены режимов и корректно на них реагировать. Проверили всё это на симуляциях и на реальном робопсе, который теперь бодро гоняет на скейте. Даже робо-собака смогла научиться, а я нет :( Тут статья про метод обучения