Рад поделиться тем, что у команды частью которой Я являюсь, на HuggingFace вышел ТехРепорт по VLA, которая работает на разных роботах в том числе и нашем антропоморфном роботе - Грине (не китайском!). Если вкратце: за последний год стало ясно, что просто «навалить данных» уже не помогает. Чтобы робот перестал тупить в реальных задачах, нужно копать в сторону качества, переносимости между воплощениями и адаптацией в реальном мире Что в отчете: Выстроили многоуровневый пайплайн обучения: VLM (L0) -> SFT VLM (L1) -> претрейн VLA (R0) → SFT VLA (R1) → RL finetune (R2), где каждая фаза последовательно адаптирует модель понимать и действовать в физическом мире. Унифицировали действия (R64): Сделали единый интерфейс для разных роботов. Использовали маскированный loss, для того чтобы разнородные пространства действий у воплощений не путали модель Выстроили жесткий пайплайн работы с данными: Выстроили пайплайны фильтрации данных, оценки качества и разнообразия датасетов, оценки и выравнивания скорости движений в данных. RL, JPM и OOD-detector: Научили роботов не просто копировать движения, а восстанавливаться после ошибок + обобщаться на абсолютно новые предметы без переобучения. И главное — вовремя останавливаться, а не «суетиться» после того, как задача уже сделана. В итоге — SOTA на бенчмарках и отличная работа вживую на том же ALOHA, и нашем антропоморфном роботе - Грине. Внутри много «скучной», но важной инженерки, благодаря которой всё это реально работает, а не просто красиво выглядит на видео. 📌 Почитать можно тут: https://huggingface.co/papers/2602.00919 Наш сайт: https://sber.ru/robocenter Резюме и предложения: @alex_postnikov26 @pdemen (Можно написать мне если ребята не доступны:@Alexander_Nutalapati) Будем благодарны за апвоуты и поддержку! 🙏
Рад поделиться тем, что у команды частью которой Я являюсь, на HuggingFace…
Из этого канала
- #1290А вот и он: https://www.ikot.blog/anthropic-take-home-for-dummies Это мой…
А вот и он: https://www.ikot.blog/anthropic-take-home-for-dummies Это мой первый блог на английском языке, спасибо Gemini 3 Pro за помощь в переводе.
- #1291кстати у нас в студию для трена моделек дома в веб-интерфейсе заезжают новые…
кстати у нас в студию для трена моделек дома в веб-интерфейсе заезжают новые фичи https://github.com/researchim-ai/models-at-home Это приложение для тех кто с…
- #1292там походу надвигается волна китайских релизов сейчас GLM-5 744B 40A…
там походу надвигается волна китайских релизов сейчас GLM-5 744B 40A https://z.ai/blog/glm-5 прикольно что челы сориентировались в ситуации и сразу говорят мол…
- #1288Quartet II Выложили препринт новой статьи про претрен LLMок в NVFP4. Качество…
Quartet II Выложили препринт новой статьи про претрен LLMок в NVFP4. Качество лучше и кернелы быстрее. Статью лайкать на HF Daily Papers.
- #1287челы собрали много статей по llm рлю, жаль что несколько месяцев не обновляли…
челы собрали много статей по llm рлю, жаль что несколько месяцев не обновляли https://github.com/TsinghuaC3I/Awesome-RL-for-LRMs