В прошлом году ребята из Physical Intelligence рассказывали про модель Pi0 https://www.physicalintelligence.company/blog/pi0 - что это фаундейшен моделька для роботов (работает поверх PaliGemma влмки от гугла + flowmatching подробнее тут писали https://t.me/rizzearch/696?single), тренировали ее на больших датасетах собранных с разных роботов. Но ни модельку, ни данные они не выкладывали. И вот тут ресечер Allen Z. Ren который сам занимается роботами решил воспроизвести подход (данные он использует другие конечно) и заопенсурсил свой проект и модельки: https://github.com/allenzren/open-pi-zero
В прошлом году ребята из Physical Intelligence рассказывали про модель Pi0…
Из этого канала
- #897Тул для командной строки, который собирает код из укзанной директории в большой…
Тул для командной строки, который собирает код из укзанной директории в большой промт для ЛЛМки (для анализа кода, изменения или чего вам нужно).
- #898Получается 31 декабря Дед Мороз приносил обзорку по Low Rank Adaptation и…
Получается 31 декабря Дед Мороз приносил обзорку по Low Rank Adaptation и фоундейшен моделькам.
- #900Стороны сингулярности: PPO не сошелся | PPO сошелся
Стороны сингулярности: PPO не сошелся | PPO сошелся
- #895А еще вдогоночку неделю назад работа вышла по 1.58bit Flux (флакс щас лучшая…
А еще вдогоночку неделю назад работа вышла по 1.58bit Flux (флакс щас лучшая генерилка картинок) где обещают в ~5 раз экономию памяти на инференсе…
- #894Эксперимент на тему обучения нейронок в 1.58 бит. Веса модели представляются в…
Эксперимент на тему обучения нейронок в 1.58 бит. Веса модели представляются в тернарном виде (т.е.