Уверен, что многих интересует как вот там реализуются методы распределенного трейна, может кто-то хотел бы сам реализовать (а это очень полезно). Ребята из HF 🤗 начали проект по учебной реализации таких методов (dataparallel, tensorparallel, pipelineparallel, contextparallel) : https://github.com/huggingface/picotron https://github.com/huggingface/picotron_tutorial Вместе с проектом идут лекции на ютубе. Это как проект nanoGPT по учебной реализации гптшки 2, чтобы разобраться, но он прям уже круто разросся и народ там уже наоптимизировал всякого, мб и тут крутое что-то будет
Уверен, что многих интересует как вот там реализуются методы распределенного…
Из этого канала
- #906Наткнулся на проект (выложен 3 часа назад первый коммит) где чел учит мелкие…
Наткнулся на проект (выложен 3 часа назад первый коммит) где чел учит мелкие 9/26м параметров RWKV (подвид RNNок, конкурент трансформерам) модельки играть в…
- #908"Боремся с проклятыми токенами 😎 Люблю статьи от авторов phi — очень простые с…
"Боремся с проклятыми токенами 😎 Люблю статьи от авторов phi — очень простые с топорными методами, но работают хорошо.
- #910Ни дня без агентов - на этот раз помощник ресерчера. (AMD + университет Джона…
Ни дня без агентов - на этот раз помощник ресерчера. (AMD + университет Джона Хопкинса) Лаборатория Агентов состоит из трех основных фаз, которые…
- #904Ребята из проекта опенсурс агента для написания кода OpenHands 🥳 релизнули…
Ребята из проекта опенсурс агента для написания кода OpenHands 🥳 релизнули первую 0.18.0 версию 5 дней назад https://github.com/All-Hands-AI/OpenHands…
- #903Кстати существует курс по квантовому млю на русском:…
Кстати существует курс по квантовому млю на русском: https://quantum-ods.github.io/qmlcourse/book/index.html (немножко участвовал в написании)