Ultra-Scale Playbook - книга по распределённой тренировке от Huggingface Хороший общий обзор того, как эффективно использовать сотни GPU для обучения самых мощных AI моделей. Она предлагает пошаговый процесс выбора и настройки конфигурации обучения и их оптимизации. Проходятся по всем основным видам параллелизм, их сильным и слабым сторонам и как сделать их быстрыми и эффективными по памяти. Книга не просто теоретизирует, она основана на более 4000 реальных экспериментов, использующие вплоть до 512 GPU (кому-то это может показаться не много, но это уже приличный скейл). Результаты поданы в виде куче графиков и интерактивных визуализаций. Всего 100 страниц, рекомендую почитать. К тому же они сделали cheatsheet, чтобы проще было запомнить содержание книги. https://huggingface.co/spaces/nanotron/ultrascale-playbook @ai_newz
Ultra-Scale Playbook - книга по распределённой тренировке от Huggingface…
Из этого канала
- #3687Helix - локальный AI на роботе Из-за этой модели Figure разорвала сделку с…
Helix - локальный AI на роботе Из-за этой модели Figure разорвала сделку с OpenAI, заявив что им удалось совершить прорыв.
- #3688"Grok 3 (пока что) бесплатен xAI открыли доступ всем желающим, ""пока сервера…
"Grok 3 (пока что) бесплатен xAI открыли доступ всем желающим, ""пока сервера не расплавятся"".
- #3690Neo Gamma от 1X Новый прототип куда шустрее августовской Beta. Интересно, когда…
Neo Gamma от 1X Новый прототип куда шустрее августовской Beta. Интересно, когда они уйдут в продажу? @ainewz
- #3684Grok 3 вышел Модель уже доступна подписчикам X Premium+ (цена подписки на…
Grok 3 вышел Модель уже доступна подписчикам X Premium+ (цена подписки на радостях подскочила почти в два раза, но я то-брал еще год назад;)).
- #3683Кто не знает, я живу в Швейцарии, и у нас тут неплохие новости ☕️ (кроме…
Кто не знает, я живу в Швейцарии, и у нас тут неплохие новости ☕️ (кроме открытия офисов ТикТока и OpenAI) – пару дней назад Швейцария решила не принимать…