Стенфордский курс по внутреннему устройству LLM CS336, Language Modeling from Scratch, показывает, как сделать полноценную LLM с нуля: от сбора и очистки датасета до тренировки, профайлинга и развёртывания модели. Все конспекты, ноутбуки и код сразу публикуют в открытой репе, так что можно повторять эксперименты дома хоть на одной-двух карточках или в колабе. Курс сделан с большим упором на практику — в качестве пяти домашних заданий предлагают имплементировать сначала чистый Transformer с нуля, затем кастомный FlashAttention 2 на Triton, распределённую тренировку, разобраться со scaling laws, фильтрацей датасета и применением RL в LLM. Требования — уверенный Python и PyTorch. Лекции на ютубе Материалы к лекциям Сайт курса @ai_newz
Стенфордский курс по внутреннему устройству LLM CS336, Language Modeling from…
Из этого канала
- #3931В Telegram интегрируют Grok Ещё марте подписчикам Telegram Premium дали доступ…
В Telegram интегрируют Grok Ещё марте подписчикам Telegram Premium дали доступ к Grok через бота, похоже партнёрство решили расширить, а расширенный функционал…
- #3932Сейчас в универах большой спрос на экспертов в машинном обучении, ведь ИИ…
Сейчас в универах большой спрос на экспертов в машинном обучении, ведь ИИ развивается как сумасшедший.
- #3933DeepSeek R1 обновили По традиции 🐳 выложили веса без деталей, они появятся…
DeepSeek R1 обновили По традиции 🐳 выложили веса без деталей, они появятся позже. Модель уже доступна в чате, API пока не обновили.
- #3929NVIDIA готовит новые GPU для Китая Судя по утечкам, речь идёт о GPU с рабочим…
NVIDIA готовит новые GPU для Китая Судя по утечкам, речь идёт о GPU с рабочим названием B40/6000D: та же архитектура Blackwell, но урезанное число SM и с…
- #3928Нейродайджест за неделю (#70) Юбилейный и неделя Google Google I/O - Дайджест…
Нейродайджест за неделю (#70) Юбилейный и неделя Google Google I/O - Дайджест по презентации — собрал все фишки с пояснениями, что как работает.