nanoGPT от Андрея Карпаты стала первой в мире LLM, обученной и запущенной в космосе Мы уже несколько раз рассказывали вам о стартапе Starcloud. Они занимаются строительством космо-датацентров и к 2030 году планируют вынести на орбиту аж 5 гигаватт железа. В начале ноября они запустили в космос первую в истории видеокарту H100 – на спутнике размером с холодильник. Сначала сообщалось, что на ней планируется тюнить Gemma, но сегодня Starcloud рассказали, что вместо этого обучили целую модель с нуля! Они взяли nano-GPT – минималистичную реализацию GPT на PyTorch от Андрея Карпаты, – обучили ее на полном собрании сочинений Шекспира и успешно запустили инференс! Gemma, кстати, тоже запускали, но только предзагруженную.
nanoGPT от Андрея Карпаты стала первой в мире LLM, обученной и запущенной в…
Из этого канала
- #8474Тем временем новую Gemini 3 Flash заметили в Cursor Ждем релиз сегодня?
Тем временем новую Gemini 3 Flash заметили в Cursor Ждем релиз сегодня?
- #8475SpaceX готовится к IPO: теперь основная цель компании – строительство…
SpaceX готовится к IPO: теперь основная цель компании – строительство датацентров в космосе.
- #8477⚡️ Яндекс выложил в открытый доступ техрепорт собственного семейства моделей…
⚡️ Яндекс выложил в открытый доступ техрепорт собственного семейства моделей Alice AI.
- #8471Уже пару дней все говорят о том, что на этой неделе нас ждут сразу две новые…
Уже пару дней все говорят о том, что на этой неделе нас ждут сразу две новые модели Первая – GPT-5.2.
- #8470В Пентагоне появится подразделение для подготовки к AGI Создание так…
В Пентагоне появится подразделение для подготовки к AGI Создание так называемого «Руководящего комитета по будущему искусственного интеллекта» утверждено в…