NVIDIA готовит новые GPU для Китая Судя по утечкам, речь идёт о GPU с рабочим названием B40/6000D: та же архитектура Blackwell, но урезанное число SM и с меньшей пропускной способностью памяти в ≈1,7 ТБ/с — это как раз нижний порог, разрешённый Минторгом США для поставок в Китай. Это чуть ниже чем у 5090, и заметно меньше не только серверных B100/B200 (у тех по 8ТБ/с), но и H20, у которой 4ТБ/с. Серийное производство стартует уже в следующем месяце. Главные компромиссы: вместо HBM3e ставят обычную GDDR7 с 448-битной шиной, без дорогой и дефицитной CoWoS упаковки чипа на TSMC— чип можно паять на более простых платах. По цене новые карты выйдут по 6,5–8k$ против 10–12k$ у заблокированного H20, что позволит получить производительностью чуть ниже Hopper, но заметно выше оставшихся разрешённых чипов. Стратегия понятна: сохранить долю рынка, которая уже просела до ~50% из-за Huawei Ascend 910B и местных ASIC, и одновременно не нарушить экспортные правила. Второй, ещё более урезанный Blackwell (кодовое имя B25) запланирован к мас-продакшену к сентябрю, если первая партия пройдёт валидацию. При этом Nvidia признаёт, что совокупный убыток от санкций может дойти до 15B$ (из-за блокировки H20 уже пришлось списать инвентаря на 5 миллиардов), и новые специализированные линейки — их единственный быстрый способ остаться в китайских ИИ-центрах. @ai_newz
NVIDIA готовит новые GPU для Китая Судя по утечкам, речь идёт о GPU с рабочим…
Из этого канала
- #3930Стенфордский курс по внутреннему устройству LLM CS336, Language Modeling from…
Стенфордский курс по внутреннему устройству LLM CS336, Language Modeling from Scratch, показывает, как сделать полноценную LLM с нуля: от сбора и очистки…
- #3931В Telegram интегрируют Grok Ещё марте подписчикам Telegram Premium дали доступ…
В Telegram интегрируют Grok Ещё марте подписчикам Telegram Premium дали доступ к Grok через бота, похоже партнёрство решили расширить, а расширенный функционал…
- #3932Сейчас в универах большой спрос на экспертов в машинном обучении, ведь ИИ…
Сейчас в универах большой спрос на экспертов в машинном обучении, ведь ИИ развивается как сумасшедший.
- #3928Нейродайджест за неделю (#70) Юбилейный и неделя Google Google I/O - Дайджест…
Нейродайджест за неделю (#70) Юбилейный и неделя Google Google I/O - Дайджест по презентации — собрал все фишки с пояснениями, что как работает.
- #3927"Parallel Scaling Law Обычно LLM масштабируют либо через параметры (Dense,…
"Parallel Scaling Law Обычно LLM масштабируют либо через параметры (Dense, MoE), либо через время инференса (CoT).