Новый день – новые модели: Nvidia выпустили прекрасную Nemotron 3 Nano В ней 31.6B параметров, но активных всего 3.6B (это MoE). Запустить можно на 24ГБ RAM. Зафайнтюнить – на 60ГБ VRAM. Контекст – 1 миллион токенов. По метрикам, внимание, обходит Qwen3-30В-А3В-Thinking и GPT-oss-20B-А4В. Получается, модель не просто конкурентоспособная, но и лучшая в своем классе на многих основных бенчмарках: SWE-bench, GPQA и др. И еще – моделька очень шустрая, выдает больше 350 токенов в секунду. Это в 2-3 раза быстрее того же Qwen. Nvidia умеют удивлять. Веса (+датасеты!) | Статья | Блогпост P.S. Любителям опенсорса напоминаем, что сегодня также ждем новенькую Gemma-3